哪种技术最适合使用 python 识别同一文本中的各种情绪?

Posted

技术标签:

【中文标题】哪种技术最适合使用 python 识别同一文本中的各种情绪?【英文标题】:Which technique is most appropriate for identifing various sentiments in the same text using python? 【发布时间】:2019-04-02 20:42:58 【问题描述】:

我正在学习 NLP,例如,我试图确定在线课程平台中客户反馈的感受。

我能够通过简单的一句话来识别学生的感受,例如“课程非常好,我从中学到了很多”,“教学平台很完整,我很喜欢使用它”,“我可以有更多与海洋生物学相关的课程”,等等。

我的疑问是如何正确识别一个句子或几个句子中的各种情绪。例如:

    每个句子的情绪:

    “课程非常好!在网站上创建一个问题部分可能会很酷。”

    每个句子不止一种情绪:

    “课程很好,但网站不行。”

    两者兼而有之:

    “课程很好,但教学平台很慢。课程中可以有更多的任务和示例,例如论坛上的视频或麦克风互动。”

我想过将文本拆分成句子,但对于示例 2 来说不是很好。

【问题讨论】:

欢迎来到 ***。请按照您创建此帐户时的建议阅读并遵循帮助文档中的发布指南。 On topic、how to ask 和 ... the perfect question 在此处申请。 *** 不是设计、编码、研究或教程资源。但是,如果您遵循您在网上找到的任何资源,进行诚实的编码尝试并遇到问题,那么您将有一个很好的示例可以发布。 首先,您可以根据标签(平台、课程、论坛等)分离数据,并在所有标签上训练不同的模型。 【参考方案1】:

您可以认为逗号、其他标点符号以及一些连词和介词实际上会拆分句子。这实际上超越了代码,进入了语言学领域,因为它们有时但并非总是将句子分开。

在第二种情况下,您实际上有两句话:“The course is very good”-,但是-“The site is not [very good]”。

我相信有 NPL 包可以拆分句子(可能是因为知道大多数句子都遵循主语/谓语/宾语结构,所以如果你缠绕多个动词,那么很可能你会找到相同数量的句子)和您可以先使用它们来解析您的文本。看看为您选择的语言执行此操作的库。

【讨论】:

【参考方案2】:

有一个专门用于多标签分类的库:

scikit-multilearn

当您训练模型时,您必须将类拆分为二进制列。

【讨论】:

以上是关于哪种技术最适合使用 python 识别同一文本中的各种情绪?的主要内容,如果未能解决你的问题,请参考以下文章

哪种方式最适合 Python 工厂注册?

命名实体识别算法

几种语言的==、===和is比较

哪种技术最适合类似聊天的应用程序

哪种形式的 unicode 规范化适合文本挖掘?

哪种生成 GUID 的方法最适合确保 GUID 真正唯一?