使用 LingPipe 进行分层情感分析

Posted

技术标签:

【中文标题】使用 LingPipe 进行分层情感分析【英文标题】:Doing a hierarchical sentiment analysis with LingPipe 【发布时间】:2011-11-21 18:50:18 【问题描述】:

这是在使用 LingPipe 机器学习工具进行情感分析的背景下。我必须对大段落中的句子是否具有正面/负面情绪进行分类。我知道 LingPipe 中的以下方法

    根据其极性(负极或正极)对整个段落进行分类。

    在这里,我还不知道句子级别的极性。我们仍处于段落级别。如何确定段落的句子级别的极性,段落中的句子是正句还是负句?我知道如果一个句子是主观/客观的,LingPipe 能够分类。所以使用这种方法,,,,

    ,,,, 我应该

    首先在大量主观/客观的句子上训练 LingPipe。

    使用经过训练的模型从测试段落中提取所有主观句子。 通过手动将它们标记为正/负,根据提取的主观句子的极性来训练 LingPipe 分类器。

    现在使用经过训练的极性模型,并输入一个测试主观句子(通过将句子通过经过训练的主观/客观模型来完成),然后确定该语句是正面还是负面?

    上述方法有效吗?在上面提出的方法中,我们知道 LingPipe 能够接受大量文本内容(段落)进行极性分类。如果我们只通过一个主观句子进行极性分类,它会做得很好吗?我很困惑!

【问题讨论】:

【参考方案1】:

您可能想看看文献中的多层次分析方法,例如

李,S.,等人。 (2010)。 “Exploiting Combined Multi-level Model for Document Sentiment Analysis”,2010 年模式识别国际会议。

Yessenalina, A. 等人。 (2010)。 “文档级情感分类的多级结构化模型”,2010 年自然语言处理经验方法会议论文集,第 1046-1056 页,麻省理工学院,美国马萨诸塞州,2010 年 10 月 9 日至 11 日。

多级分析方法在信息检索中非常常见,例如在向量空间相似性搜索的内容索引中。

Ling Pipe 等环境是一个很好的入门方法,但最终您需要使用 yura 建议的较低级别、更细粒度的工具。

【讨论】:

【参考方案2】:

包括 lingpipe 在内的大多数机器学习库都是基于行的(具有平面特征的对象)。所以如果你想用它做一些层次分类,你应该对你的数据进行去规范化。例如,您可以在同一特征集中具有段落和句子的特征。如果您只使用单词分类,您可以创建这样的特征 PARGRAPH_WORDX=true, SENTENCE_WORDX=true。 其他一些工具包允许您在没有非规范化的情况下表达您的模型,即所谓的图形模型示例是 CRF、ACRF、马尔可夫模型等您可以在 mallet 和 Factorie 中找到的实现。

【讨论】:

谢谢你。简而言之,你的意思是说,如果我在段落级别使用一个特征集,那么同样的特征集也可以在句子级别使用? 是的,您可以将段落和句子的特征组合在一个分类下的句子特征集中。有时它的作品。就像您想对树中的某个节点进行分类,因此还要添加其所有父节点的特征。

以上是关于使用 LingPipe 进行分层情感分析的主要内容,如果未能解决你的问题,请参考以下文章

用Python对用户的评论数据进行情感倾向分析

Perl 或 Java 情绪分析

用RNN & CNN进行情感分析 - PyTorch

使用Spark MLlib进行情感分析

使用 tensorflow 理解 LSTM 模型进行情感分析

Keras深度学习实战——使用长短时记忆网络构建情感分析模型