论文泛读156使用情感分析方法从社交媒体文本语料库中识别消极因素
Posted 及时行樂_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读156使用情感分析方法从社交媒体文本语料库中识别消极因素相关的知识,希望对你有一定的参考价值。
贴一下汇总贴:论文阅读记录
论文链接:《Identifying negativity factors from social media text corpus using sentiment analysis method》
一、摘要
自动情感分析在决策中起着至关重要的作用。许多组织花费大量预算通过手动查看他们的反馈/评论或推文来了解他们的客户满意度。自动情绪分析可以提供针对任何事件、产品或活动收到的评论的总体情况。通常,评论/推文分为负面或正面两大类。但是,负面评论过于抽象,无法理解基本原因或上下文。组织有兴趣确定消极的确切原因。在这项研究中,我们按层次深入到负面评论,并将它们与更多类别联系起来。推文是从 Twitter 和 Facebook 等社交媒体网站中提取的。如果情感分析将任何推文归类为负面类,然后我们进一步尝试将负面评论与更多可能的负面类别相关联。根据专家意见,负面评论/推文进一步分为 8 类。评估了不同的机器学习算法并报告了它们的准确性。
二、结论
利用社交媒体分享你的感受现在非常普遍。人们在他们的社交媒体账户或群组上分享他们的快乐、悲伤、成就或不满。社交媒体上的不同趋势可以起到非常积极的作用,甚至有时会截然相反。在这项研究中,我们使用情感分析将推文分为积极和消极两类。后来,我们进一步把负类和次负类联系起来。根据专家的意见,负面等级被进一步分为8个等级,包括恐怖主义、政治、腐败、不公正、失败、犯罪、社会方面和经济方面。创建新的数据集并评估不同的机器学习模型,包括线性SVM(支持向量机)、朴素贝叶斯、逻辑回归、BOW(带Keras的词包)。最后,基于这些与类的负映射,巴基斯坦的地理位置被突出显示,在那里人们可以观察到巴基斯坦的哪个区域正面临什么样的问题。在未来的工作中,我们正在扩展我们的乌尔都语字体和罗马乌尔都语框架,这样我们就可以大规模地自动分析与消极相关的人们的意见。
三、Methodology
- 收集了推文,并且只针对巴基斯坦地区
- 使用了Flair API的最先进的情绪分析,提取了10000条推文,然后将推文分为正面或负面。
- 请了三位专家,把这2577条推文手工注释成8类。如果两个专家有相同的注释,则选择该类的最终标签。
- 将数据集分为两组,即训练组和测试组。测试集的比率设置为33%。
与其他方法相比,逻辑回归方法的性能稍好一些,SVM也非常接近,使用SVM二次或三次核可以提高精度。
以上是关于论文泛读156使用情感分析方法从社交媒体文本语料库中识别消极因素的主要内容,如果未能解决你的问题,请参考以下文章
论文泛读195PGCD:用于基于方面的情感分析的位置引导贡献分布单元
论文泛读195PGCD:用于基于方面的情感分析的位置引导贡献分布单元