论文泛读91走向新闻文章中目标依赖的情感分类
Posted 及时行樂_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读91走向新闻文章中目标依赖的情感分类相关的知识,希望对你有一定的参考价值。
贴一下汇总贴:论文阅读记录
论文链接:《Towards Target-dependent Sentiment Classification in News Articles》
一、摘要
有关目标依赖的情感分类(TSC)的广泛研究已在某些领域中表现出出色的分类性能,在这些领域中,作者倾向于明确表达对特定实体或主题的情感,例如在评论或社交媒体中。尽管新闻在个人和社会决策中是必不可少的信息来源,但我们仍在新闻报道中研究TSC,而新闻报道的研究领域却很少。本文介绍NewsTSC,这是一个手动注释的数据集,用于探索新闻文章上的TSC。调查新闻中的情感特征并将其与流行的TSC领域进行对比,我们发现新闻中的情感表达不太明确,更依赖于上下文和读者,并且需要更高的解释度。经过广泛的评估,我们发现TSC的最新状态在新闻文章上的表现要比其他领域差(NewsTSC的平均召回率AvgRec = 69.8,而已建立的TSC数据集的平均召回率AvgRev = [75.6,82.2])。原因包括目标和情感短语之间的关系解析不正确以及上下文无关。作为对先前新闻TSC的一项重大改进,我们发现BERT的自然语言理解能力可以捕获新闻文章中使用的不太明确的情绪。
二、结论
我们探讨了目标相关的情感分类如何应用于政治新闻文章。我们的主要贡献如下:首先,我们引入了NewsTSC,这是一个研究政治新闻文章中目标相关情感分类的数据集,由3000多个人工标注的句子组成。
其次,在定性分析中,我们发现作者对目标表达情感的方式与其他研究充分的技术支持中心领域有显著差异,如产品评论或社交媒体上的帖子。在这些领域,作者倾向于明确表达自己的观点。相比之下,在新闻文章中,我们发现隐含的或间接的情感表达占主导地位,例如,通过描述由给定目标执行的动作及其后果。因此,情感表达可能更加模糊,确定它们的极性需要更大程度的解释。
第三,在定量评估中,我们发现最先进的TSC方法在新闻领域的表现(使用我们的新闻改编BERT模型的平均召回率AvgRec = 69.8,不使用时AvgRec = 67.3)低于流行的TSC领域(AvgRec = [75.6,82.2])。
我们确定了新闻贸易与供应链未来的多个研究方向。虽然NewsTSC包含清晰的情感表达,但它缺乏现实世界新闻报道中出现的其他情感类型。比如表达感情比较含蓄或者模糊的句子。为了创建一个更好地反映真实世界新闻报道的带标签的TSC数据集,我们建议调整注释指令,以提高注释者对这些情感类型的认识,并清楚地定义它们应该如何被标记。从技术上来说,当考虑更广泛的上下文时,明显模糊的情感表达可能更容易标记,例如,不仅是当前的句子,还有以前的句子。考虑更多的上下文可能也有助于提高分类器的性能。
我们设想将TSC方法集成到一个识别倾斜新闻报道的系统中[18,33]。例如,给定一组报道同一主题的文章,系统可以识别类似地框定事件中所涉及的行为者的文章。为此,系统将分析每篇文章中经常提到的人的极性。然后,它会将类似描述这些人的文章分组。
三、model
目标相关情感分类(TSC)是情感分析的一个子任务,旨在识别文本对给定目标的情感,通常是在句子级别,如命名实体(NEs)或其他语义概念。
github地址:link
以上是关于论文泛读91走向新闻文章中目标依赖的情感分类的主要内容,如果未能解决你的问题,请参考以下文章
论文泛读198通过输入空间转换利用 BERT 进行多模态目标情感分类