情感分析语料资源(免费)

Posted Flippedkiki

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了情感分析语料资源(免费)相关的知识,希望对你有一定的参考价值。

1.知网的情感词典
http://www.keenage.com/html/c_bulletin_2007.htm
由知网发布的词典,包括中文情感词典和英文情感词典

 

 

2.台湾大学的情感极性词典
http://www.datatang.com/data/11837
包括2810个正极性词语和8276个负极性词语准确度很高



3.酒店评论语料
http://www.datatang.com/data/11936 
谭松波整理的一个较大规模的酒店评论语料
语料规模为10000篇语料从携程网上自动采集,并经过整理而成

 

 

4.豆瓣网影评情感测试语料
http://www.datatang.com/data/13539 
来自豆瓣网对电影ICE AGE3的评论,评分标准均按照5 stars评分在网页中有标注语料至527页每页20条短评共计11323条评论

 

 

5.酒店电脑与书籍的评论语料
http://www.datatang.com/data/11937
数据量不太大,也有一些重复的数据

 

 

6.评论网页数据集
http://www.datatang.com/data/12044
数据量不小,包括的电影和评论都不少

 

 

7. 康奈尔大学(Cornell)提供的影评数据集(http://www.cs.cornell.edu/people/pabo/movie-review-data/):由电影评论组成,其中持肯定和否定态度的各1,000 篇;另外还有标注了褒贬极性的句子各5,331 句,标注了主客观标签的句子各5,000 句.目前影评库被广泛应用于各种粒度的,如词语句子和篇章级情感分析研究中.

 

 

8. GI(General Inquirer)评价词词典(英文,http://www.wjh.harvard.edu/~inquirer/).该词典收集了1,914 个褒义词和2,293 个贬义词,并为每个词语按照极性,强度,词性等打上不同的标签,便于情感分析任务中的灵活应用.


9. 主观词词典(英文,http://www.cs.pitt.edu/mpqa/).该词典的主观词语来自OpinionFinder 系统,该词典含有8,221 个主观词,并为每个词语标注了词性,词性还原以及情感极性.



10. HowNet 评价词词典(简体中文英文,http://www.keenage.com/html/e_index.html).该词典包含9,193 个中文评价词语/短语, 9,142 个英文评价词语/短语,并被分为褒贬两类.其中,该词典提供了评价短语,为情感分析提供了更丰富的情感资源.

以上是关于情感分析语料资源(免费)的主要内容,如果未能解决你的问题,请参考以下文章

Python 基于机器学习的微博情感分析与研究

实训项目:基于TextCNN汽车行业评论文本的情感分析

中文情感分析 glove+LSTM

论文泛读156使用情感分析方法从社交媒体文本语料库中识别消极因素

NLP文本情感分析

Bilstm中文微博多情感分析