社交媒体情感分类数据集

Posted

技术标签:

【中文标题】社交媒体情感分类数据集【英文标题】:Dataset for emotion classification on social media 【发布时间】:2012-10-29 17:54:54 【问题描述】:

我想对文本进行情感分类(来自社交媒体的帖子,例如推文、Facebook 墙贴、youtube cmets 等......)。虽然我找不到带有注释数据的好的数据集。我正在寻找的不仅仅是带有正面和负面注释的数据。我正在寻找具有多种情绪的数据集。这可以是离散值(ekman 6 基本情绪)或连续值(唤醒效价模型)。有谁知道我在哪里可以得到这样的数据集,这可以来自 twitter、Facebook、Myspace ......只要它来自社交网络

【问题讨论】:

【参考方案1】:

嗯,我认为更好的名称(或者,更常用的)是情感分析(情感分类)——对吗?我不确定社交媒体是否确实提供了他们的私人数据(也许是其中的一部分)。不管怎样,我找到了这篇论文:

http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf

他们正在处理数据:来自https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts.movies.reviews 的http://www.cs.cornell.edu/people/pabo/movie-review-data/。

它适合你吗?基本上,找到合适的数据通常是 ML 中的一个大问题。通常需要自己构建(我的意思是手动对其中的一部分进行分类,然后应用一些聚类或半监督学习)

如果您在网络上找不到任何合适的内容,我会尝试联系一些撰写与您的研究类似的文章的作者。也许他们已经创建了适合您的数据集......

【讨论】:

情绪分析通常是确定文本是正面还是负面,这与我正在寻找的内容不同。虽然我通过联系作者找到了我想要的东西。 @Ojtwist:你写道:“我正在寻找一个有多种情绪的数据集。”我认为它仍然是分类(甚至一个示例有多个标签) 你能把教授给你的数据集给我吗?因为我需要它。

以上是关于社交媒体情感分类数据集的主要内容,如果未能解决你的问题,请参考以下文章

自然语言处理(NLP)基于GRU实现情感分类

使用机器学习的情感分析分类器

自然语言处理(NLP)基于循环神经网络实现情感分类

PT之Transformer:基于PyTorch框架利用Transformer算法针对IMDB数据集实现情感分类的应用案例代码解析

MXNet中使用双向循环神经网络BiRNN对文本进行情感分类

论文泛读125使用基于进化分类的 LSTM 模型对 Covid-19 推文进行情感分析