主题检测分类模型的推文数据集

Posted

技术标签:

【中文标题】主题检测分类模型的推文数据集【英文标题】:Tweets Data set for Topic Detection Classification Model 【发布时间】:2021-05-11 07:25:05 【问题描述】:

我正在尝试制作一个类似于 Twitter 中的新功能“主题”的模型。我怎么找不到可以使用的数据集,有人知道我如何获得这个数据集吗?

【问题讨论】:

重新阅读 What topics can I ask about here?,因为您似乎在第一次阅读时错过了一些关键点,即要求我们推荐的问题或查找与 SO 无关的书籍、工具、软件库、教程或其他场外资源 【参考方案1】:

您可以在 Google 上搜索这些数据。如果没有运气,请尝试使用 twitter RESTful API 通过 Python 访问 twitter 数据。你可以在网上找到一些代码。即使这对您不起作用,您也可以从 Twitter 导出自己的推文。如需更多帮助,请点击此链接 - https://help.twitter.com/en/managing-your-account/accessing-your-twitter-data 希望这会有所帮助。

【讨论】:

以上是关于主题检测分类模型的推文数据集的主要内容,如果未能解决你的问题,请参考以下文章

CNN模型在多类分类上过拟合

如果与健身相关,则对推文进行分类

NLP文本分类TorchText实战-AG_NEWS 新闻主题分类任务(PyTorch版)

社交媒体情感分类数据集

如何保持一个高度相关的变量在scikit-learn中淹没其余部分?

Latent Dirichlet Allocation 文本分类主题模型