整理了一下NLP中文数据集

Posted xuehuiping

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了整理了一下NLP中文数据集相关的知识,希望对你有一定的参考价值。

个人理解:

  • 句子相似性判断、情感分析、实体识别、智能问答,本质基本上都是分类任务。
  • 阅读理解(抽取式、回答式、完形填空)是逐个候选项的分类问题处理。

技术图片
技术图片

参考
https://github.com/chineseGLUE/chineseGLUE
https://github.com/CLUEbenchmark/CLUE
https://github.com/PaddlePaddle/ERNIE
http://dy.163.com/v2/article/detail/EAFKC4I205118HA4.html
https://github.com/ymcui/cmrc2018/blob/master/README_CN.md

以上是关于整理了一下NLP中文数据集的主要内容,如果未能解决你的问题,请参考以下文章

NLP的比赛和数据集

自然语言处理常见数据集论文最全整理分享

历史最全-16个推荐系统开放公共数据集整理分享

论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类

论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类

在 NLP 中训练数据集后如何预测标签