整理了一下NLP中文数据集
Posted xuehuiping
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了整理了一下NLP中文数据集相关的知识,希望对你有一定的参考价值。
个人理解:
- 句子相似性判断、情感分析、实体识别、智能问答,本质基本上都是分类任务。
- 阅读理解(抽取式、回答式、完形填空)是逐个候选项的分类问题处理。
参考
https://github.com/chineseGLUE/chineseGLUE
https://github.com/CLUEbenchmark/CLUE
https://github.com/PaddlePaddle/ERNIE
http://dy.163.com/v2/article/detail/EAFKC4I205118HA4.html
https://github.com/ymcui/cmrc2018/blob/master/README_CN.md
以上是关于整理了一下NLP中文数据集的主要内容,如果未能解决你的问题,请参考以下文章
论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类