论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类

Posted 及时行樂_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类相关的知识,希望对你有一定的参考价值。

贴一下汇总贴:论文阅读记录

论文链接:《QA Dataset Explosion: A Taxonomy of NLP Resources for Question Answering and Reading Comprehension》

一、摘要

近年来,除了对 NLP 中的深度学习模型进行大量研究外,还对跟踪建模进度所需的基准数据集进行了大量工作。问答和阅读理解在这方面特别多产,在过去两年中出现了 80 多个新数据集。这项研究是迄今为止对该领域最大的调查。我们概述了当前资源的各种格式和领域,突出了未来工作的当前空白。我们进一步讨论了当前问答中“推理类型”的分类,并提出了新的分类法。我们还讨论了过度关注英语的影响,并调查了当前单语资源对其他语言和多语种资源的影响。

二、想法

很好的分析了一些近年来的数据集,感觉对选取合适的数据集进行实验很有帮助。

以上是关于论文泛读186QA 数据集爆炸:用于问答和阅读理解的 NLP 资源分类的主要内容,如果未能解决你的问题,请参考以下文章

论文泛读190基于子图搜索的在线问答系统

论文泛读190基于子图搜索的在线问答系统

论文泛读162问答系统中答案验证的联合模型

论文泛读67渐进式预训练密集语料库索引用于开放域问答

论文泛读131DocNLI:用于文档级自然语言推理的大规模数据集

论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)