论文泛读64开放域问答的密集通道检索
Posted 及时行樂_
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读64开放域问答的密集通道检索相关的知识,希望对你有一定的参考价值。
贴一下汇总贴:论文阅读记录
论文链接:《Dense Passage Retrieval for Open-Domain Question Answering》
一、摘要
开放域问答依赖于有效的段落检索来选择候选上下文,而传统的稀疏向量空间模型(例如TF-IDF或BM25)是事实上的方法。在这项工作中,我们表明检索实际上可以仅使用密集表示来实现,其中通过简单的双重编码器框架从少量问题和段落中学习嵌入。在广泛的开放域质量检查数据集上进行评估时,我们的密集检索器在排名前20的通道检索准确性方面绝对比强大的Lucene-BM25系统优越9%-19%的绝对值,并且可以帮助我们进行端到端质量检查系统建立了关于多个开放域质量检查基准的最新技术。
二、结论
在这项工作中,我们证明了在开放领域的问题回答中,密集检索可以优于并有可能取代传统的稀疏检索组件。虽然简单的双编码器方法可以令人惊讶地很好地工作,但我们表明,成功训练一个密集检索器有一些关键因素。此外,我们的经验分析和消融研究表明,更复杂的模型框架或相似性函数不一定提供额外的值。由于提高了检索性能,我们在多个开放领域问题回答基准上获得了最新的结果。
三、model
Dense Passage Retriever (DPR)-密集通道检索器:
我们在这项工作中的研究重点是改进开放领域质量保证中的检索组件。给定M个文本段落的集合,我们的密集段落检索器(DPR)的目标是在低维和连续的空间中索引所有段落,这样它可以在运行时为读者有效地检索与输入问题相关的前k个段落。
作者选用了五个数据集,实验结果如下:
以上是关于论文泛读64开放域问答的密集通道检索的主要内容,如果未能解决你的问题,请参考以下文章
论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)
论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)