论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)

Posted 及时行樂_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)相关的知识,希望对你有一定的参考价值。

贴一下汇总贴:论文阅读记录

论文链接:《Latent Retrieval for Weakly Supervised Open Domain Question Answering》

一、摘要

关于开放域问答(QA)的最新工作假设对支持证据的严格监督和/或假设使用黑匣子信息检索(IR)系统来检索候选证据。我们认为两者都不是最优的,因为并非总是有黄金证据,而且质量保证与IR根本不同。我们首次展示了可以从问题答案字符串对中共同学习检索者和阅读者,而无需任何IR系统的情况。在这种情况下,将从所有Wikipedia检索的证据视为潜在变量。由于从头开始学习是不切实际的,因此我们使用反隐式任务对检索器进行了预训练。我们评估了五个质量检查数据集的开放版本。在提问者已经知道答案的数据集上,使用传统的IR系统(例如BM25)就足够了。

二、结论

我们提出了ORQA,这是第一个开放领域的问题回答系统,在这个系统中,检索者和读者只使用问答对进行端到端的联合学习,而没有任何IR系统。这可以通过使用反完形填空任务对检索者进行预训练来实现。实验表明,当问题反映信息需求时,即问题作者还不知道答案时,学习检索是至关重要的。

三、model

ORQA的模型概述:检索器和阅读器组件是共同学习的,我们称之为开放检索问答(ORQA)模型。ORQA的一个重要方面是它的可表达性——它能够在开放的语料库中检索任何文本,而不是局限于黑盒红外系统返回的封闭集。

使用弱监督会产生虚假歧义:

以上是关于论文泛读63弱监督的开放域问答中的潜在检索(ORQA-开放检索问答)的主要内容,如果未能解决你的问题,请参考以下文章

论文泛读64开放域问答的密集通道检索

论文泛读65面向开放域问题回答的神经猎犬的端到端培训

论文泛读67渐进式预训练密集语料库索引用于开放域问答

论文泛读66利用开放式问题解答的生成模型来利用通道检索

论文泛读153Coarse-to-Careful:为开放域常识问答寻求语义相关知识

论文泛读68使用多跳密集检索来回答复杂的开放域问题