论文泛读173MemSum:使用多步情景马尔可夫决策过程对长文档进行提取总结

Posted 及时行樂_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文泛读173MemSum:使用多步情景马尔可夫决策过程对长文档进行提取总结相关的知识,希望对你有一定的参考价值。

贴一下汇总贴:论文阅读记录

论文链接:《MemSum: Extractive Summarization of Long Documents using Multi-step Episodic Markov Decision Processes》

一、摘要

我们介绍了 MemSum(多步情景马尔可夫决策过程提取 SUMmarizer),这是一种基于强化学习的提取总结器,在任何给定的时间步长都富含有关当前提取历史的信息。与之前的模型类似,MemSum 迭代地将句子选择到摘要中。我们的创新在于在总结时考虑更广泛的信息集,人类在此任务中也可以直观地使用这些信息集:1) 句子的文本内容,2) 文档其余部分的全局文本上下文,以及 3) 提取history 由一组已经提取的句子组成。凭借轻量级架构,MemSum 在长文档数据集(PubMed、arXiv 和 GovReport)上获得了最先进的测试集性能(ROUGE 分数)。

二、结论

具有历史意识的多步马尔可夫决策过程可以有效地实现抽取式摘要。使用本地句子、全局上下文和提取历史的编码器,MemSum代理可以访问人类在总结文档时直观使用的信息。对提取历史的了解有助于MemSum生成紧凑的摘要,并在文档中表现出对冗余的鲁棒性。作为一个轻量级模型,MemSum在不同的长文档摘要任务上优于抽取基线和抽象基线。

三、model

模型的体系结构:

  • 局部句子编码器
  • 全局上下文编码器
  • 提取历史编码器

训练算法:

以上是关于论文泛读173MemSum:使用多步情景马尔可夫决策过程对长文档进行提取总结的主要内容,如果未能解决你的问题,请参考以下文章

论文泛读69利用束密集检索对非结构化文本进行多步推理

跟我读论文丨ACL2021 NER BERT化隐马尔可夫模型用于多源弱监督命名实体识别

使用隐马尔可夫模型的手部动作识别

马尔可夫链和有限状态机一样吗?

论文阅读|两人零和马尔可夫博弈的在线极大极小Q网络学习《Online Minimax Q Network Learning for TZMGs》

基于隐马尔可夫模型的网络安全态势预测方法