论文写作分析之三《基于预训练语言模型的案件要素识别方法》

Posted 征途黯然.

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文写作分析之三《基于预训练语言模型的案件要素识别方法》相关的知识,希望对你有一定的参考价值。

[1] 参考论文信息

  论文名称:《基于预训练语言模型的案件要素识别方法》

  发布期刊:《中文信息学报》

  期刊信息:CSCD

  论文写作分析摘要:本文非常典型。首先网络模型是直接用的一篇英论的;亮点仍然在于应用领域的新颖,即案件;其次本文的题目起得不错,要素识别(而不是多标签文本分类);论文的实验部分个人觉得写的非常好,三组对比实验,看起来很充实。

【注】:看完这篇论文,感觉我和论文之间就差一个新颖的领域(数据集)。

[2] 参考论文分解

  这篇论文前大部分都比较普通吧。下面是模型图:

  模型几乎是直接使用的《SGM: Sequence Generation Model for Multi-Label Classification》中的模型。

  比较好的是,论文开头,对新领域“案件”的要素识别介绍的挺好的。

【注】:论文 SGM: Sequence Generation Model for Multi-Label Classification 讲解博客地址

  实验部分,论文做了3组实验:

  1、论文模型与其他baseline的实验对比。
  2、生成式模型与阈值式模型的实验对比。
  3、Layer-attentive策略的作用 。

  我觉得最好的是论文对阈值式模型使用方法的介绍:


  提出类别阈值选择方法。而我之前一直是设一个阈值 a l p h a alpha alpha,模型的输出经过sigmoid之后,只要大于 a l p h a alpha alpha,就算文本有这个标签,这样肯定不对,但是一直没看到好的方法。

以上是关于论文写作分析之三《基于预训练语言模型的案件要素识别方法》的主要内容,如果未能解决你的问题,请参考以下文章

论文泛读146基于预训练语言模型的基于知识的对话系统

2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别1 初赛Rank12的总结与分析

2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别1 初赛Rank12的总结与分析

最新论文解读 | 基于预训练自然语言生成的文本摘要方法

论文泛读200通过适配器使用预训练语言模型进行稳健的迁移学习

论文泛读200通过适配器使用预训练语言模型进行稳健的迁移学习