文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充

Posted RaZLeon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充相关的知识,希望对你有一定的参考价值。


[ 文献阅读·DL ] GLaRAc: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition

推荐理由:本文收录于EACL2021,文章提出了一种基于图的标注规则增强框架,该框架可以从未标注的数据中自动学习新的标注规则。

原文标题:GLaRA: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition[1]

1.摘要&简介

  • 人工标记是一件昂贵且费力不讨好的事情,所以Named Entity Recognition(NER,命名实体识别)系统应运而生。
  • 不过当下NER算法也面临很多挑战,首先大部分NER算法都需要大量的人工加工,并且还要相关领域的专业知识作支撑。
  • GLaRA是一套规则扩充框架,可以从未标记的数据中学习心得标记规则。
  • 近年来,通过启发规则创建弱标签的方法逐渐流行,其也被称作为“标记规则”,虽然这套规则不要求人工标记,但为特定领域写“标记规则”也是个很麻烦的事情。
  • 它需要规则制定者对所要研究并标记的领域有深刻的见解才行。
  • 由此,本文提出GLaRA
  • 第一步:本文的做法首先创建一个图,图中节点代表着从未标记数据中所抽取出来的候选规则。
  • 第二步:通过搜索规则之间语义上的关系,设计一个新的图神经网络用来扩充标记规则。
  • 最终步:将扩充之后的规则应用到未标记的数据上,并产生弱标签。用这些弱标签训练一个NER模型。
  • 本文通过三个NER数据集评估GLaRAc的效果,平均评分提高20%
  • 我们可以根据已有的规则以及语义关系来发现潜在的新的规则。
  • 下图展示了GLaRA的基本流程:

2.GLaRA本体

  • 大段文字描述就略过了,配合图2,看一眼大致知道其行文逻辑,以下仅对关键的图传播模型(Graph Propagation Model)进行拆解:
  • 语义相近的规则在预测实体标签的时候,结果也应当较为相似。
  • 对于节点 i i i,令给定输入Embedding为 h i h_i hi,且其近邻为 N i \\mathcalN_i Ni,首先计算连接对 ( i , j ) (i,j) (i,j)的注意力权重,公式如下:
    α i j = exp ⁡ ( f ( A T [ W h i , W h j ] ) ) ) ∑ k ∈ N i exp ⁡ ( f ( A T [ W h i , W h k ] ) ) (1) \\alpha_i j=\\frac\\left.\\exp \\left(f\\left(A^T\\left[W h_i, W h_j\\right]\\right)\\right)\\right)\\sum_k \\in N_i \\exp \\left(f\\left(A^T\\left[W h_i, W h_k\\right]\\right)\\right)\\tag1 αij=kNiexp(f(AT[Whi,Whk]))exp(f(AT[Whi,Whj])))(1)
  • 然后重新计算 i i i的Embedding:
    h i ∗ = α i , i W h i + ∑ j ∈ N i W h j (2) h_i^*=\\alpha_i, i W h_i+\\sum_j \\in N_i W h_j\\tag2 hi=αi,iWhi+jNiWhj(2)
  • 为保证模型稳定,多头注意力机制被引入,并且对每个节点保有 K K K个注意力状态,则GLaRA的目标函数如下:
    L total  = L sup  + L r e g + L dist  (3) \\mathcalL_\\text total =\\mathcalL_\\text sup +\\mathcalL_r e g+\\mathcalL_\\text dist \\tag3 Ltotal =Lsup +Lreg+Ldist (3)
    其中:
    L sup  = − ( y i log ⁡ ( p i ) ) + ( 1 − y i ) log ⁡ ( 1 − p i ) L reg  = ∑ i , j ∈ N i ∥ h i − h j ∥ 2 L dist  = dist ⁡ ( h pos  , h neg  ) \\beginarrayl \\mathcalL_\\text sup =-\\left(y_i \\log \\left(p_i\\right)\\right)+\\left(1-y_i\\right) \\log \\left(1-p_i\\right) \\\\ \\mathcalL_\\text reg =\\sum_i, j \\in N_i\\left\\|h_i-h_j\\right\\|_2 \\\\ \\mathcalL_\\text dist =\\operatornamedist\\left(h_\\text pos , h_\\text neg \\right) \\endarray Lsup =(yilog(pi))+(1yi)log(1pi)Lreg =i,jNihihj2Ldist =dist(hpos ,hneg )

3.实验&结果






小结

  • 最近一两年图神经网络大火,为标记工作提出一个图神经网络的解决方案,还是很Nice的。
  • 论文作者提供源码,有爱者,自取之:https://github.com/zhaoxy92/GLaRA

参考文献

[1] Zhao X, Ding H, Feng Z. GLaRA: Graph-based Labeling Rule Augmentation for Weakly Supervised Named Entity Recognition[J]. arXiv preprint arXiv:2104.06230, 2021.

以上是关于文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充的主要内容,如果未能解决你的问题,请参考以下文章

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

命名实体识别的阅读记录

文献阅读18期:Learning Convolutional Neural Networks for Graphs

文献阅读18期:Learning Convolutional Neural Networks for Graphs