文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充

Posted RaZLeon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充相关的知识,希望对你有一定的参考价值。

在这里插入图片描述
[ 文献阅读·DL ] GLaRAc: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition

推荐理由:本文收录于EACL2021,文章提出了一种基于图的标注规则增强框架,该框架可以从未标注的数据中自动学习新的标注规则。

原文标题:GLaRA: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition[1]

1.摘要&简介

  • 人工标记是一件昂贵且费力不讨好的事情,所以Named Entity Recognition(NER,命名实体识别)系统应运而生。
  • 不过当下NER算法也面临很多挑战,首先大部分NER算法都需要大量的人工加工,并且还要相关领域的专业知识作支撑。
  • GLaRA是一套规则扩充框架,可以从未标记的数据中学习心得标记规则。
  • 近年来,通过启发规则创建弱标签的方法逐渐流行,其也被称作为“标记规则”,虽然这套规则不要求人工标记,但为特定领域写“标记规则”也是个很麻烦的事情。
  • 它需要规则制定者对所要研究并标记的领域有深刻的见解才行。
  • 由此,本文提出GLaRA
  • 第一步:本文的做法首先创建一个图,图中节点代表着从未标记数据中所抽取出来的候选规则。
  • 第二步:通过搜索规则之间语义上的关系,设计一个新的图神经网络用来扩充标记规则。
  • 最终步:将扩充之后的规则应用到未标记的数据上,并产生弱标签。用这些弱标签训练一个NER模型。
  • 本文通过三个NER数据集评估GLaRAc的效果,平均评分提高20%
  • 我们可以根据已有的规则以及语义关系来发现潜在的新的规则。
  • 下图展示了GLaRA的基本流程:
    在这里插入图片描述

2.GLaRA本体

  • 大段文字描述就略过了,配合图2,看一眼大致知道其行文逻辑,以下仅对关键的图传播模型(Graph Propagation Model)进行拆解:
  • 语义相近的规则在预测实体标签的时候,结果也应当较为相似。
  • 对于节点 i i i,令给定输入Embedding为 h i h_i hi,且其近邻为 N i \\mathcal{N}_{i} Ni,首先计算连接对 ( i , j ) (i,j) (i,j)的注意力权重,公式如下:
    α i j = exp ⁡ ( f ( A T [ W h i , W h j ] ) ) ) ∑ k ∈ N i exp ⁡ ( f ( A T [ W h i , W h k ] ) ) (1) \\alpha_{i j}=\\frac{\\left.\\exp \\left(f\\left(A^{T}\\left[W h_{i}, W h_{j}\\right]\\right)\\right)\\right)}{\\sum_{k \\in N_{i}} \\exp \\left(f\\left(A^{T}\\left[W h_{i}, W h_{k}\\right]\\right)\\right)}\\tag{1} αij=kNiexp(f(AT[Whi,Whk]))exp(f(AT[Whi,Whj])))(1)
  • 然后重新计算 i i i的Embedding:
    h i ∗ = α i , i W h i + ∑ j ∈ N i W h j (2) h_{i}^{*}=\\alpha_{i, i} W h_{i}+\\sum_{j \\in N_{i}} W h_{j}\\tag{2} hi=αi,iWhi+jNiWhj(2)
  • 为保证模型稳定,多头注意力机制被引入,并且对每个节点保有 K K K个注意力状态,则GLaRA的目标函数如下:
    L total  = L sup  + L r e g + L dist  (3) \\mathcal{L}_{\\text {total }}=\\mathcal{L}_{\\text {sup }}+\\mathcal{L}_{r e g}+\\mathcal{L}_{\\text {dist }}\\tag{3} Ltotal =Lsup +Lreg+Ldist (3)
    其中:
    L sup  = − ( y i log ⁡ ( p i ) ) + ( 1 − y i ) log ⁡ ( 1 − p i ) L reg  = ∑ i , j ∈ N i ∥ h i − h j ∥ 2 L dist  = dist ⁡ ( h pos  , h neg  ) \\begin{array}{l} \\mathcal{L}_{\\text {sup }}=-\\left(y_{i} \\log \\left(p_{i}\\right)\\right)+\\left(1-y_{i}\\right) \\log \\left(1-p_{i}\\right) \\\\ \\mathcal{L}_{\\text {reg }}=\\sum_{i, j \\in N_{i}}\\left\\|h_{i}-h_{j}\\right\\|_{2} \\\\ \\mathcal{L}_{\\text {dist }}=\\operatorname{dist}\\left(h_{\\text {pos }}, h_{\\text {neg }}\\right) \\end{array} Lsup =(yilog(pi))+(1yi)log(1pi)Lreg =i,jNihihj2Ldist =dist(hpos ,hneg )

3.实验&结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

小结

  • 最近一两年图神经网络大火,为标记工作提出一个图神经网络的解决方案,还是很Nice的。
  • 论文作者提供源码,有爱者,自取之:https://github.com/zhaoxy92/GLaRA

参考文献

[1] Zhao X, Ding H, Feng Z. GLaRA: Graph-based Labeling Rule Augmentation for Weakly Supervised Named Entity Recognition[J]. arXiv preprint arXiv:2104.06230, 2021.

以上是关于文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充的主要内容,如果未能解决你的问题,请参考以下文章

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

命名实体识别的阅读记录

文献阅读18期:Learning Convolutional Neural Networks for Graphs

文献阅读18期:Learning Convolutional Neural Networks for Graphs