多标签文本分类Initializing neural networks for hierarchical multi-label text classification

Posted 征途黯然.

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了多标签文本分类Initializing neural networks for hierarchical multi-label text classification相关的知识,希望对你有一定的参考价值。

·阅读摘要:
  本文在《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》文章的基础上,提出了对具有层级结构的多标签进行多分类。
  [1] Initializing neural networks for hierarchical multi-label text classification

阅读前提

  在阅读本篇论文之前,务必阅读《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》,因为本篇论文是基础此篇论文的小小改进。

  《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》的阅读笔记请参考博客:https://blog.csdn.net/qq_43592352/article/details/122810687

论文核心内容

  1、提出在《Improved Neural Network-based Multi-label Classification
with Better Initialization Leveraging Label Co-occurrence》的模型,在应用于标签共现少的数据集时不适用。反而对具有层级结构的标签的数据集应用的更好。

  2、具有层级结构的标签:

  论文提出的理论是:当一个文本显式地具有某个标签(例如图中的深色的结点)时,那么这个文本一定得隐式地具有该标签的父标签(即图中深色结点一系列的浅色父结点)。

  “显式”表示在数据集中指定了这条文本的标签,“隐式”表示标签具有的父标签在数据集中这条文本上没有指定,但是标签有层级关系,它还是应当有的。

  3、对非标签共现模式的神经元采用:权重随机初始化或者权重零值初始化。

  4、后处理标签校正:

  论文提出,A中标签分配是错误的,一个文本具有z标签后,理应具有它的父标签y、z,但是A中没有,所以要修正。

  论文提出两种修正方法:传递修正(transitive correction)、撤回修正(retractive correction)。

  如图B,使用传递修正(transitive correction),把子类z的所有父级都设置为正标签,即x、y、z设为正标签。

  如图C,使用撤回修正(retractive correction),只把子类z的最终父级都设置为正标签,即x设为正标签。

以上是关于多标签文本分类Initializing neural networks for hierarchical multi-label text classification的主要内容,如果未能解决你的问题,请参考以下文章

BERT-多标签文本分类实战之一——实战项目总览

BERT-多标签文本分类实战之一——实战项目总览

多标签文本分类《基于标签语义注意力的多标签文本分类》

多标签文本分类《基于标签语义注意力的多标签文本分类》

多标签文本分类层次多标签文本分类方法

多标签文本分类层次多标签文本分类方法