GCN与文本分类Graph Convolutional Networks for Text Classification

Posted 2022-01-19 Facico

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了GCN与文本分类Graph Convolutional Networks for Text Classification相关的知识，希望对你有一定的参考价值。

TextGCN

Graph Convolutional Networks for Text Classification
https://github.com/yao8839836/text_gcn?utm_source=catalyzex.com
属于把GCN用在NLP上的开山之作，构造比较简单，效果也不错，不过使用的是最简单的“频域卷积网络”，所以速度比价慢

不知道作者有没有试过简易的多项式的GCN核或切比雪夫网络

构造图

边权

$A_i,j=\\left\\ \\beginaligned PMI(i,j)&& \\texti,j都是单词，PMI(i,j)>0\\\\ TF-IDF_i,j &&\\texti是文档，j是单词\\\\ 1&& i=j\\\\ 0&& otherwise \\endaligned\\right.$

对于一个单词对(i,j)的PMI值为
$PMI(i,j)=\\log \\fracp(i,j)p(i)p(j)\\\\ p(i,j)=\\fraclen(W(i,j))len(W)\\\\ p(i)=\\fraclen(W(i))len(W)\\\\$

PMI表示两个词的语义相似度

对TF-IDF

TF：词频
$tf_i,j=\\fracn_i,j\\sum_kn_k,j\\\\ n_i,j表示词i在文档j中出现次数\\\\ \\sum_kn_k,j是文档j中所有词出现次数之和 \\\\tf 表示某个文档中某次的词频\\\\$
IDF：反文档频率，包含word的文档数量的反比。若包含word的文档越少，IDF越大，说明词条有更好的类别区分能力
$idf_i=\\log \\frac|D|\\j:t_i\\in d_j\\\\\\ |D|文档总数\\\\ \\j:t_i\\in d_j\\：包含t_i的文档数目，反正分母为0通常+1$

$T F - I D F = T F * I D F$ ，值越大表示对文档越重要

GCN卷积核

$\\tilde A = D^-\\frac12AD^-\\frac12$

网络结构

作者构建了两层的GCN
$L^(1)=\\rho(\\tilde A X W_0)\\\\ 这里作者用的激活函数是ReLU\\\\ L^(j+1)=\\rho(\\tilde A L^(j) W_j)$
分类器
$Z=softmax(\\tilde A ReLU(\\tilde A XW_0)W_1)$
损失函数

以上是关于GCN与文本分类Graph Convolutional Networks for Text Classification的主要内容，如果未能解决你的问题，请参考以下文章