在自然语言处理中使用图进行文本分类

Posted

技术标签:

【中文标题】在自然语言处理中使用图进行文本分类【英文标题】:text classification using graphs in natural language processing 【发布时间】:2020-10-09 13:35:24 【问题描述】:

我尝试搜索,但找不到有关此主题的有用信息。这就是为什么我在这里问它...

我知道有多种方法可以对文本进行分类(例如逻辑回归等),而且我们还有神经网络。

但是,我想知道是否可以使用图论“将文本分类为多个类”? 如果是,我应该如何进行?请指导我。

例子:

我喜欢牛仔裤p-pos

我喜欢丰田-pos

我是马马虎虎的地方-中性

我讨厌那次旅行-neg

我喜欢那件衬衫-pos

那个地方太可怕了-neg

我喜欢食物,但服务很差 - 中性

【问题讨论】:

【参考方案1】:

假设每个文档是一个节点,每个单词也是一个节点。文档比文字有优势。

现在,有些文档有标签,有些没有。

您可以使用图卷积网络 (GCN) 对未标记的文档进行分类。

查看已实现不同版本的图卷积网络的 Python Geometric 包。以 Python Geometric 接受的方式创建输入,然后就完成了。

【讨论】:

谢谢你,我会使用它,如果我成功了会告诉你。

以上是关于在自然语言处理中使用图进行文本分类的主要内容,如果未能解决你的问题,请参考以下文章

《自然语言处理实战入门》文本分类 ---- 使用TextRNN 进行文本分类

自然语言处理 - 文本分类功能

自然语言处理——将文本特征转换为特征向量

自然语言处理中的文本分类

图神经网络的应用

《自然语言处理实战入门》深度学习 ---- 预训练模型的使用(ALBERT 进行多标签文本分类与微调 fine tune)