在自然语言处理中使用图进行文本分类
Posted
技术标签:
【中文标题】在自然语言处理中使用图进行文本分类【英文标题】:text classification using graphs in natural language processing 【发布时间】:2020-10-09 13:35:24 【问题描述】:我尝试搜索,但找不到有关此主题的有用信息。这就是为什么我在这里问它...
我知道有多种方法可以对文本进行分类(例如逻辑回归等),而且我们还有神经网络。
但是,我想知道是否可以使用图论“将文本分类为多个类”? 如果是,我应该如何进行?请指导我。
例子:
我喜欢牛仔裤p-pos
我喜欢丰田-pos
我是马马虎虎的地方-中性
我讨厌那次旅行-neg
我喜欢那件衬衫-pos
那个地方太可怕了-neg
我喜欢食物,但服务很差 - 中性
【问题讨论】:
【参考方案1】:假设每个文档是一个节点,每个单词也是一个节点。文档比文字有优势。
现在,有些文档有标签,有些没有。
您可以使用图卷积网络 (GCN) 对未标记的文档进行分类。
查看已实现不同版本的图卷积网络的 Python Geometric 包。以 Python Geometric 接受的方式创建输入,然后就完成了。
【讨论】:
谢谢你,我会使用它,如果我成功了会告诉你。以上是关于在自然语言处理中使用图进行文本分类的主要内容,如果未能解决你的问题,请参考以下文章
《自然语言处理实战入门》文本分类 ---- 使用TextRNN 进行文本分类
《自然语言处理实战入门》深度学习 ---- 预训练模型的使用(ALBERT 进行多标签文本分类与微调 fine tune)