深度学习文本分类模型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习文本分类模型相关的知识,希望对你有一定的参考价值。

参考:

 

文本的表示通过词向量的表示方式,把文本数据从高纬度高稀疏的神经网络难处理的方式,变成了类似图像、语音的的连续稠密数据。深度学习算法本身有很强的数据迁移性,很多之前在图像领域很适用的深度学习算法比如CNN等也可以很好的迁移到文本领域了。

CNN原理就不讲了,核心点在于可以捕捉局部相关性,具体到文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。

CNN本质是做文本的特征表达工作,而自然语言处理中更常用的是递归神经网络(RNN, Recurrent Neural Network),能够更好的表达上下文信息。具体在文本分类任务中,Bi-directional RNN(实际使用的是双向LSTM)从某种意义上可以理解为可以捕获变长且双向的的 "n-gram" 信息。

以上是关于深度学习文本分类模型的主要内容,如果未能解决你的问题,请参考以下文章

Keras深度学习实战——新闻文本分类

R使用LSTM模型构建深度学习文本分类模型(Quora Insincere Questions Classification)

NLP——天池新闻文本分类 Task4:fasttext深度学习

深度学习前沿应用文本分类Fine-Tunning

猿创征文丨深度学习基于双向LSTM模型完成文本分类任务

Heroku:部署深度学习模型