深度学习文本分类模型

Posted 2020-10-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深度学习文本分类模型相关的知识，希望对你有一定的参考价值。

Convolutional Neural Networks for Sentence Classification

文本的表示通过词向量的表示方式，把文本数据从高纬度高稀疏的神经网络难处理的方式，变成了类似图像、语音的的连续稠密数据。深度学习算法本身有很强的数据迁移性，很多之前在图像领域很适用的深度学习算法比如CNN等也可以很好的迁移到文本领域了。

CNN原理就不讲了，核心点在于可以捕捉局部相关性，具体到文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。

CNN本质是做文本的特征表达工作，而自然语言处理中更常用的是递归神经网络（RNN, Recurrent Neural Network），能够更好的表达上下文信息。具体在文本分类任务中，Bi-directional RNN（实际使用的是双向LSTM）从某种意义上可以理解为可以捕获变长且双向的的 "n-gram" 信息。

以上是关于深度学习文本分类模型的主要内容，如果未能解决你的问题，请参考以下文章

Keras深度学习实战——新闻文本分类

R使用LSTM模型构建深度学习文本分类模型（Quora Insincere Questions Classification）

NLP——天池新闻文本分类 Task4：fasttext深度学习

深度学习前沿应用文本分类Fine-Tunning

猿创征文丨深度学习基于双向LSTM模型完成文本分类任务

Heroku：部署深度学习模型