什么是词向量?word2vecGloveFastText分别是什么?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是词向量?word2vecGloveFastText分别是什么?相关的知识,希望对你有一定的参考价值。

什么是词向量?word2vec、Glove、FastText分别是什么?

 

在任何一种基于深度学习的自然语言处理系统中,词嵌入和句子嵌入已成为重要组成部分。它们使用固定长度的稠密向量对词和句子进行编码,从而大幅提升通过神经网络处理文本数据的能力。最常用的模型是word2vecGloVe,它们都是基于分布假设( distributional hypothesis)的无监督方法(出现在相似语境中的词往往具有相似的含义)。FastText对原始word2vec向量的主要改进是包含基于字符的n-gram模型,它允许计算没有出现在训练数据中的单词表示("out-of-vocabulary"

以上是关于什么是词向量?word2vecGloveFastText分别是什么?的主要内容,如果未能解决你的问题,请参考以下文章

字向量和词向量区别

什么是词云?

自然语言处理(NLP)基于CBOW实现Word2Vec

文本分类

Word2Vec

Embedding层和word2vec的区别