Keras深度学习实战(24)——从零开始构建单词向量

Posted 盼小辉丶

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Keras深度学习实战(24)——从零开始构建单词向量相关的知识,希望对你有一定的参考价值。

Keras深度学习实战(24)——从零开始构建单词向量

0. 前言

在解决文本相关问题时,传统方法通常需要对单词进行独热编码。但是,如果数据集中具有数千个不同的单词,则生成的独热编码矢量将具有数千个维度,这会导致计算代价十分高昂。此外,在这种情况下,相似的单词并不具备相似的向量。因此,我们需要研究如何对文本数据进行编码,以使相似的数据具有相似的编码向量。

1. 单词向量

1.1 Word2Vec 原理

Word2Vec 是一种可以将相似单词编码为相似向量的方法。在了解 Word2Vec 原理之前,我们首先考虑以下问题,假设我们有以下输入句子

以上是关于Keras深度学习实战(24)——从零开始构建单词向量的主要内容,如果未能解决你的问题,请参考以下文章

Keras深度学习实战(26)——文档向量详解

Keras深度学习实战(26)——文档向量详解

Keras深度学习实战(27)——循环神经详解与实现

Keras深度学习实战(27)——循环神经详解与实现

Keras深度学习实战——使用Keras构建神经网络

Keras深度学习实战——使用GloVe模型构建单词向量