123

Posted 2020-08-03 奋斗中的菲比

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了123相关的知识，希望对你有一定的参考价值。

常用的语言模型都是在近似地求

4.1 词向量

1.one-hot-represatation

对一个词表顺序编号1苹果2水果3芒果4葡萄5香蕉

出现芒果则第三个位置对应1其他位置为0

00100

1.维数灾难，2.无法计算相似度

2. Distributed Representation

word2vec就是采用这种方法

将词映射成k维空间的向量

可以通过余弦，欧氏距离计算相似度

　就是字符串的概率

（1）上下文无关模型（Context=NULL

??(??_t|Context)= ??(????)=??(??_t)/ ??

相当于n=1

（2）n-gram 模型（Context= ????−n+1, ????−n+2,…,????−1）

n=2叫bigram

n-gram 模型的优点包含了前 N-1 个词所能提供的全部信息，只看 N-1 个词

以上是关于123的主要内容，如果未能解决你的问题，请参考以下文章