词移距离 Word Mover‘s Distance

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了词移距离 Word Mover‘s Distance相关的知识,希望对你有一定的参考价值。

词移距离 Word Mover\'s Distance

See the source image

假如现在有一个任务,是判断两段文本之间的相似性,那我们应该怎么做呢?一个很自然的想法是用word2vec对两段文本的词向量化,然后再利用欧氏距离或者余弦相似性进行求解。不过这种方法有着致命的缺陷,即无法从文档整体上来考虑相似性,仅仅是基于词,这就造成了很大的信息缺失问题,下面要介绍的这种方法可以从文档整体上来考虑两个文档之间的相似性,这种技术称为词移距离(WMD)。

本文提出了一个新的度量两个文档语义的distance,叫做Word Mover\'s Distance(WMD)。它主要基于两个点:(1)两个文档中的word都表示成word2vec;(2&

以上是关于词移距离 Word Mover‘s Distance的主要内容,如果未能解决你的问题,请参考以下文章

搬土距离(Earth Mover's Distance)

经典动态规划:编辑距离

javascript Mover Arquivo

php Mover javascript al footer

[转发]短文本匹配

K-NN 算法如何在 rapidminer 中以相同的距离工作?