单词嵌入的语义加权平均值

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单词嵌入的语义加权平均值相关的知识,希望对你有一定的参考价值。

给定一个单词嵌入向量列表,我试图计算一个平均单词嵌入,其中一些单词比其他单词更有意义。换句话说,我想计算一个语义加权的单词嵌入。

我找到的所有东西都只是找到平均向量(当然这非常简单),它表示列表的平均含义或文档表示的某种加权平均值,但这不是我想要的。

例如,给定['sunglasses', 'jeans', 'hats']的单词向量,我想计算这样一个向量,它代表那些单词的语义,但'sunglasses'具有更大的语义影响。因此,在比较相似性时,单词'glasses'应该比'pants'更类似于列表。

我希望这个问题很清楚,非常感谢你!

答案

实际上,字矢量的平均可以以两种方式完成

  1. 没有tfidf权重的单词向量的平均值。
  2. Word向量的平均值乘以tfidf权重。

这将解决您的重要性问题。

以上是关于单词嵌入的语义加权平均值的主要内容,如果未能解决你的问题,请参考以下文章

基于向量加权平均值的高效优化算法(Matlab代码实现)

MYSQL 按组加权平均

在神经机器翻译中加权

如何在r中的循环中引导加权平均值

跨行数据框中加权平均值的引导

使用熊猫/数据框计算加权平均值