Kmeans fit_predict 与 word2vec

Posted 2023-03-12

技术标签:

【中文标题】Kmeans fit_predict 与 word2vec【英文标题】：Kmeans fit_predict with word2vec 【发布时间】：2016-07-31 05:38:45 【问题描述】：

我正在尝试使用 kmeans 对我的词向量进行聚类，如 here 所述。我正在使用的代码sn-p

# Set "k" (num_clusters) to be 1/5th of the vocabulary size, or an
# average of 5 words per cluster
word_vectors = model.syn0
num_clusters = word_vectors.shape[0] / 5

# Initalize a k-means object and use it to extract centroids
kmeans_clustering = KMeans( n_clusters = num_clusters )
idx = kmeans_clustering.fit_predict( word_vectors )

我收到以下错误 TypeError: 'float' 对象不能被解释为整数

有人可以帮忙

【问题讨论】：

【参考方案1】：

发现错误。簇数必须是整数所以我做了以下

num_clusters = int(word_vectors.shape[0] / 5)

【讨论】：

UGGGGH！谢谢！在我自己的代码中没有发现相同的错误原因，我感到很愚蠢：P 不。只要我们承认，学习并继续前进，就会发生错误，这没关系（不是愚蠢）：D 你也可以使用 wordVectors.shape[0] // 5。 // 运算符强制除法结果为 int

以上是关于Kmeans fit_predict 与 word2vec的主要内容，如果未能解决你的问题，请参考以下文章