gensim加载word2vec训练结果(bin文件)并进行相似度实验

Posted 右介

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了gensim加载word2vec训练结果(bin文件)并进行相似度实验相关的知识,希望对你有一定的参考价值。

# -*- coding: utf-8 -*-  
import gensim  

# 导入模型
model = gensim.models.KeyedVectors.load_word2vec_format(vectors.bin, binary=True)

# 得到两组词的相似度
list1 = [u核能]
list2 = [u电能]
list3 = [u电力]
list_sim1 =  model.n_similarity(list1, list2)
print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, \n

# 得到一组词中最无关的词
list4 = [u汽车, u火车, u飞机, u北京]
print model.doesnt_match(list4)
print \n

# 得到与一个词最相关的若干词及相似程度
result = model.most_similar(u脱水工艺)
for each in result:
    print each[0] , each[1]

 

以上是关于gensim加载word2vec训练结果(bin文件)并进行相似度实验的主要内容,如果未能解决你的问题,请参考以下文章

Gensim Word2Vec 从预训练模型中选择少量词向量

在 keras 中使用预训练的 gensim Word2vec 嵌入

自然语言处理之使用gensim.Word2Vec训练词向量进行词义消歧

tensorflow加载embedding模型进行可视化

利用搜狐新闻语料库训练100维的word2vec——使用python中的gensim模块

Python之酒店评论词向量训练 gensim