gensim加载word2vec训练结果(bin文件)并进行相似度实验
Posted 右介
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了gensim加载word2vec训练结果(bin文件)并进行相似度实验相关的知识,希望对你有一定的参考价值。
# -*- coding: utf-8 -*- import gensim # 导入模型 model = gensim.models.KeyedVectors.load_word2vec_format(‘vectors.bin‘, binary=True) # 得到两组词的相似度 list1 = [u‘核能‘] list2 = [u‘电能‘] list3 = [u‘电力‘] list_sim1 = model.n_similarity(list1, list2) print list_sim1 list_sim2 = model.n_similarity(list2, list3) print list_sim2, ‘\n‘ # 得到一组词中最无关的词 list4 = [u‘汽车‘, u‘火车‘, u‘飞机‘, u‘北京‘] print model.doesnt_match(list4) print ‘\n‘ # 得到与一个词最相关的若干词及相似程度 result = model.most_similar(u‘脱水工艺‘) for each in result: print each[0] , each[1]
以上是关于gensim加载word2vec训练结果(bin文件)并进行相似度实验的主要内容,如果未能解决你的问题,请参考以下文章
Gensim Word2Vec 从预训练模型中选择少量词向量
在 keras 中使用预训练的 gensim Word2vec 嵌入
自然语言处理之使用gensim.Word2Vec训练词向量进行词义消歧