doc2vec 利用gensim 生成文档向量

Posted 星空守望者--jkmiao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了doc2vec 利用gensim 生成文档向量相关的知识,希望对你有一定的参考价值。

利用gensim 直接生成文档向量

    
    def gen_d2v_corpus(self, lines):

        with open("./data/ques2_result.txt", "wb") as fw:
            for line in lines:
                fw.write(" ".join(jieba.lcut(line)) + "\n")

        sents = doc2vec.TaggedLineDocument("./data/ques2_result.txt")
        model = doc2vec.Doc2Vec(sents, size = 50, window = 5, alpha = 0.015)
        model.train(sents)

        corpus = model.docvecs
        np.save("./output/d2v.corpus.npy", corpus)

        return np.asarray(corpus)

 

以上是关于doc2vec 利用gensim 生成文档向量的主要内容,如果未能解决你的问题,请参考以下文章

doc2vec使用说明gensim工具包 LabeledSentence

Doc2vec:gensim doc2vec模型中只有10个docvecs?

机器学习使用gensim 的 doc2vec 实现文本相似度检测

gensim简介

如何将 Gensim doc2vec 与预训练的词向量一起使用?

如何从 gensim 模型中的 Doc2Vec 相似度分数访问文档详细信息?