Doc2Vec -- "tag '23943' not seen in training corpus/invalid" 错误

Posted harp-yestar

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Doc2Vec -- "tag '23943' not seen in training corpus/invalid" 错误相关的知识,希望对你有一定的参考价值。

 

训练Doc2Vec模型之后,想要索取文档向量,却出现意外报错:

    for idx, docvec in enumerate(model.docvecs):
        if idx < 17600:
            x_train.append(docvec)
        else:
            x_test.append(docvec)

  

错误情况:

KeyError: "tag ‘23943‘ not seen in training corpus/invalid"

 

解决方法:

① model.docvecs.doctag_syn0 (即将弃用)

Or

② model.docvecs.vectors_docs

  

以上是关于Doc2Vec -- "tag '23943' not seen in training corpus/invalid" 错误的主要内容,如果未能解决你的问题,请参考以下文章

Doc2vec:gensim doc2vec模型中只有10个docvecs?

NLP-05Doc2vec

改进Gensim Doc2vec结果

如何用单词解释 doc2vec 分类器?

markdown doc2vec

使用 doc2vec 表示的 scikit-learn 分类