NLPgensim保存存储和加载fasttext词向量模型

Posted Better Bench

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLPgensim保存存储和加载fasttext词向量模型相关的知识,希望对你有一定的参考价值。

以下举例训练小的语料库的方法,大的语料库,训练词向量操作流程不一样
参考https://radimrehurek.com/gensim_3.8.3/models/fasttext.html

from gensim.models import FastText
from gensim.test.utils import common_texts  # 内置一些例子

print(common_texts[0])
# ['human', 'interface', 'computer']
# 训练词向量
model = FastText(vector_size=4, window=3, min_count=1)  # instantiate
model.build_vocab(sentences=common_texts)
model.train(sentences=common_texts, total_examples=len(common_texts), epochs=10)  # train

# 保存
fname = "fasttext.model"
model.save(fname)
# 加载
model = FastText.load(fname)

以上是关于NLPgensim保存存储和加载fasttext词向量模型的主要内容,如果未能解决你的问题,请参考以下文章

掌握fasttext工具进行文本分类训练词向量的过程

掌握fasttext工具进行文本分类训练词向量的过程

创建单词嵌入,而不将fastText Vector文件保存在存储库中

NLP之使用fasttext进行文档分类

Fasttext原理

fastText一个库用于词表示的高效学习和句子分类