保存训练好的机器学习模型

Posted caiyishuai

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了保存训练好的机器学习模型相关的知识,希望对你有一定的参考价值。

保存训练好的机器学习模型

        当我们训练好一个model后,下次如果还想用这个model,我们就需要把这个model保存下来,下次直接导入就好了,不然每次都跑一遍,训练时间短还好,要是一次跑好几天的那怕是要天荒地老了。。sklearn官网提供了两种保存model的方法:官网地址

  1.使用python自带的pickle

from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets
import pickle

#方法一:python自带的pickle
(X,y) = datasets.load_iris(return_X_y=True)
rfc = RandomForestClassifier(n_estimators=100,max_depth=100)
rfc.fit(X,y)
print(rfc.predict(X[0:1,:]))
#save model
f = open(saved_model/rfc.pickle,wb)
pickle.dump(rfc,f)
f.close()
#load model
f = open(saved_model/rfc.pickle,rb)
rfc1 = pickle.load(f)
f.close()
print(rfc1.predict(X[0:1,:]))

2.使用sklearn中的模块joblib 
使用joblib模块更加的简单了,核心代码就两行

from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets
from sklearn.externals import joblib
#方法二:使用sklearn中的模块joblib
(X,y) = datasets.load_iris(return_X_y=True)
rfc = RandomForestClassifier(n_estimators=100,max_depth=100)
rfc.fit(X,y)
print(rfc.predict(X[0:1,:]))
#save model
joblib.dump(rfc, saved_model/rfc.pkl)
#load model
rfc2 = joblib.load(saved_model/rfc.pkl)
print(rfc2.predict(X[0:1,:]))

这两个方法都可以,但是更推荐用第二种,即joblib,因为根据官网介绍,速度更快。 


以上是关于保存训练好的机器学习模型的主要内容,如果未能解决你的问题,请参考以下文章

在 pytorch 中为聊天机器人加载经过训练的模型保存

训练有素的机器学习模型太大

是否可以在python中提取训练好的机器学习模型的公式?

启动监控和维护机器学习系统

sklearn训练模型的保存与加载

机器学习-Python中训练模型的保存和再使用