机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?相关的知识,希望对你有一定的参考价值。
机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?
目录
机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?
#random_state参数如何设置
为了在多个程序执行中获得重复出现的结果,我们需要避免所有使用random_state=none的情况。推荐的方法是在程序顶部声明一个rng(随机数生成器)变量,并将其传递给任何接受random_state参数的对象。
#最佳实践示例
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
import numpy as np
rng = np.random.RandomState(0)
X, y = make_classification(random_state=rng)
rf = RandomForestClassifier(random_state=rng)
X_train, X_test, y_train, y_test = train_test_split(X, y,
random_state=rng)
rf.fit(X_train, y_train).score(X_test, y_test)
rf.fit(X_train, y_train).score(X_test, y_test)
rf.fit(X_train, y_train).score(X_test, y_test)
参考:sklearn
参考:Common pitfalls and recommended practices
以上是关于机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?的主要内容,如果未能解决你的问题,请参考以下文章