机器学习模型如何获得可重复的结果？最佳实践是什么？如何处理random_state参数?

Posted 2021-10-26 Data+Science+Insight

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习模型如何获得可重复的结果？最佳实践是什么？如何处理random_state参数?相关的知识，希望对你有一定的参考价值。

机器学习模型如何获得可重复的结果？最佳实践是什么？如何处理random_state参数?

#random_state参数如何设置

#最佳实践示例

#random_state参数如何设置

为了在多个程序执行中获得重复出现的结果，我们需要避免所有使用random_state=none的情况。推荐的方法是在程序顶部声明一个rng（随机数生成器）变量，并将其传递给任何接受random_state参数的对象。

#最佳实践示例

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
import numpy as np

rng = np.random.RandomState(0)
X, y = make_classification(random_state=rng)
rf = RandomForestClassifier(random_state=rng)
X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                    random_state=rng)

rf.fit(X_train, y_train).score(X_test, y_test)

rf.fit(X_train, y_train).score(X_test, y_test)

rf.fit(X_train, y_train).score(X_test, y_test)

参考：sklearn

参考：Common pitfalls and recommended practices

以上是关于机器学习模型如何获得可重复的结果？最佳实践是什么？如何处理random_state参数?的主要内容，如果未能解决你的问题，请参考以下文章