机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?相关的知识,希望对你有一定的参考价值。

机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?

目录

机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?

#random_state参数如何设置

#最佳实践示例


#random_state参数如何设置

为了在多个程序执行中获得重复出现的结果,我们需要避免所有使用random_state=none的情况。推荐的方法是在程序顶部声明一个rng(随机数生成器)变量,并将其传递给任何接受random_state参数的对象。

#最佳实践示例

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
import numpy as np

rng = np.random.RandomState(0)
X, y = make_classification(random_state=rng)
rf = RandomForestClassifier(random_state=rng)
X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                    random_state=rng)

rf.fit(X_train, y_train).score(X_test, y_test)

rf.fit(X_train, y_train).score(X_test, y_test)

rf.fit(X_train, y_train).score(X_test, y_test)

参考:sklearn

参考:Common pitfalls and recommended practices

以上是关于机器学习模型如何获得可重复的结果?最佳实践是什么?如何处理random_state参数?的主要内容,如果未能解决你的问题,请参考以下文章

照明如何影响视觉应用?最佳机器视觉照明的八个技巧!

机器学习应用设计阶段的 10 个陷阱和 11 个最佳实践

在PHP中获取上传文件扩展名的最佳方法/实践是啥[重复]

关于机器学习模型的可解释性算法!

简单易懂 | 机器学习如何快速入门?

简单易懂 | 机器学习如何快速入门?