在 train_test_split sklearn python 上设置种子
Posted
技术标签:
【中文标题】在 train_test_split sklearn python 上设置种子【英文标题】:Setting seed on train_test_split sklearn python 【发布时间】:2019-10-03 14:07:51 【问题描述】:有没有办法在 python sklearn 上的 train_test_split 上设置种子。我已将参数random_state
设置为整数,但仍然无法重现结果。
提前致谢。
【问题讨论】:
【参考方案1】:from sklearn.model_selection import train_test_split
x = [k for k in range(0, 10)]
y = [k for k in range(0, 10)]
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.4, random_state=11)
print (x_train)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.4, random_state=11)
print (x_train)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.4, random_state=11)
print (x_train)
每次我拆分数据时,上面的代码都会为 x_train 产生相同的结果。随机性可能在您的数据框中,而不是 train_test_split。
【讨论】:
以上是关于在 train_test_split sklearn python 上设置种子的主要内容,如果未能解决你的问题,请参考以下文章
关于train_test_split函数是不是打乱数据的验证
TypeError:train_test_split() 只有当我在函数中写入参数'test_size'时才获得多个值
在 train_test_split sklearn python 上设置种子