python中shuffleSplit()函数

Posted 小学森也要学编程

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中shuffleSplit()函数相关的知识,希望对你有一定的参考价值。

参数:

 

n : int

数据集中的元素总数。

n_iter : int (default 10)

重新洗牌和分裂迭代次数。

test_size : float (default 0.1), int, or None

如果是float类型的数据, 这个数应该介于0-1.0之间,代表test集所占比例. 如果是int类型, 代表test集的数量. 如果为None, 值将自动设置为train集大小的补集

train_size : float, int, or None (default is None)

如果是float类型的数据 应该介于0和1之间,并表示数据集在train集分割中所占的比例 如果是int类型, 代表train集的样本数量. 如果为None, 值将自动设置为test集大小的补集

random_state : int or RandomState

用于随机抽样的伪随机数发生器状态。

例子

rs = cross_validation.ShuffleSplit(4, n_iter=3,  
         test_size=.25, random_state=0)

 

以上是关于python中shuffleSplit()函数的主要内容,如果未能解决你的问题,请参考以下文章

sklearn可视化不同数据划分方法的差异:KFold, ShuffleSplit,StratifiedKFold, GroupKFold, StratifiedShuffleSplit.......

为啥 ShuffleSplit 比 train_test_split 更多/更少随机(使用 random_state=None)?

scikit-learn - train_test_split 和 ShuffleSplit 产生非常不同的结果

sklearn ShuffleSplit 出现“__init__() 参数 'n_splits' 的多个值”错误

『Sklearn』数据划分方法

在python程序中,一个源代码文件中,在函数体中声明的变量(包括函数参数)称?