python中shuffleSplit()函数
Posted 小学森也要学编程
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中shuffleSplit()函数相关的知识,希望对你有一定的参考价值。
参数:
n : int
数据集中的元素总数。
n_iter : int (default 10)
重新洗牌和分裂迭代次数。
test_size : float (default 0.1), int, or None
如果是float类型的数据, 这个数应该介于0-1.0之间,代表test集所占比例. 如果是int类型, 代表test集的数量. 如果为None, 值将自动设置为train集大小的补集
train_size : float, int, or None (default is None)
如果是float类型的数据 应该介于0和1之间,并表示数据集在train集分割中所占的比例 如果是int类型, 代表train集的样本数量. 如果为None, 值将自动设置为test集大小的补集
random_state : int or RandomState
用于随机抽样的伪随机数发生器状态。
例子
rs = cross_validation.ShuffleSplit(4, n_iter=3,
test_size=.25, random_state=0)
以上是关于python中shuffleSplit()函数的主要内容,如果未能解决你的问题,请参考以下文章
sklearn可视化不同数据划分方法的差异:KFold, ShuffleSplit,StratifiedKFold, GroupKFold, StratifiedShuffleSplit.......
为啥 ShuffleSplit 比 train_test_split 更多/更少随机(使用 random_state=None)?
scikit-learn - train_test_split 和 ShuffleSplit 产生非常不同的结果