RepeatedKFold 实际上是啥意思?
Posted
技术标签:
【中文标题】RepeatedKFold 实际上是啥意思?【英文标题】:What does RepeatedKFold actually mean?RepeatedKFold 实际上是什么意思? 【发布时间】:2018-08-08 09:17:31 【问题描述】:说n_repeats=5
,折叠次数为3(n_splits=3
)。
这是否意味着验证器正在为我们的估算器/模型创建 3 个折叠以使用每个折叠(就像 KFold 的用途一样),然后重复该过程 5 次?
这意味着我们的模型总共将使用 5 x 3 = 15 折?
【问题讨论】:
【参考方案1】:是的,循环调用KFolds.split()
n_repeats
次基本可以达到同样的效果。
示例设置:
X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([0, 0, 1, 1])
然后运行:
rkf = RepeatedKFold(n_splits=2, n_repeats=1, random_state=2652124)
for train_index, test_index in rkf.split(X):
print("TRAIN:", train_index, "TEST:", test_index)
...产生:
TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]
...就像KFold(n_splits=2, random_state=2652124)
一样。更改为 n_repeats=2
会产生:
TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]
等等。
【讨论】:
我也刚刚从文档中找到了答案并找出了原因。另外,感谢您在循环中调用 KFold 以获得相同效果的建议!以上是关于RepeatedKFold 实际上是啥意思?的主要内容,如果未能解决你的问题,请参考以下文章