RepeatedKFold 实际上是啥意思?

Posted

技术标签:

【中文标题】RepeatedKFold 实际上是啥意思?【英文标题】:What does RepeatedKFold actually mean?RepeatedKFold 实际上是什么意思? 【发布时间】:2018-08-08 09:17:31 【问题描述】:

n_repeats=5,折叠次数为3(n_splits=3)。

这是否意味着验证器正在为我们的估算器/模型创建 3 个折叠以使用每个折叠(就像 KFold 的用途一样),然后重复该过程 5 次?

这意味着我们的模型总共将使用 5 x 3 = 15 折?

【问题讨论】:

【参考方案1】:

是的,循环调用KFolds.split()n_repeats次基本可以达到同样的效果。

示例设置:

X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([0, 0, 1, 1])

然后运行:

rkf = RepeatedKFold(n_splits=2, n_repeats=1, random_state=2652124)
for train_index, test_index in rkf.split(X):
  print("TRAIN:", train_index, "TEST:", test_index)

...产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]

...就像KFold(n_splits=2, random_state=2652124) 一样。更改为 n_repeats=2 会产生:

TRAIN: [0 1] TEST: [2 3]
TRAIN: [2 3] TEST: [0 1]
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]

等等。

【讨论】:

我也刚刚从文档中找到了答案并找出了原因。另外,感谢您在循环中调用 KFold 以获得相同效果的建议!

以上是关于RepeatedKFold 实际上是啥意思?的主要内容,如果未能解决你的问题,请参考以下文章

RepeatedKFold实际上意味着什么?

dplyr 句号字符“。”是啥意思?参考?

音响中的EQ是啥意思呀?

汇编指令JMP是啥意思?

汇编指令JMP是啥意思?

“打开连接”实际上是啥意思?