K倍验证与随机抽样k次[关闭]

Posted

技术标签:

【中文标题】K倍验证与随机抽样k次[关闭]【英文标题】:K-fold validation vs random sampling k times [closed] 【发布时间】:2016-10-15 19:57:02 【问题描述】:

为什么人们选择使用k-fold验证而不是随机抽样k次?

【问题讨论】:

我不同意它过于宽泛,但它更适合stats.stackexchange.com 【参考方案1】:

因为使用 k 次随机采样,某些对象会被过于频繁地采样,而许多对象根本不会被采样(对于有用的 k 来说,数量惊人地大!)。

K-fold 交叉验证保证每个对象被使用 k-1 次用于学习,1 次用于测试。这会产生更稳定的结果,每个数据点都同样重要。

【讨论】:

以上是关于K倍验证与随机抽样k次[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

R语言使用caret包中的createMultiFolds函数对机器学习数据集进行交叉验证抽样返回的样本列表长度为k×times个times为组内抽样次数

训练模型:交叉验证

Weka 中的交叉验证

集成算法

随机森林和决策树调参

0-4 统计建模划分训练/验证/测试集的几种方法