Cross-Validation交叉验证是什么?详解及实施

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Cross-Validation交叉验证是什么?详解及实施相关的知识,希望对你有一定的参考价值。

Cross-Validation交叉验证是什么?详解及实施

 

交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。 

 

Cross Validation:简言之,就是进行多次train_test_split划分;每次划分时,在不同的数据集上进行训练、测试评估,从而得出一个评价结果;如果是5折交叉验证,意思就是在原始数据集上,进行5次划分,每次划分进行一次训练、评估,最后得到5次划分后的评估结果,一般在这几次评估结果上取平均得到最后的 评分。k-fold cross-validation ,其中,k一般取5或10。

分层交叉验证(Stratified k-fold cross validation):首先它属于交叉验证类型,分层的意思是说在每一折中都保持着原始数据中各个类别的比例关系,比如说:原始数据有3类,比例为

以上是关于Cross-Validation交叉验证是什么?详解及实施的主要内容,如果未能解决你的问题,请参考以下文章

交叉验证——Cross-validation

常见交叉验证(cross-validation)

机器学习中的交叉验证(cross-validation)

机器学习:常见交叉验证(cross-validation)

Python为给定模型执行留一法交叉验证实战LOOCV(leave-one-out cross-validation)

sklearn 中的交叉验证