李航统计学习方法(第二版)基本概念:正则化与交叉验证

Posted qiu-hua

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了李航统计学习方法(第二版)基本概念:正则化与交叉验证相关的知识,希望对你有一定的参考价值。

正则化与交叉验证用于模型选择

1 正则化

正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty iterm )。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。
比如,正则化项可以是模型参数向量的范数。

正则化一般形式:
技术图片

 

 

正则化形式:

 技术图片

2 交叉验证

交叉验证的基木想法是重复地使用数据;把给定的数据进行切分,将切分的数据集组合为训练集与测试集,在此基础上反复地进行训练、测试以及模型选择。


2.1 简单交叉验证

技术图片

2.2 s折交叉验证

技术图片

2.3 留一交叉验证

技术图片

 

以上是关于李航统计学习方法(第二版)基本概念:正则化与交叉验证的主要内容,如果未能解决你的问题,请参考以下文章

李航统计学习方法(第二版)基本概念:泛化能力

李航统计学习方法(第二版)(十三):线性可分支持向量机与硬间隔最大化

李航统计学习方法(第二版):逻辑斯谛回归

李航统计学习方法(第二版):决策树简介

李航统计学习方法(第二版):决策树CART算法

李航统计学习方法(第二版):k 近邻算法简介