正则化——“偏差(bias)”与“方差(variance)”

Posted qkloveslife

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则化——“偏差(bias)”与“方差(variance)”相关的知识,希望对你有一定的参考价值。

正则化后的线性回归模型

模型

[{h_ heta }left( x ight) = { heta _0} + { heta _1}x + { heta _2}{x^2} + { heta _3}{x^3} + { heta _4}{x^4}]

[Jleft( heta  ight) = frac{1}{{2m}}left[ {sumlimits_{i = 1}^m {{{left( {{h_ heta }left( {{x^{left( i ight)}}} ight) - {y^{left( i ight)}}} ight)}^2}}  + lambda sumlimits_{j = 1}^n { heta _j^2} } ight]]

 当正则化参数λ很大时

[{h_ heta }left( x ight) approx { heta _0}]

这时处于“高偏差(High bias)”(underfit)的情况

技术分享图片

当正则化参数很小(λ=0)时

[{h_ heta }left( x ight) = { heta _0} + { heta _1}x + { heta _2}{x^2} + { heta _3}{x^3} + { heta _4}{x^4}]

这时处于“高方差(High variance)”(overfit)

技术分享图片

当正则化参数λ适当时

模型处于“Just right”状态

技术分享图片


如何选择正确的λ呢?

除了以下两个公式

[{h_ heta }left( x ight) = { heta _0} + { heta _1}x + { heta _2}{x^2} + { heta _3}{x^3} + { heta _4}{x^4}]

[Jleft( heta  ight) = frac{1}{{2m}}left[ {sumlimits_{i = 1}^m {{{left( {{h_ heta }left( {{x^{left( i ight)}}} ight) - {y^{left( i ight)}}} ight)}^2}}  + lambda sumlimits_{j = 1}^n { heta _j^2} } ight]]

再定义

[egin{array}{l}
{J_{train}}left( heta ight) = frac{1}{{2{m_{train}}}}sumlimits_{i = 1}^{{m_{train}}} {{{left( {{h_ heta }left( {{x^{left( i ight)}}} ight) - {y^{left( i ight)}}} ight)}^2}} \\
{J_{CV}}left( heta ight) = frac{1}{{2{m_{CV}}}}sumlimits_{i = 1}^{{m_{CV}}} {{{left( {{h_ heta }left( {x_{CV}^{left( i ight)}} ight) - y_{CV}^{left( i ight)}} ight)}^2}} \\
{J_{test}}left( heta ight) = frac{1}{{2{m_{test}}}}sumlimits_{i = 1}^{{m_{test}}} {{{left( {{h_ heta }left( {{x^{left( i ight)}}} ight) - {y^{left( i ight)}}} ight)}^2}}
end{array}]

分别表示“训练误差”、‘“交叉验证误差”和“测试误差”

选择λ

尝试如下λ

  • λ=0----------->minJ(θ)----->Θ(1)------>JCV(1))
  • λ=0.01------->minJ(θ)----->Θ(2)------>JCV(2))
  • λ=0.02------->minJ(θ)----->Θ(3)------>JCV(3))
  • λ=0.04------->minJ(θ)----->Θ(4)------>JCV(4))
  • .
  • .
  • .
  • λ=10--------->minJ(θ)----->Θ(12)------>JCV(12))

运用不同的λ去最小化“代价函数”得到不同的Θ;

不同的Θ带入h(x)中得到不同的模型,然后用“交叉验证集”验证;

取“交叉验证误差”最小的那个模型;

将最终得到的模型运用于测试集,测试模型的表现。

 





以上是关于正则化——“偏差(bias)”与“方差(variance)”的主要内容,如果未能解决你的问题,请参考以下文章

机器学习理论知识部分--偏差方差平衡(bias-variance tradeoff)

偏差 (bias) 和方差(variance)

2020-2021年顶会上关于解决偏差(bias)问题的文献整理

2020-2021年顶会上关于解决偏差(bias)问题的文献整理

推荐系统去流行度偏差(bias)文献四篇

推荐系统去流行度偏差(bias)文献四篇