n折交叉验证结果中的+-怎么算的? 标准差?有偏估计?无偏估计?

Posted strawberry47

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了n折交叉验证结果中的+-怎么算的? 标准差?有偏估计?无偏估计?相关的知识,希望对你有一定的参考价值。

n折交叉验证的结果怎么写


Q:这种实验结果里的±是怎么写出来的呢?
A:均值± 标准差

标准差

百度标准差的时候,发现了这两个公式。差别是,后者是无偏估计量。

无偏估计

那么什么是无偏估计呢?下面三个链接很好的解释了:
为什么分母从n变成n-1之后,就从【有偏估计】变成了【无偏估计】?
为什么样本方差(sample variance)的分母是 n-1?
为什么样本方差(sample variance)的分母是 n-1?
下面自己总结总结~

个人理解:

  1. 首先,我们要看看方差是怎么计算的: E [ 1 n ∑ i = 1 n ( X i − μ ) 2 ] = σ 2 \\mathbb{E}\\left[\\frac{1}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\mu\\right)^{2}\\right]=\\sigma^{2} E[n1i=1n(Xiμ)2]=σ2
  2. 此时候是无偏估计的,但当我们用 X ˉ \\bar{X} Xˉ替换 u u u后,将倾向于低估方差
    1 n ∑ i = 1 n ( X i − X ˉ ) 2 = 1 n ∑ i = 1 n [ ( X i − μ ) + ( μ − X ˉ ) ] 2 = 1 n ∑ i = 1 n ( X i − μ ) 2 + 2 n ∑ i = 1 n ( X i − μ ) ( μ − X ˉ ) + 1 n ∑ i = 1 n ( μ − X ˉ ) 2 = 1 n ∑ i = 1 n ( X i − μ ) 2 + 2 ( X ˉ − μ ) ( μ − X ˉ ) + ( μ − X ˉ ) 2 = 1 n ∑ i = 1 n ( X i − μ ) 2 − ( μ − X ˉ ) 2 \\begin{aligned} \\frac{1}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\bar{X}\\right)^{2} &=\\frac{1}{n} \\sum_{i=1}^{n}\\left[\\left(X_{i}-\\mu\\right)+(\\mu-\\bar{X})\\right]^{2} \\\\ &=\\frac{1}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\mu\\right)^{2}+\\frac{2}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\mu\\right)(\\mu-\\bar{X})+\\frac{1}{n} \\sum_{i=1}^{n}(\\mu-\\bar{X})^{2} \\\\ &=\\frac{1}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\mu\\right)^{2}+2(\\bar{X}-\\mu)(\\mu-\\bar{X})+(\\mu-\\bar{X})^{2} \\\\ &=\\frac{1}{n} \\sum_{i=1}^{n}\\left(X_{i}-\\mu\\right)^{2}-(\\mu-\\bar{X})^{2} \\end{aligned} n1i=1n(XiXˉ)2=n1i=1n[(Xiμ)+(μXˉ)]2=n1i=1n(Xiμ)2+n2i=1n(Xiμ)(μXˉ)+n1i=1n(μXˉ)2=n1i=1n(Xiμ)2+2(Xˉμ)(μXˉ)+(μXˉ)2=n1i=1n(Xiμ)2(μXˉ)2
    从公式可以看出,除非均值 X ˉ \\bar{X} Xˉ与期望 u u u是相等的,否则会导致对方差的低估。
  3. 我们也可以通过一个例子说明为什么样本均值 X ˉ \\bar{X} Xˉ与期望 u u u是不相等的:掷骰子,点数的期望是 3.5, 是一个确定的数字,但是实际投掷n次取平均并不一定等于3.5。
  4. 因此,为了不要低估方差,就把分母从 n n n换成 n − 1 n-1 n1。具体来说,需要用一个 n n − 1 \\frac{n}{n-1} n1n的因子来进行修正:
    E ( S 1 2 ) = 1 n ∑ i = 1 n E ( ( X i − X ˉ ) 2 ) = 1 n E ( ∑ i = 1 n ( X i − μ + μ − X ˉ ) 2 ) = 1 n E ( ∑ i = 1 n ( ( X i − μ ) 2 − 2 ( X i − μ ) ( X ˉ − μ ) + ( X ˉ − μ ) 2 ) ) = 1 n E ( ∑ i = 1 n ( X i − μ ) 2 − 2 ∑ i = 1 n ( X i − μ ) ( X ˉ − μ ) + n ( X ˉ − μ ) 2 ) = 1 n E (

    以上是关于n折交叉验证结果中的+-怎么算的? 标准差?有偏估计?无偏估计?的主要内容,如果未能解决你的问题,请参考以下文章

    5倍交叉验证如何理解

    R语言里怎么做十折交叉验证

    交叉验证

    使用 K 折交叉验证标准化数据

    什么是无偏估计和有偏估计

    weka 中用于推文分类的 N 折交叉验证