样本方差的无偏估计与(n-1)的由来

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了样本方差的无偏估计与(n-1)的由来相关的知识,希望对你有一定的参考价值。

原文出处: http://blog.sina.com.cn/s/blog_c96053d60101n24f.html

在PCA算法中用到了方差,协方差矩阵,其中方差公式为,协方差矩阵公式为,当时不明白为什么除的不是m,而是m-1,那么想要知道为何,下面就是你想要的答案。

    假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,技术分享技术分享是总体的均和方差是常数技术分享是对样本的均值和方差,由于样本是随机抽取的,技术分享也是随机的。

技术分享

    这里需要注意的是,由于样本是随机的,所以X1X2X3...都是随机的。上式中可以看出,样本均值这个变量的期望就是总体的均值,因此可以说均值是无偏的。

    接下来看样本方差的均值:

 

    根据方差公式,可以得到:

技术分享

    因此:

    技术分享

    这里可以看出样本方差的期望并不是无偏的,要无偏估计,应该再乘上一个系数:

    n-1既为自由度,就是说,在一个容量为n的样本里,当确定了n-1个变量以后,第n个变量就确定了,因为样本均值是无偏的。
    协方差除以m-1原理和方差一样,因为方差为协方差的特殊情况。

这个知乎上的讨论更加透彻:

http://www.zhihu.com/question/20099757

以上是关于样本方差的无偏估计与(n-1)的由来的主要内容,如果未能解决你的问题,请参考以下文章

无偏估计与方差

为啥在抽得的样本中计算方差时,除去的是n-1,而不是n

为什么方差的分母有时是n,有时是n-1 源于总体方差和样本方差的不同

异方差的检验与修正

关于样本方差以及样本协方差的一点思考

为什么样本方差分母是n-1