方差为什么用平方,而不是绝对值?

Posted wyply115

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了方差为什么用平方,而不是绝对值?相关的知识,希望对你有一定的参考价值。

  • 问题一:如果要从甲、乙两名选手中选拔一名参加射击比赛?你将设计什么方案?
    S:总分高的。
    T:若有一名选手射击5次,总分30;而另一名选手射击10次,总分50分,你又会选择谁?
    S:看来还是算平均分合适。
  • 问题二:你选择谁?
    甲:3、5、6、7、9
    乙:4、5、6、7、8
    从数据中,可以看出用平均数来选拔是不可取的。尽管平均环数相同,但二人的水平还是有差距的。让学生充分研讨,经过观察分析数据,比较容易达成这样的共识:甲最多9,最少3环,波动范围较大,而乙最多8,最少4,波动范围较小。因此乙较稳定,应该选拔乙。
  • 问题三:极大值与极小值的差能分析准确吗?
    甲:3、5、6、7、9
    丙:3、6、6、6、9
    不难发现,虽然最多比最少差距相同,但丙比甲要稳定。同时还发现:在平均数相同的情况下,单纯比较最大与最小两个数据,不能够说明一组数据的整体波动情况,每个数据都有决定权。那么又如何反映一组数据的波动情况?
    S:用各个数据减去它们的平均数,得到各个数据的偏差;再将各偏差相加。
    经过一算:不难得出甲、乙、丙的偏差和都为0。到这一步,同学们会突然想到去掉偏差的负号问题。老师引导学生进行探索、分析,最后归纳出两种方法。(1)先求各偏差的绝对值,再相加;(2)先求各偏差的平方,再相加。
  • 问题四:算一算下列数据的偏差和。
    甲:3、5、6、7、9
    乙:4、5、6、7、8
    丙:3、6、6、6、9
    用方法一算得:甲:8;乙:6;丙:6(又如何比较乙、丙的稳定性呢?)
    用方法二算得:甲:20;乙:10;丙:18(这种算法算得,三者的稳定性都不一样?也让学生初步体会用平方而不用绝对值的目的就是将数据间的差距拉大)
  • 问题五:乙孤军奋战(求偏差平方和):
    第一阶段:4、5、6、7、8
    第二阶段:4、5、6、7、8、4、5、6、7、8
    第三阶段:4、5、6、7、8、4、5、6、7、8、4、5、6、7、8
    ……
    从上面的计算看出:单求偏差平方和,易因“数据越多而导致偏差平方和也越大”的结论,而实际上它们的稳定性应该是相同的。从而得出结论:只有求得“偏差的平方”的平均数才能真实地描述波动特征。
    两年前,我认为,求方差不用绝对值而用平方是只是一种规定;但,看了黄剑秋老师的教学设计后,让我彻底明白,我的想法是错的,规定也应该有规定的理由。现在展示的三组数据应该能让稳定性表现的淋漓尽致,这是目前我对方差的理解。
    ---------------------
    另标准差计算方法:
    “标准差”(standard deviation)也称“标准偏差”,它可以通过计算方差的算术平方根来求得。标准差表征了各数据偏离平均值的距离,它反映出一个数据集的离散程度。
    计算标准差的步骤通常有四步:
    (1)计算平均值
    (2)计算方差
    (3)计算平均方差
    (4)计算标准差
    例如,对于一个有六个数的数集2,3,4,5,6,8,其标准差可通过以下步骤计算:
    (1)计算平均值:
    (2 + 3 + 4 + 5+ 6 + 8)/6 = 30 /6 = 5
    (2)计算方差:
    (2 – 5)^2 = (-3)^2= 9
    (3 – 5)^2 = (-2)^2= 4
    (4 – 5)^2 = (-1)^2= 0
    (5 – 5)^2 = 0^2= 0
    (6 – 5)^2 = 1^2= 1
    (8 – 5)^2 = 3^2= 9
    (3)计算平均方差:
    (9 + 4 + 0 + 0+ 1 + 9)/6 = 24/6 = 4
    (4)计算标准差:
    √4 = 2

以上是关于方差为什么用平方,而不是绝对值?的主要内容,如果未能解决你的问题,请参考以下文章

均方误差(MSE)和均方根误差(RMSE)和平均绝对误差(MAE)

matlab的std函数怎么用

standard error怎么算

偏差(Bias)和方差(Variance)——机器学习中的模型选择

偏差和方差

偏差与方差,欠拟合与过拟合的关系