SD与SE的关系,以及异常值

Posted triple-y

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SD与SE的关系,以及异常值相关的知识,希望对你有一定的参考价值。

 


  很多刚进入实验室的同学对实验数据的标准差(SD)与标准误(SE)的含义搞不清,不知道自己的数据报告到底该用SD还是SE。这里对这两个概念进行一些介绍。

  标准差(SD)强调raw data的Variation,而标准误(SE)强调平均数的可信程度。例如在毒理学实验中,可能少数个体出现不良反应也很重要,需要给予关注,因此这时SD比SE更重要。而在一般的生物实验中,如果我们主要关心的不是少数样本的特殊反应(即个别情况),我们主要关心的是整个群体对的平均状况,需要了解整体数据的可信度时,SE比SD更重要。SD强调raw data的Variation,不随n变化,而SE强调的是平均数的可信程度。SE反比于n的平方根。n越大,SE越小,对应的平均数越可信。

  标准误=标准差/√n n是样本量。公式意思是:标准误等于标准差除以样本量的平方根。

  简单的说,SD描述的是sample的离散程度的。SE描述的是精确度,也就是说从sample里你所得到的这个参数(一般是平均值)和真正的population的差别大小。

  也可以参考:https://wenku.baidu.com/view/78403623571252d380eb6294dd88d0d233d43ca2.htmlhttps://wenku.baidu.com/view/08df083531b765ce0408141f.html

  


  异常值outlier:一组测定值中与平均值的偏差超过两倍标准差的测定值 [1] 。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在处理数据时,应剔除高度异常的异常值。异常值是否剔除,视具体情况而定。在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(reject level)。

 

以上是关于SD与SE的关系,以及异常值的主要内容,如果未能解决你的问题,请参考以下文章

高中散点图怎么判断异常值

有没有办法从 R 的列中取出异常值?

Java异常与运行时异常,以及与线程的关系

检查 Pandas 数据框的异常值 [重复]

R语言使用car包的outlierTest函数通过假设检验的方法检测回归模型中的异常值(outlier)输出异常值对应的统计量p值以及Bonferonnii校正p值

python中--try except 异常捕获以及正则化替换异常值