SD与SE的关系,以及异常值
Posted triple-y
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SD与SE的关系,以及异常值相关的知识,希望对你有一定的参考价值。
很多刚进入实验室的同学对实验数据的标准差(SD)与标准误(SE)的含义搞不清,不知道自己的数据报告到底该用SD还是SE。这里对这两个概念进行一些介绍。
标准差(SD)强调raw data的Variation,而标准误(SE)强调平均数的可信程度。例如在毒理学实验中,可能少数个体出现不良反应也很重要,需要给予关注,因此这时SD比SE更重要。而在一般的生物实验中,如果我们主要关心的不是少数样本的特殊反应(即个别情况),我们主要关心的是整个群体对的平均状况,需要了解整体数据的可信度时,SE比SD更重要。SD强调raw data的Variation,不随n变化,而SE强调的是平均数的可信程度。SE反比于n的平方根。n越大,SE越小,对应的平均数越可信。
标准误=标准差/√n n是样本量。公式意思是:标准误等于标准差除以样本量的平方根。
简单的说,SD描述的是sample的离散程度的。SE描述的是精确度,也就是说从sample里你所得到的这个参数(一般是平均值)和真正的population的差别大小。
也可以参考:https://wenku.baidu.com/view/78403623571252d380eb6294dd88d0d233d43ca2.html和https://wenku.baidu.com/view/08df083531b765ce0408141f.html
异常值outlier:一组测定值中与平均值的偏差超过两倍标准差的测定值 [1] 。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在处理数据时,应剔除高度异常的异常值。异常值是否剔除,视具体情况而定。在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(reject level)。
以上是关于SD与SE的关系,以及异常值的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用car包的outlierTest函数通过假设检验的方法检测回归模型中的异常值(outlier)输出异常值对应的统计量p值以及Bonferonnii校正p值