数据分析分位距

Posted oliverqin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析分位距相关的知识,希望对你有一定的参考价值。

分位距是对全距的一种改进,它是从一组数据中剔除了一部分极端值之后重新计算的类似于全距的指标。常用的有四分位距、八分位距、十分位距等。

四分位距计算公式为:

技术图片

 

 四分位距排除了数列两端各25%单位标志值的影响,反映了数据组中间部分各变量值的最大数与最小数距离中位数的平均离差。

实际例子

已知一组数据,有8个数字组成:1,3,6,2,8,4,6,10 ,求这组数的四分位距。

解析:

首先,将数据按照从小到大排列:1,2,3,4,6,6,8,10,然后分成四等分

第一个四分位数位于第二、三个数字之间,平均数为:( 2 + 3 )/ 2 = 2.5

第二个四分位为:( 4 + 6 )/ 2 = 5

第三个四分位为:( 6 + 8 )/ 2 = 7

所以,这组数据的四分位距为:( 7 - 2.5 )/ 2 = 2.25

 

以上是关于数据分析分位距的主要内容,如果未能解决你的问题,请参考以下文章

python numpy求四分位距

样本数据异常值处理的三种方法

样本数据异常值处理的三种方法

样本数据异常值处理的三种方法

R语言学习笔记5

箱型图