统计学——数据分布的特征和测度

Posted crazyjiojio

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计学——数据分布的特征和测度相关的知识,希望对你有一定的参考价值。

每个指标都在某个方向提供一定信息,没有那些指标可以提供数据的全部信息,指标之间是互补的。

1,集中趋势:Central tendencey

    #a,数据向其中心值靠拢的倾向和程度;————当数据比较离散的时候无法用集中趋势来代表一般水平。

    #b,测度集中趋势就是寻找数据一般水平代表或者中心值;

    #c,不同类型的数据用不同的集中趋势测度值;

    #d,低层次数据的集中趋势测度适用于高层次的测量数据,但,高层次数据的集中趋势值并不适用于低层次的测量数据;

    #e,灵活选用测度值里反应数据的集中趋势,依据数据类型确定;

  1)位置平均数:

          众数:——定类数据最低级的数据,数据的变量值,变量值之间无法比较大小,如性别,颜色

            #a,集中趋势的测度值之一,出现次数最多的变量值,不受极端值的影响,可能没有众数或有多个众数;

            #b,主要用于定类数据,也可用于定序数据和数值型数据;——其中定序和定类数据的变量值比较稳定和具体;

            #c,数值型分组数据的众数:数值型变量值为一个区间或一个范围,使得变量值无法满足具体的条件

               $a,众数的值与相邻两组频数的分布有关;

               $b,相邻两组的频数相等时,众数组的组中值即为众数;

               $c,相邻两组的频数不等时,众数采取近似公式计算:

                                              M0=L+[(f-f1)/(f-f_1)+(f-f+1)]*i----------------该公式假定众数组的频数在众数组内均匀分布

                                                                   L为频次最多的下限,分子为其频数-相邻频数较小的频数值,i 为组距

          中位数:——定序数据(用中位数和分位数表征)属于较为高级的数据,变量值之前可以比较大小,但无法比较大小的多少。如,受教育程度:小学,初中,高中,大学

  2)数值平均数:——定距和定比数据,属于最高级别的数据,比如温度,身高 属于连续型,不但可以比较大小,还可以比较大小的多少。

          算术平均数:

          调和平均数:

          集合平均数:

2,离散程度:

  1)异众比率:

  2)四分位差:

  3)方差和标准差:

  4)离散系数:

3,分布的形状:

  1)偏态:

  2)峰度:

以上是关于统计学——数据分布的特征和测度的主要内容,如果未能解决你的问题,请参考以下文章

数据挖掘——统计学分析(三:数据的概括性度量)

统计学

0002.统计描述分析

20190809统计学重点知识归纳

正态分布-置信区间计算

数据特征分析:1.分布分析