经验分布

Posted liuhuacai

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了经验分布相关的知识,希望对你有一定的参考价值。

摘要:本文通过一个简单实例展示经验分布,并且说明涉及到的概念及定义

例:对于总体X,抽取一组大小为10的样本,得到的观察值为:

【1.9,2.5,0.1,0.5,4,5.9,4.5,7.9,7.5,9.9】

第一步:对样本观察值进行排序并且求得极差

  排序:【0.1,0.5,1.9,2.5,4,4.5,5.9,7.5,7.9,9.9】

  极差:9.9-0.1=9.8   ##最大观察值-最小观察值

第二步:确定组距和组数。

  区间:[0:10]  ##区间要包含所有的观察值,左右边界值略宽于观测值的边界

  组数:这个区间分成多少个组,一般

    技术图片

 

 

  组距:将区间[0:10]分成m个小区间,每个小区间的距离叫做组距

    技术图片

 

 

     为了方便,小区间被分成了:[0,2),[2,4),[4,6),[6,8),[8,10)

 第三步:计算落入各个区间的样本个数(频数),并作总体X的经验分布函数

  [0,2)---3个

  [2,4)---1个

  [4,6)---3个

  [6,8)---2个

  [8,10)-1个

技术图片

 

 

 第四步:做直方图,获得近似的密度函数

  技术图片

 

 

 

经验分布函数概念

总体X的分布函数为理论分布,这个往往是未知的,如上例中,我们只能获得样本的观测值,并不知道总体的理论分布函数。所以,我们用经验分布函数去描述总体的分布(推断),用直方图去描述总体X的密度函数(近似)。当我们的观测值足够多,经验分布函数不断接近总体的分布函数。

 

以上是关于经验分布的主要内容,如果未能解决你的问题,请参考以下文章

经验分布

使用 python 拟合经验分布

n维数据估计经验分布的累积概率

饿了么分布式服务治理及优化经验(含PPT)

多主机分布式部署经验

我在 Uber 运营大型分布式系统三年经验谈