概率分布

Posted yibeimingyue

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了概率分布相关的知识,希望对你有一定的参考价值。

概率分布有两个词组成,概率+分布。

概率指的是一些数据出现的可能性。

分布指的是数据的稀疏和稠密。

概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。

技术图片

 

 很显然的,根据数据类型的不同,概率分布分为两种:离散概率分布,连续概率分布。

那么,问题就来了。为什么你要关心数据类型呢?

因为数据类型会影响求概率的方法。

对于离散概率分布,我们关心的是取得一个特定数值的概率。例如抛硬币正面向上的概率为:p(x=正面)=1/2

而对于连续概率分布来说,我们无法给出每一个数值的概率,因为我们不可能列举每一个精确数值。

例如,你在咖啡馆约妹子出来,你提前到了。为了给妹子留下好印象,你估计妹子会在5分钟之内出现,有可能是在4分钟10秒以后出现,或者在4分钟10.5秒以后出现,你不可能数清楚所有的可能时间,你更关心的是在妹子出现前的1-5分钟内(范围),你把发型重新整理下(虽然你因为加班头发 已经秃顶了,但是发型不能乱),给妹子留个好印象。所以,对于像时间这样的连续型数据,你更关心的是一个特定范围的概率是多少。

接下里,我们一起来聊聊常见的4种概率分布。

1)3种离散概率分布

二项分布 泊松分布 几何何分布

2)1种连续概率分布

正态分布

 

第1种:二项分布

什么是二项分布呢?只要符合下面3个特点就可以判断某事件是二项分布了:

1)做某件事的次数(也叫试验次数)是固定的,用n表示。

(例如抛硬币3次,投资5支股票),

2)每一次事件都有两个可能的结果(成功,或者失败)

(例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。

每一次投资美股有2个结果:投资成功,投资失败)。

3)每一次成功的概率都是相等的,成功的概率用p表示

(例如每一次抛硬币正面朝上的概率都是1/2。

你投资了5家公司的股票,假设每一家投资盈利成功的概率都相同)

4)你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

(你已经知道了我前面讲的5家美股的赚钱概率最大,所以你买了这5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率)

 

3. 二项分布如何计算概率?

怎么计算符合二项分布事件的概率呢?也就是你想知道下面的问题:

你抛硬币3次,2次正面朝上的概率是多少? 你买了这5家公司的股票,3支股票赚钱的概率是多大?

上面我们已经知道了二项分布的4个特点,并知道每个特点的表示方法:

1)做某件事次数是固定的,用n表示
2)每一次事件都有两个可能的结果(成功,或者失败)
3)每一次成功的概率都是相等的,成功的概率用p表示
4)你感兴趣的是成功x次的概率是多少

这时候,二项分布的公式就可以发挥威力了:

技术图片

这里你也别害怕数学公式,每一项的含义我前面已经讲的很清楚了。这个公式就是计算做某件事情n次,成功x次的概率的。很多数据分析工具(Excel,Python,R)都提供工具让你带入你研究问题的数值,就能得到结果。

例如,抛硬币5次(n),恰巧有3次正面朝上(x=3,抛硬币正面朝上概率p=1/2),可以用上面的公式计算出出概率为31.25%(用Excel的BINOM.DIST函数,Python,R都可以快速计算)

 

作者:猴子
链接:https://zhuanlan.zhihu.com/p/28309212
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

以上是关于概率分布的主要内容,如果未能解决你的问题,请参考以下文章

3.概率分布函数与概率密度函数

概率论与数理统计 Chapter2. 随机变量及概率分布

已知分布函数如下,求概率密度,请写出具体步骤

概率分布函数和概率密度函数

概率分布函数和概率密度函数

概率函数,分布函数,密度函数