概率分布
Posted yibeimingyue
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了概率分布相关的知识,希望对你有一定的参考价值。
概率分布有两个词组成,概率+分布。
概率指的是一些数据出现的可能性。
分布指的是数据的稀疏和稠密。
概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。
很显然的,根据数据类型的不同,概率分布分为两种:离散概率分布,连续概率分布。
那么,问题就来了。为什么你要关心数据类型呢?
因为数据类型会影响求概率的方法。
对于离散概率分布,我们关心的是取得一个特定数值的概率。例如抛硬币正面向上的概率为:p(x=正面)=1/2
而对于连续概率分布来说,我们无法给出每一个数值的概率,因为我们不可能列举每一个精确数值。
例如,你在咖啡馆约妹子出来,你提前到了。为了给妹子留下好印象,你估计妹子会在5分钟之内出现,有可能是在4分钟10秒以后出现,或者在4分钟10.5秒以后出现,你不可能数清楚所有的可能时间,你更关心的是在妹子出现前的1-5分钟内(范围),你把发型重新整理下(虽然你因为加班头发 已经秃顶了,但是发型不能乱),给妹子留个好印象。所以,对于像时间这样的连续型数据,你更关心的是一个特定范围的概率是多少。
接下里,我们一起来聊聊常见的4种概率分布。
1)3种离散概率分布
二项分布 泊松分布 几何何分布
2)1种连续概率分布
正态分布
什么是二项分布呢?只要符合下面3个特点就可以判断某事件是二项分布了:
1)做某件事的次数(也叫试验次数)是固定的,用n表示。
(例如抛硬币3次,投资5支股票),
2)每一次事件都有两个可能的结果(成功,或者失败)
(例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。
每一次投资美股有2个结果:投资成功,投资失败)。
3)每一次成功的概率都是相等的,成功的概率用p表示
(例如每一次抛硬币正面朝上的概率都是1/2。
你投资了5家公司的股票,假设每一家投资盈利成功的概率都相同)
4)你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。
(你已经知道了我前面讲的5家美股的赚钱概率最大,所以你买了这5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率)
3. 二项分布如何计算概率?
怎么计算符合二项分布事件的概率呢?也就是你想知道下面的问题:
你抛硬币3次,2次正面朝上的概率是多少? 你买了这5家公司的股票,3支股票赚钱的概率是多大?
上面我们已经知道了二项分布的4个特点,并知道每个特点的表示方法:
1)做某件事次数是固定的,用n表示
2)每一次事件都有两个可能的结果(成功,或者失败)
3)每一次成功的概率都是相等的,成功的概率用p表示
4)你感兴趣的是成功x次的概率是多少
这时候,二项分布的公式就可以发挥威力了:
这里你也别害怕数学公式,每一项的含义我前面已经讲的很清楚了。这个公式就是计算做某件事情n次,成功x次的概率的。很多数据分析工具(Excel,Python,R)都提供工具让你带入你研究问题的数值,就能得到结果。
例如,抛硬币5次(n),恰巧有3次正面朝上(x=3,抛硬币正面朝上概率p=1/2),可以用上面的公式计算出出概率为31.25%(用Excel的BINOM.DIST函数,Python,R都可以快速计算)
链接:https://zhuanlan.zhihu.com/p/28309212
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
以上是关于概率分布的主要内容,如果未能解决你的问题,请参考以下文章