二项式分布预测新生儿

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了二项式分布预测新生儿相关的知识,希望对你有一定的参考价值。

医院每天都有新生儿呱呱落地。每天会有多少男婴出生,多少女婴出生呢?这个问题不难,我们可以用二项式分布来计算,python建模观察。

二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。

程序调用了python的numpy,scipy两个模块。numpy用于矩阵运算;scipy是numpy的高级版本,用于更高级的自然科学应用,例如信号处理,傅里叶分析。

我们假设医院每天100婴儿出生 , num代表每天婴儿出生总数。然后假设男孩出生概率为0.5,p代表男孩出生概率 。

num=100

p=0.5

运行环境:win7_32位,anaconda 2(python2.7)

源码放在文章末尾,所有代码经本人测试没有问题。

写好脚本后运行

技术分享

放大console控制台观察

技术分享 

程序自动预测医院每天出生100个新生儿,有50个男孩出生。这里解释一下, 50个男孩出生并不一定发生,只是概率最大。医院每天出生100个新生儿,有可能出生40个男孩,或30个男孩,或10个男孩,只是这些可能性并不高。假设我们想知道医院每天出生100个新生儿中全部是男孩概率。程序变量x代表出生男孩数量,Get_probability_x(x)函数计算其概率。

x=100

x_probability=Get_probability_x(x) 

控制台最后一行显示所有新生儿都为男婴的概率几乎为0.

list_probablity是各种情况的概率列表

技术分享 

总结一下,二项式期望值公式E(X)=E[X(1)+X(2)+X(3)....X(n)]=np。二项式期望值通俗的讲就是数量乘以概率。通过程序建模,我们清楚认识到期望值只是一种最大概率的可能,并不代表一定会发生。

代码运行问题反馈邮箱[email protected]

源码:

# -*- coding: utf-8 -*-

from scipy import stats

import numpy as np

#返回各种可能的概率列表

def Get_list_probability(num,p,array_x):

    binoDist=stats.binom(num,p)

    array_probability=binoDist.pmf(array_x)

    list_probablity=list(array_probability)

    list_probablity1=[round(i,6) for i in list_probablity]

    return list_probablity1

#二项式函数的最大概率值和第几次出现,num为试验次数,p为概率

def Max_BinomialDistribution(list_probablity,array_x):

    maxProbability=max(list_probablity)

    #概率最大值所在索引

    index=list_probablity.index(maxProbability)

    #第几次试验概率最大

    x=array_x[index]

    return maxProbability,x

#测试X次成功概率

def Get_probability_x(x):

    value=round(list_probablity[x],2)

    return value

def Print():

    print "boy birth probability:",p

print "%d boys are expected to born with probability %f"%(maxProbability[1],maxProbability[0])

    print "%d boys born probability %f"%(x,x_probability)

#医院每天100人出生   

num=100

#男孩出生概率

p=0.5

array_x=np.arange(101)

list_probablity=Get_list_probability(num,p,array_x)

#得到最大概率及其对应x试验次数

maxProbability=Max_BinomialDistribution(list_probablity,array_x)

# X个男孩出生概率预测

x=100

x_probability=Get_probability_x(x)

Print()

End.

以上是关于二项式分布预测新生儿的主要内容,如果未能解决你的问题,请参考以下文章

glmer - 使用二项式数据进行预测(cbind 计数数据)

常用的概率分布:二项式分布,贝塔分布,狄里克雷分布

如何将预测添加到多项式回归

拓端tecdat|R语言编程指导用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值

近似 R 中二项式随机变量之和的分布

二元变量(伯努利分布二项式分布以及Beta分布)