概率论和数理统计_07_频率学派和贝叶斯学派基本知识

Posted hisweety

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了概率论和数理统计_07_频率学派和贝叶斯学派基本知识相关的知识,希望对你有一定的参考价值。

频率学派与贝叶斯学派都是解决统计推断问题。
频率学派也称为经典学派。此学派将事件发生的概率看出一种固定的值。
贝叶斯学派将事件发生的概率看出一个随机变量。
例如:对某个煤矿的煤存储里描述中,经典学派描述煤存储A=10Kg,。贝叶斯对煤存储A描述在10KG左右,然后根据历史资料或其他信息,推测2<A<8,概率为80%,其他情况概率为20%。
技术图片

统计推断有三个要点:1.抽样分析 2.参数估计 3.假设检验。三个重要的信息源:1.总体信息 2.样本信息 3.先验信息
两个学派都会用到总体信息和样本信息,而贝叶斯学派增加了‘先验信息“这一信息源的利用。

贝叶斯统计案例1:拉普拉斯在1786年研究了巴黎男婴的出生率是否大于0.5.

第一步:似然函数
设婴儿出生的事件A,只有两种可能。出生和不出生,故符合二项式分布X~b(n,p)。
故其出生率({P left( X=x left| heta left) =Cmathop{{}} olimits_{{n}}^{{x}} heta mathop{{}} olimits^{{x}} left( 1- heta left) mathop{{}} olimits^{{n-x}},x=0,1,...,n ight. ight. ight. ight. ight. })
这就是似然函数,A事件发生下的概率。
如果是严格的似然函数,应转换成向量的分布。
({P left( overline {X} left| heta left) ={mathop{ prod }limits_{{i=1}}^{{n}}{P left( x=xmathop{{}} olimits_{{i}} left| heta ight) ight. }} ight. ight. ight. })
第二步:先验条件
如果确定先验条件,这里有一项原则可以利用。假如对某个事件一无所知时,可以先假设事件在某个区间内是均匀分布(即贝叶斯假设原理:即同等无知的原则,认知是一样的)。按这个假设条件,得到θ的先验分布函数。
({ pi left( heta left) { left{ egin{array}{*{20}{l}} {1,0 le heta le 1;}{0,other;} end{array} ight. } ight. ight. })

第三步:对似然函数与先验发布函数进行乘积,得到联合密度函数。
({h left( x, heta left) =Cmathop{{}} olimits_{{n}}^{{x}} heta mathop{{}} olimits^{{x}} left( 1- heta left) mathop{{}} olimits^{{n-x}},0 le heta le 1 ight. ight. ight. ight. })
看到上和每一步的似然函数一样,但其意义是不同的。

第四点:求出m(x)边际分布
({m left( x left) ={mathop{ int }limits_{{ heta }}^{{}}{h left( x, heta left) d heta ight. ight. }} ight. ight. })

第五点:得到后验分布(贝叶斯分布)
({ pi left( heta left| x left) =frac{{h left( x, heta ight) }}{{m left( x ight) }}=frac{{P left( x left| heta left) pi left( heta ight) ight. ight. ight. }}{{{mathop{ int }limits_{{ heta }}^{{}}{P left( {x left| heta ight. } ight) }}{ pi left( heta ight. } ext{)}d heta }} ight. ight. ight. })
第六点:根据有限样本,代入到后验分布公式中
比如收集数据发现1745至1770年出生,男婴251527,女婴241945女婴。
({P left( heta le 0.5 left| x left) ={mathop{ int }limits_{{0}}^{{0.5}}egin{array}{*{20}{l}} { pi left( dx left) d heta =1.15 imes 10mathop{{}} olimits^{{-42}} ight. ight. }{} end{array}} ight. ight. ight. })
θ小于0.5的概率很小,故

({ heta > 0.5 ext{是} ext{此} ext{结} ext{果} ext{被} ext{证} ext{明}})

以上是关于概率论和数理统计_07_频率学派和贝叶斯学派基本知识的主要内容,如果未能解决你的问题,请参考以下文章

《概率统计》经典统计推断:寻找最大似然

贝叶斯分类器(1)贝叶斯决策论概述、贝叶斯和频率、概率和似然

贝叶斯原理

聊一聊机器学习中的频率学派及贝叶斯学派

贝叶斯分类器理论基础

统计学中的频率学派与贝叶斯学派