贝叶斯定理推导(Bayes' Theorem Induction)

Posted huzihu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了贝叶斯定理推导(Bayes' Theorem Induction)相关的知识,希望对你有一定的参考价值。

这里用Venn diagram来不严谨地推导一下贝叶斯定理。

 

假设A和B为两个不相互独立的事件。

 

交集(intersection): 技术分享图片

技术分享图片

上图红色部分即为事件A和事件B的交集。

 

并集(union): 技术分享图片

技术分享图片

技术分享图片

 

由Venn diagram可以看出,在事件B已经发生的情况下,事件A发生的概率为事件A和事件B的交集除以事件B:

技术分享图片

 

同理,在事件A已经发生的情况下,事件B发生的概率为事件A和事件B的交集除以事件A:

技术分享图片

 

注:技术分享图片表示 A,B 事件同时发生的概率,如果 A 和 B 是相互独立的两个事件,那么:技术分享图片

 

由上面的公式可以得到:

技术分享图片

 

然后,我们就可以得到贝叶斯定理

技术分享图片

 

其中: 技术分享图片是先验概率(prior probability),技术分享图片是条件概率,技术分享图片是后验概率(posterior probability)。

 

注:条件概率(conditional probabilities): P(B|A) ---> 给定事件A,事件B发生的概率(probability of event B occuring given event A)。

 

又根据Law of Total Probability: 技术分享图片

 

注:技术分享图片表示事件A不发生的概率。

 

这个可以用probability tree来帮助理解一下:

 技术分享图片

 

因此,贝叶斯定理可以扩展为: 技术分享图片

 

贝叶斯定理通常用于由已知的先验概率和条件概率,推算出后验概率。

 

举一个简单的例子:某地平时下雨的概率是0.3,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,请问这天下雨的概率是多少?

解答:也就是需要求P(下雨|小明带伞),把上面的数字代入公式即:技术分享图片

 

这个例子的先验概率是平时下雨的概率0.3,由于我们已知小明带了伞这一信息,因此我们可以估算出后验概率,也就是当天下雨的概率是0.6。

 

先验概率是怎么得来的呢?通常是人们的经验总结或者说是估算,比如说某地一个月里面下了3天雨,我们就估算某地平时下雨的概率是0.3。

 

如果条件不止一个呢?让我们把上面的例子改一下:某地平时下雨的概率是0.3,平时刮风的概率是0.4,下雨天刮风的概率是0.6,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,且当天在刮风,请问这天下雨的概率是多少?

解答:也就是需要求P(下雨|小明带伞,刮风),把上面的数字代入公式即:

技术分享图片

 

注:假设小明带伞和刮风之间没有关联,两条件互不影响。

 

长久以来,人们信奉的是频率主义。比如把一枚硬币抛10000次,有5000次正面朝上,5000次反面朝上,那么我们就可以得知抛这枚硬币,其正面朝上的概率是0.5。但是通常,我们需要某一事件发生足够多的次数,我们才可以观察到它的规律。

 

在现实生活中,很多事件并不会在相对较短的时间内多次发生。这时候,贝叶斯定理就发挥作用了。比如说我们想知道刮风天下雨的概率是多少,我们不用等10000个刮风天,看其中有几天下了雨。我们只需要估算出下雨天会刮风的概率,平时下雨的概率,平时刮风的概率,就可以估算出刮风天会下雨的概率是多少了。先验概率估算得不准确并没有关系,人们可以通过未来事件的发生情况,不断对后验概率做出调整。

 

以上是关于贝叶斯定理推导(Bayes' Theorem Induction)的主要内容,如果未能解决你的问题,请参考以下文章

朴素贝叶斯(naive bayes)

简要介绍一下贝叶斯定理( Bayes‘ theorem)

详解线性分类-朴素贝叶斯分类器(Naive Bayes Classifer)白板推导系列笔记

朴素贝叶斯(Naive Bayes)算法

朴素贝叶斯算法(Naive Bayes)

朴素贝叶斯(Naive Bayes)