论概率:从局部随机性到整体确定性

Posted Debroon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论概率:从局部随机性到整体确定性相关的知识,希望对你有一定的参考价值。

 


概率计算

概率计算三原则

所有概率问题,都基于三个计算法则:

  • 排列: P n r = n ! ( n − r ) ! P^{r}_{n} = \\frac{n!}{(n-r)!} Pnr=(nr)!n!、组合: C n r = n ! r ! ( n − r ) ! C^{r}_{n} = \\frac{n!}{r!(n-r)!} Cnr=r!(nr)!n!
  • 加法法则:如果事件 A 和 事件 B 相互排斥,而事件 A 有 p 种产生方式,事件 B 有 q 种产生方式,则事件 " A B " 有 p + q 种产生方式。
  • 乘法法则:如果事件 A 和 事件 B 相互独立,且事件 A 有 p 种产生方式,事件 B 有 q 种产生方式,则事件 " A B " 有 p * q 种产生方式。

排列组合法则适用于结果有限,而且每种结果都是等可能性的情况。

如果说排列组合法则是针对单个随机事件的概率计算,加法法则针对的就是多个随机事件。

以两个随机事件为例,一个随机事件发生或者另一个随机事件发生的概率,也就是这两个随机事件发生其一的概率,等于两个随机事件各自发生概率的和。

三个随机事件,就是三个概率之和;四个随机事件,就是四个概率之和,这就是加法法则。

不过,加法法则也有个限定条件,就是这两个随机事件不能同时发生,我们也称之为 “互斥”。

和加法法则一样,乘法法则也是针对多个随机事件的概率计算。

以两个随机事件为例,加法法则是两个随机事件发生其一的概率,将两个随机事件各自发生的概率相加。而乘法法则是两个独立事件同时发生的概率,将两个随机事件各自发生的概率相乘就行了。

不过,乘法法则也有个限定条件,得是独立事件(如果随机事件之间没有任何关联,我们就可以说这些随机事件是相互独立的,它们之间就具备独立性)。

  • 如果是独立事件,彼此互不影响,可以直接使用乘法法则。
  • 如果是非独立事件,那就不能直接乘了,而是要对乘法法则做个变形。

加法原理和乘法原理最重要的区别是事件 A 和 事件 B 的关系,是 “” 还是 “”。

一些其他计算公式,在做题之前,全部写在草稿上:

  • 独立事件: P ( A B ) = P ( A ) P ( B ) 、 P ( A ∣ B ) = P ( A ) P(AB)=P(A)P(B)、P( A| B)=P(A) P(AB)=P(A)P(B)P(AB)=P(A)
  • 减法公式: P ( A B ‾ ) = P ( A − B ) = P ( A ) − P ( A B ) P(A\\overline{B})=P(A-B)=P(A)-P(AB) P(AB)=P(AB)=P(A)P(AB)、若 A ⊂ B A \\subset B AB,则 P ( B − A ) = P ( B ) − P ( A ) P(B-A)=P(B)-P(A) P(BA)=P(B)P(A)
  • 加法公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \\cup B)=P(A)+P(B)-P(AB) P(AB)=P(A)+P(B)P(AB)
  • 条件概率: P ( B ∣ A ) = P ( A B ) P ( A ) P( B| A)=\\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)
  • 事件互斥: P ( A B ) = 0 P(AB)=0 P(AB)=0
  • 事件对立: P ( A ‾ ) = 1 − P ( A ) P(\\overline{A})=1-P(A) P(A)=1P(A)
  • 对偶原则: A ∪ B ‾ = A B ‾ 、 A ‾   B ‾ = A ∪ ‾ B \\overline{A \\cup B}=\\overline{AB}、\\overline{A} ~\\overline{B}=A \\overline{\\cup} B AB=ABA B=AB

写完后,对着找就可以了。
 


学概率论拼的不是数学,而是语文能力

正因为概率计算简单,所以概率论考试的时候,老师只能把题目描述得非常复杂。什么“或”“同时”“有放回”“无放回”,一字之差,结果就天壤之别。

大部分人不会做概率题,不是他不会计算,而是他没看明白题目。也许打败他的不是数学,而是语文。真正搞懂题目的意思,才是概率论考试的重点。

概率老师这么做是为啥呢?是为了故意把学生卡住,不让他毕业吗?当然不是。这其实是一种思维方式的训练。

让学生在复杂的题目中,寻找“或”,寻找“与”,辨析互斥,辨析独立,计算和分辨各种复杂的排列组合,从而学会把考卷上的题目翻译成一个概率问题。

要知道,我们在实际生活中遇到的概率问题,可远比加减乘除困难,甚至比考卷上设定的题目更难。现实中我们不会计算概率,往往就是因为不会把一个现实问题,准确地翻译成“对”的概率问题。

确切的说,学概率论拼的不是数学,而是语文能力。

比如,王家先后有两个孩子,已知老大是女孩,问另一个是男孩的概率是多少?

这很简单,老大的性别已经确定了,所以老二要么是男孩,要么是女孩,概率就是1/2嘛。

但是,只要改变条件里的一个词,把 “老大是女孩” 变成 “其中一个是女孩”,就改了一个词,这时候概率就变了。两个孩子,其中一个是女孩,就有 “女孩男孩、男孩女孩、女孩女孩” 三种情况,有男孩的情况有两种,所以另一个是男孩的概率马上就变大了,从 1 2 \\frac{1}{2} 21 变成了 1 3 \\frac{1}{3} 31。是不是很神奇?
 


概率计算四步法

我们对于什么的概率是多少的问题,概率计算四步法可以快速找到解题思路:

  • 找到样本空间:把所有可能情况都排出来(树状图画出来)
  • 找到目标事件:···的概率是多少(树状图中标记这部分)
  • 确定结果概率:每个可能结果的概率(算出树状图每条边的概率)
  • 计算事件概率:套用公式得出结果
     

条件概率:一切概率都是条件概率

所谓的条件概率,通俗来讲就是,如果一个随机事件的概率会因为某个条件而产生变化,那在这个条件发生的情况下,这个随机事件发生的概率就是条件概率。

其实严格来说,所有的概率问题都是基于条件的。

当我们说 “硬币正面朝上的概率是50%” 时,其实就隐含了很多条件。比如“这个硬币是公平的”、“抛硬币的手法没问题”、“空气密度不影响硬币的结果”、“气流不会对硬币产生干扰”等。

一切概率都是条件概率,那么,操纵条件,改变概率。

1994年,美国洛杉矶发生了一场恶性凶杀案,两名白人被杀,橄榄球明星辛普森杀妻事件。

辛普森有多次家暴前妻的记录,从家暴到杀人,是很有可能的。

而辛普森的律师天团,操纵条件,改变概率,以证明家暴和谋杀没有必然关系。

  • P ( 丈 夫 谋 杀 ∣ 丈 夫 家 暴 ) P(丈夫谋杀|丈夫家暴) P():美国有 400 万被家暴的妻子,但只有 1432 名被丈夫谋杀,这个概率只有 1432 除以 400 万,比 1/2500 还低。所以,家暴证明不了辛普森谋杀。

你看,律师天团其实说的是,在家暴这个条件下,一个人谋杀妻子的概率并不会大大增加,所以不能判定辛普森有罪。

但是,律师天团故意忽略了一个条件 — 辛普森的妻子已经被杀害。

一旦 “前妻已经被杀害” 这个条件出现,问题就不再是 “在家暴的条件下,丈夫谋杀妻子的概率是多少” 了,而是变成了 “在丈夫家暴妻子,而且妻子已经死于谋杀的双重条件下,杀人凶手是丈夫的概率是多少”。

  • P ( 丈 夫 谋 杀 ∣ 丈 夫 家 暴 且 妻 子 死 亡 ) P(丈夫谋杀|丈夫家暴且妻子死亡) P()

如果有 100000 个被丈夫家暴过的妇女,那么其中大概有40个妇女最终会被丈夫谋杀(1/2500×100000=40)。

而根据美国联邦调查局于 1992 年发布的女性被谋杀的数据推算,每 100000 个被家暴的妇女中有 43 个会被谋杀。所以,有 3 个妇女被丈夫以外的人谋杀,其余 40 人都是被丈夫谋杀了。

条件概率的计算如下:

  • 事件A:妻子被丈夫杀害
  • 事件B:妻子被家暴且妻子死亡

则在妻子被家暴且被谋杀的双重条件下,妻子是被丈夫杀害的概率:

  • P ( A │ B ) = P ( A B ) P ( B ) = ( 40 100000 ) / ( 40 + 3 100000 ) = 0.93 P(A│B)=\\frac{P(AB)}{P(B)} =(\\frac{40}{100000})/(\\frac{40+3}{100000})=0.93 P(AB)=P(B)P(AB)=(10000040)/(10000040+3)=0.93

相关性高达:93%,这个条件概率要远远高于 1 2500 \\frac{1}{2500} 25001
 


机器翻译

条件概率: P ( B ∣ A ) = P ( A B ) P ( A ) P( B| A)=\\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)

  • P ( B ∣ A ) P(B|A) P(BA):条件概率,表示在 A 条件下 B 发生的概率
  • P ( A B ) P(AB) P(AB):条件 A、事件 B 同时发生的概率
  • P ( A ) P(A) P(A):条件 A 发生的概率

在文本中的两个词 A 和 B,前面的词就是后面的词的条件,比如 A 是中药,B 是人参,反过来也成立,A 是人参,B 是中药。

于是,就有一个想法:

  • P ( B ∣ A ) = P ( A B ) P ( A ) P( B| A)=\\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)
  • P ( A ∣ B ) = P ( A B ) P ( B ) P( A| B)=\\frac{P(AB)}{P(B)} P(AB)=P(B)P(AB)

我们把俩个式子都变形: