论概率：从局部随机性到整体确定性

Posted 2021-11-04 Debroon

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了论概率：从局部随机性到整体确定性相关的知识，希望对你有一定的参考价值。

论概率：从局部随机性到整体确定性

概率计算
概率计算三原则
学概率论拼的不是数学，而是语文能力
概率计算四步法

条件概率：一切概率都是条件概率
机器翻译
全概率公式

随机变量
期望：对长期价值的数字化衡量
方差：对风险的度量

概率分布
伯努利分布
二项分布
柏松分布
离散分布
指数分布
正态分布

概率计算

概率计算三原则

所有概率问题，都基于三个计算法则：

排列： $P^{r}_{n} = \\frac{n!}{(n-r)!}$ 、组合： $C^{r}_{n} = \\frac{n!}{r!(n-r)!}$
加法法则：如果事件 A 和事件 B 相互排斥，而事件 A 有 p 种产生方式，事件 B 有 q 种产生方式，则事件 " A 或 B " 有 p + q 种产生方式。
乘法法则：如果事件 A 和事件 B 相互独立，且事件 A 有 p 种产生方式，事件 B 有 q 种产生方式，则事件 " A 与 B " 有 p * q 种产生方式。

排列组合法则适用于结果有限，而且每种结果都是等可能性的情况。

如果说排列组合法则是针对单个随机事件的概率计算，加法法则针对的就是多个随机事件。

以两个随机事件为例，一个随机事件发生或者另一个随机事件发生的概率，也就是这两个随机事件发生其一的概率，等于两个随机事件各自发生概率的和。

三个随机事件，就是三个概率之和；四个随机事件，就是四个概率之和，这就是加法法则。

不过，加法法则也有个限定条件，就是这两个随机事件不能同时发生，我们也称之为 “互斥”。

和加法法则一样，乘法法则也是针对多个随机事件的概率计算。

以两个随机事件为例，加法法则是两个随机事件发生其一的概率，将两个随机事件各自发生的概率相加。而乘法法则是两个独立事件同时发生的概率，将两个随机事件各自发生的概率相乘就行了。

不过，乘法法则也有个限定条件，得是独立事件（如果随机事件之间没有任何关联，我们就可以说这些随机事件是相互独立的，它们之间就具备独立性）。

如果是独立事件，彼此互不影响，可以直接使用乘法法则。
如果是非独立事件，那就不能直接乘了，而是要对乘法法则做个变形。

加法原理和乘法原理最重要的区别是事件 A 和事件 B 的关系，是 “或” 还是 “与”。

一些其他计算公式，在做题之前，全部写在草稿上：

独立事件： $P (A B) = P (A) P (B) 、 P (A ∣ B) = P (A)$
减法公式： $P(A\\overline{B})=P(A-B)=P(A)-P(AB)$ 、若 $\\subset B$ ，则 $P (B - A) = P (B) - P (A)$
加法公式： $\\cup B)=P(A)+P(B)-P(AB)$
条件概率： $A)=\\frac{P(AB)}{P(A)}$
事件互斥： $P (A B) = 0$
事件对立： $P(\\overline{A})=1-P(A)$
对偶原则： $\\overline{A \\cup B}=\\overline{AB}、\\overline{A} ~\\overline{B}=A \\overline{\\cup} B$

写完后，对着找就可以了。

学概率论拼的不是数学，而是语文能力

正因为概率计算简单，所以概率论考试的时候，老师只能把题目描述得非常复杂。什么“或”“同时”“有放回”“无放回”，一字之差，结果就天壤之别。

大部分人不会做概率题，不是他不会计算，而是他没看明白题目。也许打败他的不是数学，而是语文。真正搞懂题目的意思，才是概率论考试的重点。

概率老师这么做是为啥呢？是为了故意把学生卡住，不让他毕业吗？当然不是。这其实是一种思维方式的训练。

让学生在复杂的题目中，寻找“或”，寻找“与”，辨析互斥，辨析独立，计算和分辨各种复杂的排列组合，从而学会把考卷上的题目翻译成一个概率问题。

要知道，我们在实际生活中遇到的概率问题，可远比加减乘除困难，甚至比考卷上设定的题目更难。现实中我们不会计算概率，往往就是因为不会把一个现实问题，准确地翻译成“对”的概率问题。

确切的说，学概率论拼的不是数学，而是语文能力。

比如，王家先后有两个孩子，已知老大是女孩，问另一个是男孩的概率是多少？

这很简单，老大的性别已经确定了，所以老二要么是男孩，要么是女孩，概率就是1/2嘛。

但是，只要改变条件里的一个词，把 “老大是女孩” 变成 “其中一个是女孩”，就改了一个词，这时候概率就变了。两个孩子，其中一个是女孩，就有 “女孩男孩、男孩女孩、女孩女孩” 三种情况，有男孩的情况有两种，所以另一个是男孩的概率马上就变大了，从 $\\frac{1}{2}$ 变成了 $\\frac{1}{3}$ 。是不是很神奇？

概率计算四步法

我们对于什么的概率是多少的问题，概率计算四步法可以快速找到解题思路：

找到样本空间：把所有可能情况都排出来（树状图画出来）
找到目标事件：···的概率是多少（树状图中标记这部分）
确定结果概率：每个可能结果的概率（算出树状图每条边的概率）
计算事件概率：套用公式得出结果

条件概率：一切概率都是条件概率

所谓的条件概率，通俗来讲就是，如果一个随机事件的概率会因为某个条件而产生变化，那在这个条件发生的情况下，这个随机事件发生的概率就是条件概率。

其实严格来说，所有的概率问题都是基于条件的。

当我们说 “硬币正面朝上的概率是50%” 时，其实就隐含了很多条件。比如“这个硬币是公平的”、“抛硬币的手法没问题”、“空气密度不影响硬币的结果”、“气流不会对硬币产生干扰”等。

一切概率都是条件概率，那么，操纵条件，改变概率。

1994年，美国洛杉矶发生了一场恶性凶杀案，两名白人被杀，橄榄球明星辛普森杀妻事件。

辛普森有多次家暴前妻的记录，从家暴到杀人，是很有可能的。

而辛普森的律师天团，操纵条件，改变概率，以证明家暴和谋杀没有必然关系。

$P (丈夫谋杀 ∣ 丈夫家暴)$ ：美国有 400 万被家暴的妻子，但只有 1432 名被丈夫谋杀，这个概率只有 1432 除以 400 万，比 1/2500 还低。所以，家暴证明不了辛普森谋杀。

你看，律师天团其实说的是，在家暴这个条件下，一个人谋杀妻子的概率并不会大大增加，所以不能判定辛普森有罪。

但是，律师天团故意忽略了一个条件 — 辛普森的妻子已经被杀害。

一旦 “前妻已经被杀害” 这个条件出现，问题就不再是 “在家暴的条件下，丈夫谋杀妻子的概率是多少” 了，而是变成了 “在丈夫家暴妻子，而且妻子已经死于谋杀的双重条件下，杀人凶手是丈夫的概率是多少”。

$P (丈夫谋杀 ∣ 丈夫家暴且妻子死亡)$

如果有 100000 个被丈夫家暴过的妇女，那么其中大概有40个妇女最终会被丈夫谋杀（1/2500×100000=40）。

而根据美国联邦调查局于 1992 年发布的女性被谋杀的数据推算，每 100000 个被家暴的妇女中有 43 个会被谋杀。所以，有 3 个妇女被丈夫以外的人谋杀，其余 40 人都是被丈夫谋杀了。

条件概率的计算如下：

事件A：妻子被丈夫杀害
事件B：妻子被家暴且妻子死亡

则在妻子被家暴且被谋杀的双重条件下，妻子是被丈夫杀害的概率：

$P(A│B)=\\frac{P(AB)}{P(B)} =(\\frac{40}{100000})/(\\frac{40+3}{100000})=0.93$

相关性高达：93%，这个条件概率要远远高于 $\\frac{1}{2500}$ 。

机器翻译

条件概率： $A)=\\frac{P(AB)}{P(A)}$

$P (B ∣ A)$ ：条件概率，表示在 A 条件下 B 发生的概率
$P (A B)$ ：条件 A、事件 B 同时发生的概率
$P (A)$ ：条件 A 发生的概率

在文本中的两个词 A 和 B，前面的词就是后面的词的条件，比如 A 是中药，B 是人参，反过来也成立，A 是人参，B 是中药。

于是，就有一个想法：

$A)=\\frac{P(AB)}{P(A)}$
$B)=\\frac{P(AB)}{P(B)}$

我们把俩个式子都变形：

$P (A B) = P (B ∣ A) * P (A)$