人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布
Posted LaoYuanPython
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布相关的知识,希望对你有一定的参考价值。
一、引言
在《人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布》介绍了连续随机变量概率分布及概率密度函数以及正态分布,《人工智能数学基础–概率与统计13:连续随机变量的标准正态分布》介绍了标准正态分布,本文将继续介绍几个连续随机变量的分布函数。
二、指数分布
2.1、定义
若随机变量X有概率密度函数:
f
(
x
)
=
0
当
x
≤
0
时
λ
e
−
λ
x
当
x
>
0
时
f(x) = \\Huge \\\\huge^λe^-λx\\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时
f(x)=0当x≤0时λe−λx当x>0时
则称X服从指数分布,其中λ为参数,其值大于0,当x大于0时,-λx为负数,因此该分布也称为负指数分布。
对于指数分布来说,当x≤0时,f(x)= 0,表示随机变量取负值的概率为0,故X只取正值,函数f(x)在x=0处不连续。
2.2、指数分布的分布函数
指数分布的分布函数 F ( x ) = ∫ − ∞ x f ( t ) d ( t ) = 0 当 x ≤ 0 时 1 − e − λ x 当 x > 0 时 F(x)=∫_-∞^xf(t)d(t)\\\\\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;= \\Huge \\\\Large^1-e^-λx\\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时 F(x)=∫−∞xf(t)d(t)=0当x≤0时1−e−λx当x>0时
2.3、指数分布的适用场景及推导
指数分布最常见的一个场景是寿命分布。
设想一种大批生产的电子元件,其寿命X 是随机变量,以F(x)记X的分布函数。证明:在一定的条件下,F(x)就是指数分布的分布函数。
为了证明要进行技术上“无老化”的假定,就是说,“元件在时刻x尚为正常工作的条件下,其失效率总保持为某个常数λ>0,与x无关。失效率就是单位长度时间内失效的概率。用条件概率的形式,上述假定可表达为:
P
(
x
≤
X
≤
x
+
h
∣
X
>
x
)
/
h
=
λ
(
h
→
0
)
P(x≤X≤x+h|X>x)/h=λ\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;(h→0)
P(x≤X≤x+h∣X>x)/h=λ(h→0)
此式解释如下:
- 元件在时刻x时尚正常工作,表示其寿命大于x,即X>x;
- 在x处,长为h的时间段内失效,即x≤X≤x+h;
- 把这个条件概率除以时间段的长h,即得在x时刻的平均失效率;
- 令h→0,得瞬时失效率,按假定,它应为常数λ。
按条件概率的定义,注意到P(X>x)=1-F(x),又
X
>
x
x
≤
X
≤
x
+
h
=
x
<
X
≤
x
+
h
\\X>x\\\\x≤X≤x+h\\=\\x<X≤x+h\\
X>xx≤X≤x+h=x<X≤x+h
有
P
(
x
≤
X
≤
x
+
h
∣
X
>
x
)
/
h
=
P
(
x
<
X
≤
x
+
h
)
/
(
h
(
1
−
F
(
x
)
)
)
=
(
F
(
x
+
h
)
−
F
(
x
)
)
/
h
]
/
(
1
−
F
(
x
)
)
→
F
′
(
x
)
/
(
1
−
F
(
x
)
)
=
λ
P(x≤X≤x+h|X>x)/h=P(x<X≤x+h)/(h(1-F(x)))\\\\=(F(x+h)-F(x))/h]/(1-F(x))\\\\→F'(x)/(1-F(x))=λ
P(x≤X≤x+h∣X>x)/h=P(x<X≤x+h)/(h(1−F(x)))=(F(x+h)−F(x))/h]/(1−F(x))→F′(x)/(1−F(x))=λ
这个微分方程的通解为
F
(
x
)
=
1
−
C
e
−
λ
x
F(x)=1-Ce^-λx
F(x)=1−Ce−λx(x>0),当x≤0时,F(x)为0。常数C可用初始条件F(0)=0求出为1。
老猿注:
- 上面这个推导过程用到了极限的定义、条件概率公式、条件概率定义、分布函数的定义及性质,挺有意思的一个推导过程;
-
F
(
x
)
=
1
−
C
e
−
λ
x
F(x)=1-Ce^-λx
F(x)=1−Ce−λx(x>0)是通过微分方程求解得到的,这个过程老猿演示如下:
设F(x)=y,则F ′ (x)/(1−F(x))=λ可以化为dy/(dx(1-y))=λ,则可得:
dy/(1-y)=λdx,对该式两边求积分:∫ dy/(1-y)=∫λdx,则得到:
-ln(1-y)+c1 = λx+c2
∴ln(1-y)=-λx+c3
∴ 1 − y = e − λ x + c 3 = e c 3 e − λ x = C e − λ x 1-y=e^-λx+c3=e^c3e^-λx=Ce^-λx 1−y=e−λx+c3=ec3e−λx=Ce−λx
∴y=1- C e − λ x Ce^-λx Ce−λx
注意整个推导过程中常数的和差幂运算的结果还是常数,因此有c1、c2、c3和C。
2.4、补充说明
从上面的推导过程可以知道λ的意义就是失效率,失效率越高,平均寿命就越小,因此指数分布描述了无老化时的寿命分布,但实际中“无老化”是不可能的,因而指数分布只是一种近似的寿命分布。对一些寿命长的元件,在初期阶段,老化现象很小,在这一阶段指数分布比较准确相当描述了其寿命分布。
三、威布尔分布
如果将指数分布推导过程中考虑老化的情况,则失效率会随时间上升而上升,故应取为一个x的增函数
λ
x
m
λx^m
λxm,其中λ和m都为大于0的常数。在这个条件下,按指数分布的推理,将得出:寿命分布F(x)满足微分方程
F
′
(
x
)
/
[
1
−
F
(
x
)
]
=
λ
x
m
F'(x)/[1-F(x)]=λx^m
F′(x)/[1−F(x)]=λxm
结合F(0)=0,得出:
F
(
x
)
=
1
−
e
−
(
λ
/
(
m
+
1
)
)
x
m
+
1
F(x) = 1-e^-(λ/(m+1))x^m+1
F(x)=1−e−(λ/(m+1))xm+1
取α = m+1(α>1),并把λ/(m+1)记为λ,得出:
F
(
x
)
=
1
−
e
−
λ
x
α
(
x
>
0
)
F(x)=1-e^-λx^α \\;\\;\\;\\;\\;\\;\\;\\;(x>0)
F(x)=1−e−λxα(x>0)
而当x≤0时F(x)=0,此时的函数F(x)就称为威布尔分布函数。此分布的密度函数为:
f
(
x
)
=
0
当
x
≤
0
时
λ
α
x
α
−
1
e
−
λ
x
α
当
x
>
0
时
f(x) = \\Huge \\\\huge^λαx^α -1e^-λx^α \\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时
f(x)=0当x≤0时λαxα−1e−λxα当x>0时
威布尔分布和指数分布一样,在可靠性统计分析中占据重要地位,实际上指数分布是威布尔分布的α=1的特例。
三、均匀分布
3.1、定义
设随机变量X有概率密度函数: 以上是关于人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布的主要内容,如果未能解决你的问题,请参考以下文章 人工智能数学基础--概率与统计13:连续随机变量的标准正态分布 人工智能数学基础--概率与统计13:连续随机变量的标准正态分布 人工智能数学基础--概率与统计12:连续随机变量的概率密度函数以及正态分布
f
(
x
)
=
0
其
他
1
b
−