人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布

Posted LaoYuanPython

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布相关的知识,希望对你有一定的参考价值。

一、引言

在《人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布》介绍了连续随机变量概率分布及概率密度函数以及正态分布,《人工智能数学基础–概率与统计13:连续随机变量的标准正态分布》介绍了标准正态分布,本文将继续介绍几个连续随机变量的分布函数。

二、指数分布

2.1、定义

若随机变量X有概率密度函数: f ( x ) = 0                          当 x ≤ 0 时 λ e − λ x          当 x > 0 时 f(x) = \\Huge \\\\huge^λe^-λx\\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时 f(x)=0x0λeλxx>0
则称X服从指数分布,其中λ为参数,其值大于0,当x大于0时,-λx为负数,因此该分布也称为负指数分布

对于指数分布来说,当x≤0时,f(x)= 0,表示随机变量取负值的概率为0,故X只取正值,函数f(x)在x=0处不连续。

2.2、指数分布的分布函数

指数分布的分布函数 F ( x ) = ∫ − ∞ x f ( t ) d ( t )                                              = 0                          当 x ≤ 0 时 1 − e − λ x          当 x > 0 时 F(x)=∫_-∞^xf(t)d(t)\\\\\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;= \\Huge \\\\Large^1-e^-λx\\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时 F(x)=xf(t)d(t)=0x01eλxx>0

2.3、指数分布的适用场景及推导

指数分布最常见的一个场景是寿命分布。

设想一种大批生产的电子元件,其寿命X 是随机变量,以F(x)记X的分布函数。证明:在一定的条件下,F(x)就是指数分布的分布函数。

为了证明要进行技术上“无老化”的假定,就是说,“元件在时刻x尚为正常工作的条件下,其失效率总保持为某个常数λ>0,与x无关。失效率就是单位长度时间内失效的概率。用条件概率的形式,上述假定可表达为:
P ( x ≤ X ≤ x + h ∣ X > x ) / h = λ                          ( h → 0 ) P(x≤X≤x+h|X>x)/h=λ\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;(h→0) P(xXx+hX>x)/h=λ(h0)
此式解释如下

  1. 元件在时刻x时尚正常工作,表示其寿命大于x,即X>x;
  2. 在x处,长为h的时间段内失效,即x≤X≤x+h;
  3. 把这个条件概率除以时间段的长h,即得在x时刻的平均失效率;
  4. 令h→0,得瞬时失效率,按假定,它应为常数λ。

按条件概率的定义,注意到P(X>x)=1-F(x),又 X > x x ≤ X ≤ x + h = x < X ≤ x + h \\X>x\\\\x≤X≤x+h\\=\\x<X≤x+h\\ X>xxXx+h=x<Xx+h
P ( x ≤ X ≤ x + h ∣ X > x ) / h = P ( x < X ≤ x + h ) / ( h ( 1 − F ( x ) ) ) = ( F ( x + h ) − F ( x ) ) / h ] / ( 1 − F ( x ) ) → F ′ ( x ) / ( 1 − F ( x ) ) = λ P(x≤X≤x+h|X>x)/h=P(x<X≤x+h)/(h(1-F(x)))\\\\=(F(x+h)-F(x))/h]/(1-F(x))\\\\→F'(x)/(1-F(x))=λ P(xXx+hX>x)/h=P(x<Xx+h)/(h(1F(x)))=(F(x+h)F(x))/h]/(1F(x))F(x)/(1F(x))=λ
这个微分方程的通解为 F ( x ) = 1 − C e − λ x F(x)=1-Ce^-λx F(x)=1Ceλx(x>0),当x≤0时,F(x)为0。常数C可用初始条件F(0)=0求出为1。

老猿注:

  1. 上面这个推导过程用到了极限的定义、条件概率公式、条件概率定义、分布函数的定义及性质,挺有意思的一个推导过程;
  2. F ( x ) = 1 − C e − λ x F(x)=1-Ce^-λx F(x)=1Ceλx(x>0)是通过微分方程求解得到的,这个过程老猿演示如下:
    设F(x)=y,则F ′ (x)/(1−F(x))=λ可以化为dy/(dx(1-y))=λ,则可得:
    dy/(1-y)=λdx,对该式两边求积分:∫ dy/(1-y)=∫λdx,则得到:
    -ln(1-y)+c1 = λx+c2
    ∴ln(1-y)=-λx+c3
    1 − y = e − λ x + c 3 = e c 3 e − λ x = C e − λ x 1-y=e^-λx+c3=e^c3e^-λx=Ce^-λx 1y=eλx+c3=ec3eλx=Ceλx
    ∴y=1- C e − λ x Ce^-λx Ceλx

注意整个推导过程中常数的和差幂运算的结果还是常数,因此有c1、c2、c3和C。

2.4、补充说明

从上面的推导过程可以知道λ的意义就是失效率,失效率越高,平均寿命就越小,因此指数分布描述了无老化时的寿命分布,但实际中“无老化”是不可能的,因而指数分布只是一种近似的寿命分布。对一些寿命长的元件,在初期阶段,老化现象很小,在这一阶段指数分布比较准确相当描述了其寿命分布。

三、威布尔分布

如果将指数分布推导过程中考虑老化的情况,则失效率会随时间上升而上升,故应取为一个x的增函数 λ x m λx^m λxm,其中λ和m都为大于0的常数。在这个条件下,按指数分布的推理,将得出:寿命分布F(x)满足微分方程 F ′ ( x ) / [ 1 − F ( x ) ] = λ x m F'(x)/[1-F(x)]=λx^m Fx/[1F(x)]=λxm
结合F(0)=0,得出: F ( x ) = 1 − e − ( λ / ( m + 1 ) ) x m + 1 F(x) = 1-e^-(λ/(m+1))x^m+1 F(x)=1e(λ/(m+1))xm+1
取α = m+1(α>1),并把λ/(m+1)记为λ,得出: F ( x ) = 1 − e − λ x α                  ( x > 0 ) F(x)=1-e^-λx^α \\;\\;\\;\\;\\;\\;\\;\\;(x>0) F(x)=1eλxα(x>0)
而当x≤0时F(x)=0,此时的函数F(x)就称为威布尔分布函数。此分布的密度函数为:
f ( x ) = 0                                                  当 x ≤ 0 时 λ α x α − 1 e − λ x α          当 x > 0 时 f(x) = \\Huge \\\\huge^λαx^α -1e^-λx^α \\;\\;\\;\\;当x>0时_0\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;\\;当x≤0时 f(x)=0x0λαxα1eλxαx>0

威布尔分布和指数分布一样,在可靠性统计分析中占据重要地位,实际上指数分布是威布尔分布的α=1的特例。

三、均匀分布

3.1、定义

设随机变量X有概率密度函数:
f ( x ) = 0                                      其 他 1 b −

以上是关于人工智能数学基础--概率与统计14:连续随机变量的指数分布威布尔分布和均匀分布的主要内容,如果未能解决你的问题,请参考以下文章

人工智能数学基础--概率与统计13:连续随机变量的标准正态分布

人工智能数学基础--概率与统计13:连续随机变量的标准正态分布

人工智能数学基础--概率与统计12:连续随机变量的概率密度函数以及正态分布

人工智能数学基础--概率与统计12:连续随机变量的概率密度函数以及正态分布

人工智能数学基础--概率与统计4:联合分布与边缘分布

人工智能数学基础--概率与统计4:联合分布与边缘分布