一维随机变量及其概率分布

Posted 夕月一弯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一维随机变量及其概率分布相关的知识,希望对你有一定的参考价值。

1. 随机变量的概念

顾名思义,随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离。但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理。

根据随机变量其可能取的值的全体的性质,可以把随机变量分为2大类,一类是离散型随机变量,比如检验100件产品中的次品个数;一类是连续型随机变量,比如一个灯泡的寿命。但是连续型变量这个概念只是数学上的抽象,因为任何量都有单位,都只能在该单位下量到一定的精度,所以也一定是离散的,比如灯泡的寿命如果只精确到秒,那它的寿命也是可以离散表示的。

研究随机变量的根本原因是,我们需要研究一些事物身上表现出来的会变动的因子,这些因子的值随机而定,但可能存在某种规律(比如总是取到某些特殊的值),我们需要研究这些规律(比如分布规律),而对这些因子做预测。

2. 离散型随机变量的分布

我们研究随机变量,并不是只关心它能取到哪些值,往往也关心的是它取到某些值的频率如何,即取到该值的概率。这个特性,我们称之为分布。

定义2.1

X为离散型随机变量,其全部的可能值为{a1,a2,},则

 

pi=P(X=ai),i=1,2,

 

称为X的概率函数。且有下面的性质:

 

pi0,p1+p2+=1

 

X的概率函数给出了:全部概率1是如何在其可能的值之间分配的,所以也把它称为随机变量X的“概率分布”。 因为离散型的随机变量的概率分布通常以一个表的形式给出,所以有时把它称为X的分布表。

 

可能值概率a1p1a2p2aipi

 

定义2.2

X为一随机变量,则函数

 

P(Xx)=F(x),<x<

 

称为X的分布函数。

对离散型随机变量而言,概率函数与分布函数在下述意义下是等价的。

 

F(x)=P(Xx)={i:aix}pi

 

piF(x)是显然的,而由F(x)pi,只需注意:

 

F(i)=P(Xi)=P(Xi1)+P(X=i)

 

对于任何随机变量X,其分布函数F(x)具有下面的一般性质:

1)F(x)是单降非降的:当(x1<x2)时,有F(x1)F(x2)

2)当x时,F(x)1;当x时,F(x)0

研究分布函数的直接原因是可以根据分布函数求概率,另一个原因我觉得是针对于连续型随机变量,因为它研究取某个值的概率没有意义,所以更多的关心的一个范围,比哪灯光寿命1万小时-1.2万小时的可能性大小,像这样范围内的概率用分布函数更容易求得。

3. 几个常见的离散型分布

3.1. 二项分布

某事件A在一次试验中发生的概率为p。现在把这个试验独立重复n次,以XA在这n次试验中发生的次数,则n可能的取值为0,1,,n,我们称随机变量X服从二项分布,记为:XB(n,p),同时这种试验称为伯努利试验。

 

pi=b(i;n,p)=(ni)pi(1p)ni,i=0,1,,n

 

X=k表示n次试验中,事件A恰好发生了k次,那么一共有(nk)种途径,而且每种途径发生的概率都为pk(1p)nk(加法公式)。

在研究连续型随机变量分布后,我们发现二项分布概率分布与高斯分布密度函数曲线一致。

3.2. 泊松分布

若随机变量X可能的取值为0,1,2,,且概率分布为

 

P(X=i)=eλλi/i!

 

则称X服从泊松分布,记为XP(λ),此处λ>0是一常数。

Poisson分布是用来描述稀有事件的概率的,比如:一定时间内红绿灯口发生事故的次数和总机接到电话的次数。

Poisson分布实际上是在n很大,p很小时,二项分布的一个近似:

p很小时,(1p)ep[泰勒展开,取前2项],所以(1p)nkep(nk)epn=eλ

n很大时,bn,k=n(n1)(nk+1)k!pk(1p)nknkpkk!(1p)nk=λkk!eλ

3.3. 超几何分布

设有N个产品,其中有M个不合格品,若从中不放回地随机抽取n个,则其中含有的不合格品的个数X服从超几何分布,记为Xh(n,N,M),超几何分布的概率分布列为:

 

P(X=k)=(Mk)(NMnk)(Nn),k=0,1,,r

 

其中r=min{M,n},且MN,nN,n,N,M

nN时,即抽取个数n远小于产品总数N时,每次抽取后体中的不合格率p=M/N改变甚微,所以不放回抽样,可以近似地看成回抽样,这里超几何分布可以用二项分布近似。

 

(Mk)(NMnk)(Nn)(nk)pk(1p)nkp=MN

 

3.4. 几何分布

在伯努利试验序列中,记每次试验中事件A发生的概率为p,如果X为事件A首次出现时的试验次数,则X可能取值为1,2,,称X服从几何分布,记为XGe(p),其分布列为:

 

P(X=k)=(1p)k1p,k=1,2,

 

几何分布的无记忆性:设XGe(p),则对任意正整数m与n有

 

P(X>m+n|X>m)=P(X>n)

 

上面这个公式表明在一系列的事件中,若前m次实验中事件A没有出现,则接下来的n次试验中A仍未出现的概率只与n有关,似乎忘记了前m次试验结果。

3.5. 负二项分布

在伯努利试验序列中,记每次试验中事件A发生的概率为p,如果X为事件A第r次出现时的试验次数,则X可能的取值为r,r+1,,r+m,,称X服从负二项分布或巴斯卡分布,记为XNb(r,p),概率分布为:

 

P(X=k)=(k1r1)pr(1p)kr,k=r,r+1,

 

4. 连续型随机变量分布

对于连续型变量的概率分布,不能用像离散型变量那种方法去描述。原因在于,这种变量的取值充满一个区间,无法一一排出。若指定一个值a,则变量X恰好是a一丝不差,事实上不可能,即,对于连续型随机变量X而言,在区间内任意一点的概率P(X=xi)=0,但是你要注意虽然概率为0,但是并不是说事件X=xi是不可能事件。

刻画连续型随机变量的概率分布的一个方法是利用概率分布函数,但是在理论和实用上更方便因则更常用的方法,是使用所谓“概率密度函数”或简称密度函数。

定义4.1

设连续性随机变量X有概率分布函数F(x),则F(x)的层数f(x)=F(x),称为X的概率密度函数。

连续型随机变量X的密度函数f(x)都具有以下三条基本性质:

1)f(x)0

2)f(x)dx=1

3)对任何常数a<bP(aXb)=F(b)F(a)=ba(x)dx以上是关于一维随机变量及其概率分布的主要内容,如果未能解决你的问题,请参考以下文章

一维随机变量及其概率分布

概率论与数理统计

chap2随机变量及其分布

第三部分 概率_2 一维随机变量的分布

matlab一维概率分布和均匀分布的区别

概率:一维随机变量函数的分布