多项式变量(多项式分布,狄利克雷分布)

Posted lvbaiyang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了多项式变量(多项式分布,狄利克雷分布)相关的知识,希望对你有一定的参考价值。

概率分布(二)

多项式变量

二元变量表示只可能在两种可能值之中取值,若有(K)个互斥状态,则可以用(1-of-K)表示法。

(K=6),则(oldsymbol{x},oldsymbol{mu})可以表示成:
[ oldsymbol{x}=(0,0,1,0,0,0)^T\boldsymbol{mu}=(mu_1,...,mu_k)^T ]
此时(oldsymbol{x})的分布为((x_k)表示(oldsymbol{x})中第(k)项):
[ p(oldsymbol{x}|oldsymbol{mu})=prod_k mu_k^{x_k} ]
可以把它看作是伯努利分布对于多个输出的推广,并且这个分布也是归一化的:
[ sum_kp(oldsymbol{x}|oldsymbol{mu})=sum_kmu_k=1E(oldsymbol{x}|oldsymbol{mu})=sum_xp(oldsymbol{x}|oldsymbol{mu})oldsymbol{x}=oldsymbol{mu} ]
当有N个独立观测值(oldsymbol{x}_1,...,oldsymbol{x}_N)的数据集(D)时,对应的似然函数为:
[ p(D|oldsymbol{mu})=prod_nprod_kmu_k^{x_{nk}}=prod_kmu_k^{sum x_{nk}}=prod_kmu_k^{m_k} ]
其中(m_k = sum x_{nk}),表示观测(x_k=1)的个数,叫做这个分布的充分统计量(sufficient statistics)。

由于有限制条件(sum mu_k =1),所以在求最大似然函数时要用拉格朗日算子法(求出(mu_k)后代入限制条件里得到(lambda)):
[ max sum_k m_kln mu_k+lambda(sum_kmu_k-1)\mu_{k}=-frac{m_k}{lambda}, lambda = -N\mu_k^{MLE}=frac{m_k}{N} ]
本质上与伯努利分布一样。

多项式分布

考虑(m_1,...,m_k)在参数(oldsymbol{mu})和观察总数(N)的条件下的联合分布,即多项式分布:
[ Mult(m_1,...m_k)|oldsymbol{mu},N)=dbinom{N}{prod_k m_k}prod_kmu_k^{m_k} ]
(dbinom{N}{prod_k m_k})表示相同的N个物体分成(k)组,每组大小为(m_k)的方案数量。
[ dbinom{N}{prod_k m_k}=frac{N!}{m_1!...m_K!}\]
满足条件:(sum_k m_k = N)

狄利克雷分布(Dirichlet distribution)

狄利克雷分布是多项式分布的共轭先验分布,也是将Beta分布推广到高维空间的形式。

观察多项式分布可知共轭先验为:
[ p(oldsymbol{mu}|oldsymbol{alpha}) propto prod_{k=1}^K mu_k^{alpha_k-1} ]
(oldsymbol{alpha})为分布的参数,为((alpha_1,...,alpha_K)^T)(mu_kin[0,1]),且和为1。由于加和的限制,({mu_k})空间上的分布被限制在K-1维的单纯形中。

狄利克雷分布的归一化形式为:
[ Dir(oldsymbol{mu}|oldsymbol{alpha}) =frac{Gamma(alpha_0)}{Gamma(alpha_1)...Gamma(alpha_k)} prod_{k=1}^K mu_k^{alpha_k-1} ]
其中(alpha_0=sum_kalpha_k)

我们用多项式分布当作似然函数乘以先验后得到后验分布:
[ p(oldsymbol{mu}|D,oldsymbol{alpha})propto p(D|oldsymbol{mu})p(oldsymbol{mu}|oldsymbol{alpha})propto prod_k mu_k^{alpha_k+m_k-1} ]
可以看到后验分布形式与先验相同,狄利克雷分布分布确实为多项式分布的共轭先验。确定归一化系数后:
[ p(oldsymbol{mu}|D,oldsymbol{alpha})=frac{Gamma(alpha_0+N)}{Gamma(alpha_1+m_1)...Gamma(alpha_k+m_k)}prod_k mu_k^{alpha_k+m_k-1} ]

高斯分布

由于高斯分布内容过多,另写一章。

参考

狄利克雷分布

以上是关于多项式变量(多项式分布,狄利克雷分布)的主要内容,如果未能解决你的问题,请参考以下文章

(转)Gamma分布,Beta分布,Multinomial多项式分布,Dirichlet狄利克雷分布

二项分布 , 多项分布, 以及与之对应的beta分布和狄利克雷分布

常见概率分布图表总结

「总结」多项式生成函数相关

近似 R 中二项式随机变量之和的分布

第三部分 概率_3 多维随机变量的分布