EM算法的基本原理和推导

Posted vincentbnu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了EM算法的基本原理和推导相关的知识,希望对你有一定的参考价值。

参考: 

从最大似然到EM算法浅解

(EM算法)The EM Algorithm

EM算法的九层境界:Hinton和Jordan理解的EM算法

 

在EM算法的证明中,其实比较好理解,总结如下:

从最大似然估计出发 ====>  将隐变量暴露出来,写出累加/积分的 形式 ===> 引入Q(z),表示隐变量z的概率密度函数

==> 对于log函数,利用 Jensen不等式的变形:  f(E(x)  >= E(f(x)),得到最大似然函数的下界 

===> 对于log函数的Jenson不等式而言,只有当 X的变量取常量时,则可以不等式才能取到等号;

则得到等式;

以上的过程如下:

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

具体的计算过程如下:

技术分享图片

技术分享图片

固定好了Q(z),再去调整参数 Θ ,使得下界最大,如下图所示:

技术分享图片

技术分享图片

收敛性的证明:见参考一或吴恩达的课程

技术分享图片

技术分享图片

--------------------

--------------------

以上是关于EM算法的基本原理和推导的主要内容,如果未能解决你的问题,请参考以下文章

EM算法的原理推导及解释

概率机器学习(开篇)

EM算法和GMM算法的相关推导及原理

Adaboost算法的原理推导及解释

Adaboost算法的原理推导及解释

BP算法基本原理推导----《机器学习》笔记