极大似然估计——为什么对于离散属性,极大似然估计法得到的类条件概率等于频率?
Posted Vic时代
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了极大似然估计——为什么对于离散属性,极大似然估计法得到的类条件概率等于频率?相关的知识,希望对你有一定的参考价值。
极大似然估计就是最大化对数似然。
假设第c类有K个样本。属性取值为N种,表示为集合X,且取第i个属性值的样本共有 ki k i 个,显然有
∑i=1Nki=K. ∑ i = 1 N k i = K .极大似然估计首先假设
P(x|c)=f(x,θc)
P
(
x
|
c
)
=
f
(
x
,
θ
c
)
,这个
f(x,θc)
f
(
x
,
θ
c
)
是自己设定的,比如对于连续的属性,可以假设
f
f
是高斯概率密度函数。但是这里是离散的情况,所以假设
注意,
f
f
是概率密度函数,要满足概率条件,即
然后,极大似然估计希望概率分布最大化对数似然:
于是我们得到离散属性情况下的优化目标:
解这个优化问题,得到最优解为
也就是在离散情况下,极大似然估计得到的概率就是频率。
对于高斯分布,同样的方法进行推理,只是 f f <script id="MathJax-Element-36" type="math/tex">f</script>的形式不同而已。
以上是关于极大似然估计——为什么对于离散属性,极大似然估计法得到的类条件概率等于频率?的主要内容,如果未能解决你的问题,请参考以下文章