Maximum likelihood (最大似然估计法)

Posted 凌晨一点

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Maximum likelihood (最大似然估计法)相关的知识,希望对你有一定的参考价值。

最大似然估计法的基本思想
  最大似然估计法的思想很简单:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个 技术分享 作为真 技术分享 的估计。
  我们分两种情进行分析:
  1.离散型总体 

  设 技术分享 为离散型随机变量,其概率分布的形式为 技术分享 ,则样本 技术分享 的概率分布为 技术分享 ,在 技术分享 固定时,上式表示 技术分享 取值 技术分享 的概率;当 技术分享 固定时,它是 技术分享 的函数,我们把它记为 技术分享 并称技术分享为似然函数。似然函数 技术分享 的值的大小意味着该样本值出现的可能性的大小。既然已经得到了样本值 技术分享 ,那它出现的可能性应该是大的,即似然函数的值应该是大的。因而我们选择使 技术分享 达到最大值的那个 技术分享 作为真 技术分享 的估计。


  2.连续型总体
  设 技术分享 为连续型随机变量,其概率密度函数为 技术分享 技术分享 为从该总体抽出的样本。因为 技术分享 相互独立且同分布,于是,样本的联合概率密度函数为
  技术分享 ,在 技术分享 是固定时,它是 技术分享 技术分享 处的 密度,它的大小与 技术分享 落在 技术分享 附近的概率的大小成正比,而当样本值 技术分享 固定时,它是技术分享 的函数。我们仍把它记为 技术分享 并称技术分享为似然函数。类似于刚才的讨论,我们选择使 技术分享 最大的那个 技术分享 作为真 技术分享 的估计。
             

  总之,在有了试验结果即样本值 技术分享 时,似然函数 技术分享 反映了 技术分享 的各个不同值导出这个结果的可能性的大小。 我们选择使 技术分享 达到最大值的那个 技术分享 作为真 技术分享 的估计。这种求点估计的方法就叫作最大似然法。   

  7.2.2 最大似然估计的求法
  假定现在我们已经观测到一组样本 技术分享 要去估计未知参数 技术分享 。一种直观的想法是,哪一组能数值使现在的样本 技术分享 出现的可能性最大,哪一组参数可能就是真正的参数,我们就要用它作为参数的估计值。这里,假定我们有一组样本 技术分享 .如果对参数的两组不同的值 技术分享 技术分享 ,似然函数有如下关系
   技术分享 ,
  那么,从 技术分享 又是概率密度函数的角度来看,上式的意义就是参数 技术分享 使技术分享 出现的可能性比参数 技术分享 使 技术分享 出现的可能性大,当然参数 技术分享 技术分享 更像是真正的参数.这样的分析就导致了参数估计的一种方法,即用使似然函数达到最大值的点技术分享 ,作为未知参数的估计,这就是所谓的最大似然估计。 现在我们讨论求最大似然估计的具体方法.为简单起见,以下记 技术分享 ,求θ的极大似然估计就归结为求 技术分享 的最大值点.由于对数函数是单调增函数,所以
           技术分享         (7.2.1)

 与 技术分享 有相同的最大值点。而在许多情况下,求 技术分享 的最大值点比较简单,于是,我们就将求 技术分享 的最大值点改为求 技术分享 的最大值点.对 技术分享 关于 技术分享 求导数,并命其等于零,得到方程组
          技术分享 ,     技术分享                       (7.2.2)
  称为似然方程组。解这个方程组,又能验证它是一个极大值点,则它必是 技术分享 ,也就是 技术分享 的最大值点,即为所求的最大似然估计。大多常用的重要例子多属于这种情况。然而在一些情况下,问题比较复杂,似然方程组的解可能不唯一,这时就需要进一步判定哪一个是最大值点。
  还需要指出,若函数 技术分享 关于 技术分享 的导数不存在时,我们就无法得到似然方程组 (7.2.2),这时就必须根据最大似然估计的定义直接去 技术分享 的最大值点。
  在一些情况下,我们需要估计 技术分享 。如果 技术分享 分别是 技术分享 的最大似然估计,则称 技术分享 技术分享 的最大似然估计。
  下面我们举一些例子来说明求最大似然估计的方法。

   7.2.1 设从正态总体 技术分享 抽出样本 技术分享 ,这里未知参数为mm 技术分享 技术分享 (注意我们把 技术分享 看作一个参数)。似然函数为
         技术分享           
                    = 技术分享
  它的对数为
  技术分享
  似然方程组为
           技术分享
  由第一式解得
           技术分享 ,               (7.2.3)
    代入第二式得
           技术分享 .             (7.2.4)
  似然方程组有唯一解( 技术分享 技术分享 ),而且它一定是最大值点,这是因为当 技术分享 技术分享 或∞时,非负函数 技术分享 。于是 技术分享 技术分享 的最大似然估计为
         技术分享 技术分享 .         (7.2.5)
  这里,我们用大写字母表示所有涉及的样本,因为最大似然估计 技术分享 技术分享 都是统计量,离开了具体的一次试验或观测,它们都是随机的。
  7.2.2 设总体 技术分享 服从参数为的泊松分布,它的分布律为
         技术分享 技术分享
  有了样本 技术分享 之后,参数λ的似然函数为
           技术分享

  似然方程为
           技术分享
  解得
             技术分享 .
  因为 技术分享 的二阶导数总是负值,可见,似然函数在 技术分享 处达到最大值。所以, 技术分享 是λ的最大似然估计。
  例7.2.3设总体 技术分享 技术分享 上的均匀分布,求 技术分享 的最大似然估计。
  技术分享 的概率密度函数为
         技术分享
  对样本 技术分享
         技术分享

  很显然,L(ab)作为ab的二元函数是不连续的。这时我们不能用似然方程组(7.2.2)来求最大似然估计,而必须从最大似然估计的定义出发,求L(ab)的最大值。为使L(ab)达到最大,ba应该尽量地小,但b又不能小于 技术分享 ,否则,L(ab)=0。
  类似地,a不能大过 技术分享 。因此,ab的最大似然估计为
          技术分享
            技术分享 . 
  现在为止,我们以正态分布,泊松分布,均匀分布的参数以及事件发生的概率的估计为例子讨论了矩估计和最大似然估计。在我们所举的例子中,除了均匀分布外,两种估计都是一致的。矩估计的优点是简单,只需知道总体的矩,总体的分布形式不必知道。而最大似然估计则必须知道总体分布形式,并且在一般情况下,似然方程组的求解较复杂,往往需要在计算机上通过迭代运算才能计算出其近似解。


















































以上是关于Maximum likelihood (最大似然估计法)的主要内容,如果未能解决你的问题,请参考以下文章

Maximum likelihood (最大似然估计法)

MLE最大似然估计Maximum Likelihood Estimation

最大似然估计实例 | Fitting a Model by Maximum Likelihood (MLE)

最大似然估计 (Maximum Likelihood Estimation), 交叉熵 (Cross Entropy) 与深度神经网络

quasi-maximum likelihood decoder一种有效的PSK信号准最大似然译码器matlab性能仿真

自动驾驶 8-4: 最小二乘法和最大似然法 Least Squares and the Method of Maximum Likelihood