[转]如何理解似然函数

Posted 凌波微步_Arborday

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[转]如何理解似然函数相关的知识,希望对你有一定的参考价值。

作者:Yeung Evan
链接:https://www.zhihu.com/question/54082000/answer/145495695
来源:知乎

在英语语境里,likelihood 和 probability 的日常使用是可以互换的,都表示对机会 (chance) 的同义替代。但在数学中,probability 这一指代是有严格的定义的,即符合柯尔莫果洛夫公理 (Kolmogorov axioms) 的一种数学对象(换句话说,不是所有的可以用0到1之间的数所表示的对象都能称为概率),而 likelihood (function) 这一概念是由Fisher提出,他采用这个词,也是为了凸显他所要表述的数学对象既和 probability 有千丝万缕的联系,但又不完全一样的这一感觉。中文把它们一个翻译为概率一个翻译为似然也是独具匠心。

 

先看似然函数的定义,它是给定联合样本值技术分享图片下关于(未知)参数技术分享图片 的函数:技术分享图片

这里的小技术分享图片是指联合样本随机变量技术分享图片取到的值,即技术分享图片

这里的技术分享图片是指未知参数,它属于参数空间;

这里的技术分享图片是一个密度函数,特别地,它表示(给定)技术分享图片下关于联合样本值技术分享图片的联合密度函数。

 

所以从定义上,似然函数和密度函数是完全不同的两个数学对象:前者是关于技术分享图片的函数,后者是关于技术分享图片的函数。所以这里的等号技术分享图片 理解为函数值形式的相等,而不是两个函数本身是同一函数(根据函数相等的定义,函数相等当且仅当定义域相等并且对应关系相等)。

 

说完两者的区别,再说两者的联系。

(1)如果技术分享图片是离散的随机向量,那么其概率密度函数技术分享图片可改写为技术分享图片,即代表了在参数技术分享图片下随机向量技术分享图片取到值技术分享图片可能性;并且,如果我们发现

技术分享图片

那么似然函数就反应出这样一个朴素推测:在参数技术分享图片下随机向量技术分享图片取到值技术分享图片可能性大于 在参数技术分享图片下随机向量技术分享图片取到值技术分享图片可能性。换句话说,我们更有理由相信(相对于技术分享图片来说)技术分享图片

更有可能是真实值。这里的可能性由概率来刻画。

(2)如果技术分享图片是连续的随机向量,那么其密度函数技术分享图片本身(如果在技术分享图片连续的话)在技术分享图片处的概率为0,为了方便考虑一维情况:给定一个充分小技术分享图片,那么随机变量技术分享图片取值在技术分享图片区间内的概率即为

技术分享图片

并且两个未知参数的情况下做比就能约掉技术分享图片,所以和离散情况下的理解一致,只是此时似然所表达的那种可能性概率技术分享图片无关。

综上,概率(密度)表达给定技术分享图片下样本随机向量技术分享图片可能性,而似然表达了给定样本技术分享图片下参数技术分享图片(相对于另外的参数技术分享图片)为真实值的可能性。我们总是对随机变量的取值谈概率,而在非贝叶斯统计的角度下,参数是一个实数而非随机变量,所以我们一般不谈一个参数的概率

最后我们再回到技术分享图片这个表达。首先我们严格记号,竖线技术分享图片表示条件概率或者条件分布,分号技术分享图片表示把参数隔开。所以这个式子的严格书写方式是技术分享图片因为技术分享图片在右端只当作参数理解。





以上是关于[转]如何理解似然函数的主要内容,如果未能解决你的问题,请参考以下文章

机器学习中的贝叶斯方法---先验概率似然函数后验概率的理解及如何使用贝叶斯进行模型预测

转 通俗理解 最小二乘 和 最大似然估计

共轭先验 | 共轭分布(转)

如何通俗的理解极大似然估计

详解最大似然估计(MLE)最大后验概率估计(MAP),以及贝叶斯公式的理解(转)

损失函数