GMM 中的负概率

Posted

技术标签:

【中文标题】GMM 中的负概率【英文标题】:Negative probability in GMM 【发布时间】:2013-07-16 04:51:46 【问题描述】:

我很困惑。我已经按照 MATLAB 代码为自己测试了一个程序:

feature_train=[1 1 2 1.2 1 1 700 709 708 699 678]; 
No_of_Clusters = 2;
No_of_Iterations = 10;
[m,v,w]=gaussmix(feature_train,[],No_of_Iterations,No_of_Clusters);

feature_ubm=[1000 1001 1002 1002 1000 1060 70 79 78 99 78 23 32 33 23 22 30]; 
No_of_Clusters = 3;
No_of_Iterations = 10;
[mubm,vubm,wubm]=gaussmix(feature_ubm,[],No_of_Iterations,No_of_Clusters);


feature_test=[2 2 2.2 3 1 600 650 750 800 658];
[lp_train,rp,kh,kp]=gaussmixp(feature_test,m,v,w);  
[lp_ubm,rp,kh,kp]=gaussmixp(feature_test,mubm,vubm,wubm);  

但是,结果让我感到奇怪,因为 feature_test 必须分类在 feature_train 而不是 feature_ubm 中。正如您在下面看到的,feature_ubm 的概率超过了 feature_train!?! 谁能帮我解释一下有什么问题? 问题与 gaussmip 和 gaussmix MATLAB 函数有关吗?

sum(lp_ubm)

ans =

-3.4108e+06

总和(lp_train)

ans =

-1.8658e+05

【问题讨论】:

【参考方案1】:

如下所示,feature_ubm 的概率大于 feature_train!?!

你看到的完全相反,尽管 ubm 的绝对值很大,但你正在考虑负数和

 sum(lp_train) > sum(lp_ubm)

所以

 P(test|train) > P(test|ubm)

因此,您的测试块被正确分类为 train,而不是 ubm。

【讨论】:

感谢您的回复。即使我完全使用 feature_train 而不是 feature_test,总和(lp_train)也会变成 -10.1083 !?!为什么? -10 与 -1e+5 相比是一个非常好的对数概率。它非常接近对应于原始概率 1 的最佳可能对数概率 0。因此它检测到完全匹配。 感谢您的帮助和指导。

以上是关于GMM 中的负概率的主要内容,如果未能解决你的问题,请参考以下文章

GMM-HMM声学模型

scikit-learn GMM 产生正对数概率

卷积神经网络(CNN)在语音识别中的应用

GMM模型是啥

声学模型GMM-HMM

GMM基础