GMM 中的负概率

Posted 2023-02-22

技术标签:

【中文标题】GMM 中的负概率【英文标题】：Negative probability in GMM 【发布时间】：2013-07-16 04:51:46 【问题描述】：

我很困惑。我已经按照 MATLAB 代码为自己测试了一个程序：

feature_train=[1 1 2 1.2 1 1 700 709 708 699 678]; 
No_of_Clusters = 2;
No_of_Iterations = 10;
[m,v,w]=gaussmix(feature_train,[],No_of_Iterations,No_of_Clusters);

feature_ubm=[1000 1001 1002 1002 1000 1060 70 79 78 99 78 23 32 33 23 22 30]; 
No_of_Clusters = 3;
No_of_Iterations = 10;
[mubm,vubm,wubm]=gaussmix(feature_ubm,[],No_of_Iterations,No_of_Clusters);


feature_test=[2 2 2.2 3 1 600 650 750 800 658];
[lp_train,rp,kh,kp]=gaussmixp(feature_test,m,v,w);  
[lp_ubm,rp,kh,kp]=gaussmixp(feature_test,mubm,vubm,wubm);

但是，结果让我感到奇怪，因为 feature_test 必须分类在 feature_train 而不是 feature_ubm 中。正如您在下面看到的，feature_ubm 的概率超过了 feature_train！？！谁能帮我解释一下有什么问题？问题与 gaussmip 和 gaussmix MATLAB 函数有关吗？

sum(lp_ubm)

ans =

-3.4108e+06

总和（lp_train）

ans =

-1.8658e+05

【问题讨论】：

【参考方案1】：

如下所示，feature_ubm 的概率大于 feature_train！？！

你看到的完全相反，尽管 ubm 的绝对值很大，但你正在考虑负数和

 sum(lp_train) > sum(lp_ubm)

所以

 P(test|train) > P(test|ubm)

因此，您的测试块被正确分类为 train，而不是 ubm。

【讨论】：

感谢您的回复。即使我完全使用 feature_train 而不是 feature_test，总和（lp_train）也会变成 -10.1083 ！？！为什么？ -10 与 -1e+5 相比是一个非常好的对数概率。它非常接近对应于原始概率 1 的最佳可能对数概率 0。因此它检测到完全匹配。感谢您的帮助和指导。

以上是关于GMM 中的负概率的主要内容，如果未能解决你的问题，请参考以下文章

GMM-HMM声学模型

scikit-learn GMM 产生正对数概率