高斯和伽马分布的混合

Posted

技术标签:

【中文标题】高斯和伽马分布的混合【英文标题】:Mixture of Gaussian and Gamma distribution 【发布时间】:2013-03-27 05:49:00 【问题描述】:

我正在寻找 R 中的一些脚本/包(Python 也会这样做),以从中找出分量分布参数。到目前为止我用过 R包“mixtools”将数据建模为高斯混合,但我认为它可以更好地通过伽马加高斯建模。

谢谢

【问题讨论】:

gamlss.mx? 这听起来像tweedy model,在这种情况下package tweedy 可能是一个选项。 @Andrie,我想你的意思是“tweedie” 【参考方案1】:

这是一种可能性:

定义实用函数:

rnormgammamix <- function(n,shape,rate,mean,sd,prob) 
    ifelse(runif(n)<prob,
           rgamma(n,shape,rate),
           rnorm(n,mean,sd))

(这可以提高一点效率...)

dnormgammamix <- function(x,shape,rate,mean,sd,prob,log=FALSE) 
    r <- prob*dgamma(x,shape,rate)+(1-prob)*dnorm(x,mean,sd)
    if (log) log(r) else r

生成虚假数据:

set.seed(101)
r <- rnormgammamix(1000,1.5,2,3,2,0.5)
d <- data.frame(r)

方法 #1:bbmle 包。拟合形状、比率、log 尺度上的标准差、logit 尺度上的概率。

library("bbmle")
m1 <- mle2(r~dnormgammamix(exp(logshape),exp(lograte),mean,exp(logsd),
                     plogis(logitprob)),
     data=d,
     start=list(logshape=0,lograte=0,mean=0,logsd=0,logitprob=0))
cc <- coef(m1)

png("normgam.png")
par(bty="l",las=1)
hist(r,breaks=100,col="gray",freq=FALSE)
rvec <- seq(-2,8,length=101)
pred <- with(as.list(cc),
             dnormgammamix(rvec,exp(logshape),exp(lograte),mean,
                           exp(logsd),plogis(logitprob)))
lines(rvec,pred,col=2,lwd=2)
true <- dnormgammamix(rvec,1.5,2,3,2,0.5)
lines(rvec,true,col=4,lwd=2)
dev.off()

tcc <- with(as.list(cc),
            c(shape=exp(logshape),
              rate=exp(lograte),
              mean=mean,
              sd=exp(logsd),
              prob=plogis(logitprob)))
cbind(tcc,c(1.5,2,3,2,0.5))

拟合是合理的,但参数相差甚远——我认为这个模型在这个参数范围内不是很容易识别(即 Gamma 和 gaussian 分量可以交换)

library("MASS")
ff <- fitdistr(r,dnormgammamix,
     start=list(shape=1,rate=1,mean=0,sd=1,prob=0.5))

cbind(tcc,ff$estimate,c(1.5,2,3,2,0.5))

fitdistr 得到与mle2 相同的结果,这表明我们是 在局部最小值。如果我们从我们得到的真实参数开始 到合理且接近真实参数的东西。

ff2 <- fitdistr(r,dnormgammamix,
     start=list(shape=1.5,rate=2,mean=3,sd=2,prob=0.5))
-logLik(ff2)  ## 1725.994
-logLik(ff)   ## 1755.458

【讨论】:

以上是关于高斯和伽马分布的混合的主要内容,如果未能解决你的问题,请参考以下文章

高斯混合模型(GMM)及EM算法的初步理解

单高斯模型SGM & 高斯混合模型GMM

Coursera高斯混合模型

混合高斯模型

高斯混合模型GMM核心参数高斯混合模型GMM的数学形式

2020/02/28 高斯混合模型以及GMM聚类