在R语言和Stan中估计截断泊松分布

Posted 拓端数据部落

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在R语言和Stan中估计截断泊松分布相关的知识,希望对你有一定的参考价值。

原文链接:http://tecdat.cn/?p=6534


数据

 

这是一个非常简化的例子。我产生了1,000个计数观察值,平均值为1.3。然后,如果只观察到两个或更高的那个,我将原始分布与我得到的分布进行比较。 


 由此代码生成:

 

# original data:set.seed(321)a <- rpois(1000, 1.3)
# truncated version of data:b <- a[ a > 1]
# graphic:data_frame(value = c(a, b), variable = (c("Original data", "Truncated so only observations of 2 or more show up"), c(length(a), length(b)))) %>% ggplot(aes(x = value)) + (binwidth = 1, colour = "white") + facet_wrap(~variable, ncol = 1) + ggtitle("Comparing full and truncated datasets from a Poisson distribution") + labs(y = "Number of observations")
# fitting a model to original works well:mean(a) (a, "Poisson")
# but obviously not if naively done to the truncated version:mean(b)fitdistr(b, "Poisson")

估计lambda完整数据(a)的关键参数效果很好,估计值为1.347,刚好超过1.3的真实值的一个标准误差。


最大似然


需要dpoisppois函数的截断版本并在fitdist其中使用这些版本。

#-------------MLE fitting in R-------------------dtruncated_poisson <- function(x, lambda) {}ptruncated_poisson <- function(x, lambda) {}
fitdist(b, "truncated_poisson", start = c(lambda = 0.5))


请注意,要执行此操作,我将下限阈值指定为1.5; 因为所有数据都是整数,这实际上意味着我们只观察2或更多的观察结果。我们还需要为估计值指定一个合理的起始值lambda- 这样做太远会导致错误。


贝叶斯

对于替代贝叶斯方法,Stan可以很容易地将数据和概率分布描述为截断的。除了我x在这个程序中调用的原始数据之外,我们需要告诉它有多少观察(n),lower_limit它被截断了,以及表征我们估计的参数的先验分布所需的任何东西。

以下程序的关键部分是:

  • data块中,指定数据的x下限为lower_limit

  • model块中,指定x通过截断的分布T[lower_limit, ]

 
data { int n; int lower_limit; int x[n]; real lambda_start_mu; real lambda_start_sigma;}
parameters { reallambda;}
model { lambda ~ normal(lambda_start_mu, lambda_start_sigma); for(i in 1:n){ x[i] ~ poisson(lambda) T[lower_limit, ]; }}

以下是从R向Stan提供数据的方式:

 
#-------------Calling Stan from R--------------data <- list( x = b, lower_limit = 2, n = length(), lambda_start_sigma = 1)
fit <- stan("0120-trunc.stan", data = data, cores = 4)

plot(fit) + labs(y = "Estimated parameters") + theme_minimal(base_family = "myfont")

这为我们提供lambda了与该fitdistrplus方法匹配的后验分布:1.35,标准偏差为0.08。可信区间的图像:

在R语言和Stan中估计截断泊松分布


点击标题查阅往期内容









更多内容,请点击左下角“阅读原文”查看

在R语言和Stan中估计截断泊松分布

在R语言和Stan中估计截断泊松分布

在R语言和Stan中估计截断泊松分布


案例精选、技术干货 第一时间与您分享

长按二维码加关注

更多内容,请点击左下角“阅读原文”查看



以上是关于在R语言和Stan中估计截断泊松分布的主要内容,如果未能解决你的问题,请参考以下文章

数据分享|R语言零膨胀泊松回归ZERO-INFLATED POISSON(ZIP)模型分析露营钓鱼数据实例估计IRR和OR|附代码数据

R语言泊松分布函数Poisson Distribution(dpois, ppois, qpois & rpois)实战

R语言广义线性模型泊松回归(Poisson Regression)模型

参数|统计量|抽样分布|估计标准误差|标准误差|标准误|标准差|二项分布|泊松分布|中心极限定理|样本方差|

求总体为指数分布的矩估计和极大似然估计

使用matlab模拟检验和估计泊松过程