PyMC:利用 Adaptive Metropolis MCMC 中的稀疏模型结构

Posted

技术标签:

【中文标题】PyMC:利用 Adaptive Metropolis MCMC 中的稀疏模型结构【英文标题】:PyMC: Taking advantage of sparse model structure in Adaptive Metropolis MCMC 【发布时间】:2015-07-03 14:03:00 【问题描述】:

我有一个结构如下图所示的模型:

我有几个人(在这张图片中索引为 1...5)。人口参数(AB,但可以有更多)确定每个个体潜在变量 L[i] 的分布。潜变量L[i] 以概率方式确定观察X[i]。这个模型是“稀疏的”,因为大多数节点没有直接连接它们的边。

我正在尝试使用 PyMC 来推断总体参数以及每个人的潜在变量。 (一个更详细地描述了我的具体场景的相关问题是here。)我的问题是:我应该使用 Adaptive Metropolis 而不是另一种方法,如果是,是否有任何“技巧”来分组随机变量正确吗?

如果我正确理解 Adaptive Metropolis 采样(我可能不会...),该算法会通过考虑这些变量如何为未知数(AB 和所有到目前为止,在运行中构建的后验分布中是相关的。如果AB 负相关,则增加A 的提案将倾向于减少B,反之亦然,以增加提案被接受的机会。

问题是,在这个模型中,每个L[i] 都是从AB 确定的基础人口分布中独立抽取的。因此,虽然它们会被视为在后验中相关,但这些相关性实际上仅归因于 AB,因此它们在某种程度上是“混淆”。所以当我调用函数时,

M.use_step_method(pymc.AdaptiveMetropolis, stochastics)

所有L[i] 是否应该一起出现在随机指标列表中?或者我应该多次调用 use_step_method,每次都使用stochastics=[A, B, L[i]] 来获取L[i] 之一?我的想法是,为不同的随机变量组多次调用该函数将构建问题,并通过告诉 PyMC 只关注重要的相关性来使 PyMC 更容易。这是正确的吗?

【问题讨论】:

【参考方案1】:

这可能是一个不令人满意的答案,但 PyMC3 似乎有一个非常相似的分层模型的示例:https://pymc-devs.github.io/pymc3/GLM-hierarchical/ 将您的代码迁移到 PyMC3 将使您能够访问更新的示例,例如 No-U-Turn Sampler (坚果)

【讨论】:

以上是关于PyMC:利用 Adaptive Metropolis MCMC 中的稀疏模型结构的主要内容,如果未能解决你的问题,请参考以下文章

PYMC3 季节性变量

Dubbo SPI之Adaptive详解

PyMC:马尔科夫链蒙特卡洛采样工具

机器学习技法总结Adaptive Boosting, AdaBoost-Stump,决策树

PyMC3 中的链是啥?

使用 PyMC3 进行增量模型更新