使用 PyMC 实现潜在狄利克雷分配 (LDA)

Posted

技术标签:

【中文标题】使用 PyMC 实现潜在狄利克雷分配 (LDA)【英文标题】:Implementing Latent Dirichlet Allocation (LDA) with PyMC 【发布时间】:2014-09-24 22:58:39 【问题描述】:

PyMC 附带了许多示例,但 LDA 是一种相对简单的图形模型,但不是其中之一。许多网站上都有关于此的问题,但从未提及任何实现。我已经考虑过如何实现它,但不清楚如何使用 PyMC 来建立每个文档中的主题词依赖关系。

使用 PyMC 可以相对轻松地实现 LDA 吗?

【问题讨论】:

【参考方案1】:

我尝试实施和探索 Tom Minka 链接中提供的解决方案,发现它提供了一些不错的结果。但是,我还没有 100% 确信这个实现是正确的 LDA 实现。

ipython notebook 可以查看:https://github.com/napsternxg/ipython-notebooks/blob/master/PyMC_LDA.ipynb

【讨论】:

以上是关于使用 PyMC 实现潜在狄利克雷分配 (LDA)的主要内容,如果未能解决你的问题,请参考以下文章

潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型

潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型

对于稀疏数据,训练 LDA(潜在狄利克雷分配)和预测新文档的更快方法是啥?

潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型

潜在狄利克雷分配与文档聚类的关系

Latent Dirichlet Allocation(隐狄利克雷分配模型)——论文翻译与分析