MCMC笔记：蒙特卡罗方法

Posted 2021-11-07 UQI-LIUWJ

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MCMC笔记：蒙特卡罗方法相关的知识，希望对你有一定的参考价值。

0 前言：关于采样

0.1 采样的动机

1）采样可能本身就是任务

2）求和或者求积分

0.2 什么是好的样本？

1）样本趋向于高概率的区域

2）样本是相互独立的

0.3 采样是困难的

1）概率分布函数很复杂，导致采样困难

2）高维变量不易采样

1 介绍

蒙特卡洛方法（Monte Carlo Method）：基于采样的随机近似方法。

该方法旨在求得复杂概率分布下的期望值：

其中zi是从概率分布p(z∣x) 中取的样本，也就是从概率分布中取N个点来近似计算这个积分。

但是，由于p(z∣x) 比较复杂，所以有的时候我们可能不知道应该怎么采样。

注：这里的z|x，有些地方直接写成z，表示的是一个意思

2 采样方法

2.1 概率分布采样

a.求得概率密度函数PDF的累计密度函数CDF
b.求CDF的反函数
c.在0-1之间均匀取样，带入反函数，得到取样点

以上图为例，左图为概率密度函数，右图为相应的累计密度函数（也就是从负无穷到相应点的概率密度函数的累加和）

不难发现累计密度函数的取值范围是[0,1]。同时因为均匀分布易于采样，所以我们可以从均匀分布U(0,1)之间随机采样，采样的点作为cdf的值域，找到相应的x。这些x就是我们的样本点。

换一种思路考虑就是，pdf大的位置，cdf“上升”得快，那么“占据”值域的区间就长，随机取样后就更易于停留在这些值域上，那么对应位置的x被采样到的概率也就比较大。

但是，大部分PDF很难求得CDF。。。

2.2 拒绝采样

对于较复杂的概率分布 p(z) ，引入简单的提议分布（proposal distribution）q(z)，使得对任意的，然后对q(z) 进行采样获得样本。

这里的M是一个常数，因为如果没有M的话p和q都是概率密度函数，那么概率密度函数的积分恒为1，所以不可能一个恒大于另一个的。

人为构造的q需要是一个采样容易的分布。