蒙特卡罗方法

Posted 2020-10-26 上帝不玩骰子

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了蒙特卡罗方法相关的知识，希望对你有一定的参考价值。

　作为一种随机采样方法，马尔科夫链蒙特卡罗（Markov Chain Monte Carlo，以下简称MCMC）在机器学习,深度学习以及自然语言处理等领域都有广泛的应用，是很多复杂算法求解的基础。比如我们前面讲到的分解机(Factorization Machines)推荐算法，还有前面讲到的受限玻尔兹曼机（RBM）原理总结，都用到了MCMC来做一些复杂运算的近似求解。下面我们就对MCMC的原理做一个总结。

1. MCMC概述

　　　　从名字我们可以看出，MCMC由两个MC组成，即蒙特卡罗方法（Monte Carlo Simulation，简称MC）和马尔科夫链（Markov Chain ，也简称MC）。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗方法和马尔科夫链的原理。我们将用三篇来完整学习MCMC。在本篇，我们关注于蒙特卡罗方法。

2. 蒙特卡罗方法引入

　　　　蒙特卡罗原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。比如积分：

θ = \int b a f (x) d x

　　　　如果我们很难求解出 $f (x)$

　　　　则一个简单的近似求解方法是在[a,b]之间随机的采样一个点。比如 $x_{0}$

(b - a) f (x 0)

　　　　当然，用一个值代表[a,b]区间上所有的 $f (x)$

b - a n \sum i = 0 n - 1 f ( x i )

　　　　虽然上面的方法可以一定程度上求解出近似的解，但是它隐含了一个假定，即 $x$

　　　　怎么解决这个问题呢？如果我们可以得到 $x$

θ = \int b a f (x) d x = \int b a f ( x ) p ( x ) p ( x ) d x \approx 1 n \sum i = 0

　　　　上式最右边的这个形式就是蒙特卡罗方法的一般形式。当然这里是连续函数形式的蒙特卡罗方法，但是在离散时一样成立。

　　　　可以看出，最上面我们假设 $x$

1 n \sum i = 0 n - 1 f ( x i ) 1 / ( b - a ) = b - a n \sum

　　　　也就是说，我们最上面的均匀分布也可以作为一般概率分布函数 $p (x)$

3. 概率分布采样

　　　　上一节我们讲到蒙特卡罗方法的关键是得到 $x$

　　　　对于常见的均匀分布 $u n i f o r m (0, 1)$

Z 1 = - 2 l n X 1-------\sqrt c o s (2 π X 2)

Z 2 = - 2 l n X 1-------\sqrt s i n (2 π X 2)

　　　　其他一些常见的连续分布，比如t分布，F分布，Beta分布，Gamma分布等，都可以通过类似的方式从 $u n i f o r m (0, 1)$

　　　　不过很多时候，我们的 $x$

4. 接受-拒绝采样

　　　　对于概率分布不是常见的分布，一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然 $p (x)$

　　　　具体采用过程如下，设定一个方便采样的常用概率分布函数 $q (x)$

　　　　首先，采样得到 $q (x)$

1 n \sum i = 0 n - 1 f ( z i ) p ( z i )

　　　　整个过程中，我们通过一系列的接受拒绝决策来达到用 $q (x)$

5. 蒙特卡罗方法小结

　　　　使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

　　　　1）对于一些二维分布 $p (x, y)$

　　　　2）对于一些高维的复杂非常见分布 $p (x_{1}, x_{2}, . . ., x_{n})$

　　　　从上面可以看出，要想将蒙特卡罗

以上是关于蒙特卡罗方法的主要内容，如果未能解决你的问题，请参考以下文章