从马尔可夫链到MH采样
Posted 我家大宝最可爱
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从马尔可夫链到MH采样相关的知识,希望对你有一定的参考价值。
目录:
1.马尔可夫链
有一种动物,每天只会吃喝睡,在这三种状态之间来回切换。有一个好事者,立了个摄像头,监控这个动物的每一分钟状态变化
做了大量的统计,得到了状态之间的转移概率,并且给出了一个状态转移的概率矩阵。
有了这个概率转移矩阵,我们就可以知道下一时刻的状态分布
了。假设现在的状态是吃,由于当前的状态是确定的,所以概率为1,初始状态的概率分布就为[1,0,0]
,那么下一时刻的概率分布是什么呢?这个很好计算,根据贝叶斯定律可得
其实更准确的是
P
(
S
t
)
=
∑
P
(
S
t
∣
S
t
−
1
)
P
(
S
t
−
1
)
P(S_t)=\\sum P(S_t|S_t-1)P(S_t-1)
P(St)=∑P(St∣St−1)P(St−1)
P
^
(
吃
)
=
P
(
吃
∣
吃
)
P
(
吃
)
+
P
(
吃
∣
喝
)
P
(
喝
)
+
P
(
吃
∣
睡
)
P
(
睡
)
P
^
(
喝
)
=
P
(
喝
∣
吃
)
P
(
吃
)
+
P
(
喝
∣
喝
)
P
(
喝
)
+
P
(
喝
∣
睡
)
P
(
睡
)
P
^
(
睡
)
=
P
(
睡
∣
吃
)
P
(
吃
)
+
P
(
睡
∣
喝
)
P
(
喝
)
+
P
(
睡
∣
睡
)
P
(
睡
)
\\beginaligned \\hatP(吃)&=P(吃|吃)P(吃)+P(吃|喝)P(喝)+P(吃|睡)P(睡)\\\\ \\hatP(喝)&=P(喝|吃)P(吃)+P(喝|喝)P(喝)+P(喝|睡)P(睡)\\\\ \\hatP(睡)&=P(睡|吃)P(吃)+P(睡|喝)P(喝)+P(睡|睡)P(睡)\\\\ \\endaligned
P^(吃)P^(喝)P^(睡)=P(吃∣吃)P(吃)+P(吃∣喝)P(喝)+P(吃∣睡)P(睡)=P(喝∣吃)P(吃)+P(喝∣喝)P(喝)+P(喝∣睡)P(睡)=P(睡∣吃)P(吃)+P(睡∣喝)P(喝)+P(睡∣睡)P(睡)
整理一下可得
[
P
^
(
吃
)
P
^
(
喝
)
P
^
(
睡
)
]
=
[
P
(
吃
)
P
(
喝
)
P
(
睡
)
]
[
P
(
吃
∣
吃
)
P
(
喝
∣
吃
)
P
(
睡
∣
吃
)
P
(
吃
∣
喝
)
P
(
喝
∣
喝
)
P
(
睡
∣
喝
)
P
(
吃
∣
睡
)
P
(
喝
∣
睡
)
P
(
睡
∣
睡
)
]
\\beginaligned \\beginbmatrix \\hatP(吃) & \\hatP(喝) & \\hatP(睡) \\endbmatrix=\\beginbmatrix P(吃) & P(喝) & P(睡) \\endbmatrix \\beginbmatrix P(吃|吃) & P(喝|吃) & P(睡|吃)\\\\ P(吃|喝) & P(喝|喝) & P(睡|喝)\\\\ P(吃|睡) & P(喝|睡) & P(睡|睡) \\endbmatrix \\endaligned
[P^(吃)P^(喝)P^(睡)]=[P(吃)P(喝)P(睡)]⎣
⎡P(吃∣吃)P(吃∣喝)P(吃∣睡)P(喝∣吃)P(喝∣喝)P(喝∣睡)P(睡∣吃)P(睡∣喝)P(睡∣睡)⎦
⎤
看着有种骗吃骗喝的感觉,泛化一下可知
[
P
^
(
s
1
)
P
^
(
s
2
)
P
^
(
s
3
)
]
=
[
P
(
s
1
)
P
(
s
2
)
P
(
s
3
)
]
[
P
(
s
1
∣
s
1
)
P
(
s
2
∣
s
1
)
P
(
s
3
∣
s
1
)
P
(
s
1
∣
s
2
)
P
(
s
2
∣
s
2
)
P
(
s
3
∣
s
2
)
P
(
s
1
∣
s
3
)
P
(
s
2
∣
s
3
)
P
(
s
3
∣
s
3
)
]
\\beginaligned \\beginbmatrix \\hatP(s_1) & \\hatP(s_2) & \\hatP(s_3) \\endbmatrix=\\beginbmatrix P(s_1) & P(s_2) & P(s_3) \\endbmatrix \\beginbmatrix P(s_1|s_1) & P(s_2|s_1) & P(s_3|s_1)\\\\ P(s_1|s_2) & P(s_2|s_2) & P(s_3|s_2)\\\\ P(s_1|s_3) & P(s_2|s_3) & P(s_3|s_3)\\\\ \\endbmatrix \\endaligned
[P^(s1)P^(s2)P^(s3)]=[P(s1)P(s2)P(s3)]⎣
⎡P(s1∣s1)P(s1∣s2以上是关于从马尔可夫链到MH采样的主要内容,如果未能解决你的问题,请参考以下文章
MCMC笔记Metropilis-Hastings算法(MH算法)