马尔科夫过程的CKS方程的推导

Posted huangzc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了马尔科夫过程的CKS方程的推导相关的知识,希望对你有一定的参考价值。

概率论中的Chapman-Kolmogorov方程(或CKS方程)是指:https://en.wikipedia.org/wiki/Chapman%E2%80%93Kolmogorov_equation

$p_{n-1}(x_{n-1},t_{n-1};\ldots;x_2,t_2;x_1,t_1)=\int{p_n(x_n,t_n;x_{n-1},t_{n-1};\ldots;x_2,t_2;x_1,t_1)dx_n}$

其中被积量$x_{n}$叫作nuisance variable。

而对于Markov process,根据定义有:

$p_3(x_2,t_2;x,t;x_1,t_1)=q(x_2,t_2|x,t)q(x,t|,x_1,t_1)p(x_1,t_1)$    (1)

对(1)关于变量x积分,可得:

$p_2(x_2,t_2;x_1,t_1)=p(x_1,t_1)\int{q(x_2,t_2|x,t)q(x,t|x_1,t_1)dx}$   (2)

这里$x$是nuisance variable。

而(2)中等式左边的二阶联合概率密度根据条件概率的定义可写成:

$p_2(x_2,t_2;x_1,t_1)=q(x_2,t_2|x_1,t_1)p(x_1,t_1)$    (3)

比较(2)和(3)可以推出Markov过程的CKS方程:

$q(x_2,t_2|x_1,t_1)=\int{q(x_2,t_2|x,t)q(x,t|x_1,t_1)dx}$  (4)

Markov过程的CKS方程是支配转移概率密度的积分方程,或者说转移概率密度必须满足的协调条件(compatibility condition)。

以上是关于马尔科夫过程的CKS方程的推导的主要内容,如果未能解决你的问题,请参考以下文章

HMM (隐马尔可夫) 推导 (下) - 参数估计 (EM)

有限马尔可夫决策过程

强化学习介绍和马尔可夫决策过程详细推导

强化学习介绍和马尔可夫决策过程详细推导

应用随机过程02:马尔可夫链及其概率分布

强化学习入门系列二:从贝尔曼方程到动态规划