Chapter 4 马尔科夫链

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Chapter 4 马尔科夫链相关的知识,希望对你有一定的参考价值。

4.1 引言

现在要研究的是这样一种过程:

技术分享表示在时刻技术分享的值(或者状态),想对一串连续时刻的值,比如:技术分享技术分享技术分享 ... 建立一个概率模型。


最简单的模型就是:假设技术分享都是独立的随机变量,但是通常这种假设都是没什么根据的,也缺乏研究的意义。

举例来说的话,如果用技术分享来代替某个公司,比如Google,在技术分享个交易日之后的股票价格。

那么说第技术分享天的股票价格和之前第技术分享天,第技术分享天,第技术分享乃至第技术分享天的股票价格一点关系都没有,这样是说不过去的。

但是说第技术分享天股票的收盘价格依赖于第技术分享天的收盘价格还是有点道理的。


同样还可以做出这样的合理假设:在给定了所有过去的收盘价技术分享技术分享,...,技术分享,那么第技术分享天的收盘价格技术分享仅仅依赖于第技术分享天的收盘价格技术分享。这种假设就定义了一个中随机过程,即Markov Chain(马尔科夫链)。


下面给出马尔科夫链的正式定义:

    令技术分享是一个取有限或者可数个可能值的随机过程。

    除非明确提到过,这个过程可能的取值将会用非负整数技术分享来表示。

    如果技术分享,那么该过程就是在时刻技术分享的状态为技术分享

    这里假设只要过程是处于状态技术分享,那么下一步过程状态转为技术分享的概率技术分享是固定的。

    技术分享                           (4.1)

    对所有的状态技术分享技术分享,...,和技术分享技术分享技术分享和所有的技术分享都成立。


上面定义的过程就被称之为马尔科夫链。

方程(4.1)可以解释为:对于马尔科夫链,在给定了过去时刻的状态技术分享技术分享,...,技术分享和当前的状态技术分享,任何未来状态技术分享和过去的状态无关,只和当前的状态有关。

技术分享代表了过程从状态技术分享通过下一步转变到状态技术分享的概率。由于概率都是非负的,而且过程随着时间也必须流转到接下来的某个状态,所以可以得到:

技术分享

技术分享表示一步转移概率技术分享的矩阵,那么可以得到

技术分享

例4.1 天气预报

假设明天是否下雨的依赖于过去的天气条件,但仅限于今天是否下雨,而和之前的天气状态无关。

假设今天下雨,明天也下雨的概率是技术分享;今天不下雨,明天下雨的概率是技术分享

令下雨时,过程的状态为技术分享,不下雨的时过程的状态为技术分享

那么上述过程就是一个两状态的马尔科夫链,其转移概率矩阵为:

技术分享

4.2 Chapman-Kolmogorov等式

之前我们已经定义了一步转移概率技术分享,现在来定义技术分享转移概率技术分享,即处于状态技术分享的过程经过了技术分享步状态改变之后处于状态技术分享的概率。

用公式来阐述就是:

技术分享

显而易见的是技术分享

Chapman-Kolmogorov等式提供了计算技术分享步转移概率的方法。

技术分享                              (4.2)

对于技术分享比较通俗的解释就是过程从状态技术分享开始经过了技术分享步转移之后到达状态,然后从状态技术分享经过技术分享步转移之后到达了状态技术分享。把中间状态技术分享的所有可能的概率加起来就是过程从状态技术分享经过了技术分享步之后转移到状态技术分享的概率了。





以上是关于Chapter 4 马尔科夫链的主要内容,如果未能解决你的问题,请参考以下文章

强化学习笔记:马尔科夫链介绍及基于Python的蒙特卡洛仿真

随机过程15 - 离散时间马尔科夫链状态的常返性

随机过程15 - 离散时间马尔科夫链状态的常返性

随机过程15 - 离散时间马尔科夫链状态的常返性

HDOJ6229Wandering Robots(马尔科夫链,set)

马尔科夫链