深度剖析HMM（附Python代码）2.隐马尔科夫链HMM的EM训练过程

Posted 2022-12-04 tostq

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深度剖析HMM（附Python代码）2.隐马尔科夫链HMM的EM训练过程相关的知识，希望对你有一定的参考价值。

隐马尔科夫链HMM的参数θ的EM训练过程

现在回到前一节最后提出的参数θ的最大似然函数上来，先对其做个对数变换，做对数变换是考虑到序列X的概率计算公式中包含了连乘，为了方便计算同时避免序列X的概率过小，因此对其做了对数变换。

的期望计算中，对于序列X是已知的，而的概率是由旧参数值所估计的，因此上式可以表示为：

为了方便表示，以下定义：

而可以表示为：

根据HMM的结构定义，其参数θ主要分为三部分：隐藏状态的先验分布π（同相关），各隐藏状态之间的转移概率Λ（同相关），即已知隐藏状态确定观测值的发射概率参数∅（同相关）。由此可以得出

此时综合得出：

这里定义：

1、E步骤

这里定义：

求α的过程，也即所谓的前向算法，具体代码如下（这里增加了一个归一化因子c，下面会具体讲解）：

    # 求向前传递因子
    def forward(self, X, Z):
        X_length = len(X)
        alpha = np.zeros((X_length, self.n_state))  # P(x,z)
        alpha[0] = self.emit_prob(X[0]) * self.start_prob * Z[0] # 初始值
        # 归一化因子
        c = np.zeros(X_length)
        c[0] = np.sum(alpha[0])
        alpha[0] = alpha[0] / c[0]
        # 递归传递
        for i in range(X_length):
            if i == 0: continue
            alpha[i] = self.emit_prob(X[i]) * np.dot(alpha[i - 1], self.transmat_prob) * Z[i]
            c[i] = np.sum(alpha[i])
            if c[i]==0: continue
            alpha[i] = alpha[i] / c[i]

        return alpha, c

同理，我们也可以通过后向算法来递归求出β

Python代码

    # 求向后传递因子
    def backward(self, X, Z, c):
        X_length = len(X)
        beta = np.zeros((X_length, self.n_state))  # P(x|z)
        beta[X_length - 1] = np.ones((self.n_state))
        # 递归传递
        for i in reversed(range(X_length)):
            if i == X_length - 1: continue
            beta[i] = np.dot(beta[i + 1] * self.emit_prob(X[i + 1]), self.transmat_prob.T) * Z[i]
            if c[i+1]==0: continue
            beta[i] = beta[i] / c[i + 1]

        return beta

另外还可以根据α和β值求出序列X的发生概率

α和β的归一化问题

引入缩放因子：

归一化的α的新求解公式表示为

这里的c非常好求：

因此可以求出

同理：

2、M步骤

解最大似然方程，首先定义拉格朗日式：

求解初始状态概率为：

同理，求解状态转换概率为：

这个过程用Python代码表示：

# M步骤，估计参数
self.start_prob = post_state[0] / np.sum(post_state[0])
for k in range(self.n_state):
      self.transmat_prob[k] = post_adj_state[k] / np.sum(post_adj_state[k])

下面我们解决不同类型的发射概率计算。

均值求解：

同理协方差求解：