序列模型---LSTM（长短时记忆）

Posted 2021-01-24 lee-yl

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了序列模型---LSTM（长短时记忆）相关的知识，希望对你有一定的参考价值。

一、RNN回顾

技术分享图片

略去上面三层，即o,L,y，则RNN的模型可以简化成如下图的形式：

技术分享图片

由于RNN梯度消失的问题，大牛们对于序列索引位置t的隐藏结构做了改进，可以说通过一些技巧让隐藏结构复杂了起来，来避免梯度消失的问题，这样的特殊RNN就是我们的LSTM。由于LSTM有很多的变种，这里我们以最常见的LSTM为例讲述。LSTM的结构如下图：

技术分享图片

从上图中可以看出，在每个序列索引位置t时刻向前传播的除了和RNN一样的隐藏状态 $h^{(t)}$

技术分享图片

除了细胞状态，LSTM图中还有了很多奇怪的结构，这些结构一般称之为门控结构(Gate)。LSTM在在每个序列索引位置t的门一般包括遗忘门，输入门和输出门三种。下面我们就来研究上图中LSTM的遗忘门，输入门和输出门以及细胞状态。

技术分享图片

技术分享图片

在研究LSTM输出门之前，我们要先看看LSTM之细胞状态。前面的遗忘门和输入门的结果都会作用于细胞状态 $C^{(t)}$

技术分享图片

我们把旧状态与 $f_{t}$

技术分享图片

技术分享图片

技术分享图片

技术分享图片

以上是关于序列模型---LSTM（长短时记忆）的主要内容，如果未能解决你的问题，请参考以下文章