LSTM和GRU

Posted 2020-11-22 weilonghu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了LSTM和GRU相关的知识，希望对你有一定的参考价值。

LSTM

技术图片

输入门(i_t):控制当前计算的新状态以多大的程度更新到记忆单元中
遗忘门(f_t):控制前一步记忆单元中的信息有多大程度被遗忘掉
输出门(o_t):控制当前的输出有多大程度取决于当前的记忆单元
记忆单元(c_t):每个单元都有
更新公式
- 输入门：
  [i_t=sigma(W_ix_t + U_i h_{t-1} + b_i)]
- 遗忘门：
  [f_t=sigma(W_fx_t + U_f h_{t-1} + b_f)]
- 输出门：
  [i_t=sigma(W_ox_t + U_o h_{t-1} + b_o)]
- 记忆单元
  [ ilde{c}_t= anh(W_c x_t + U_c h_{t-1})]
- 记忆单元更新：
  [c_t=f_t odot c_{t-1} + i_t odot ilde{c}_t]
- 隐含层输出更新
  [h_t=o_t odot anh(c_t)]
遗忘门和输入门控制着长短时记忆
更容易学习到序列之间的长期依赖
激活函数
- 使用ReLU的话，难以实现门控效果
  - ReLU负半轴是关的，正半轴不具有门控意义
- 在门控中，使用Sigmoid函数几乎是所有现代神经网络模块的共同选择
- 计算能力有限设备，使用0/1门(hard gate)

技术图片

以上是关于LSTM和GRU的主要内容，如果未能解决你的问题，请参考以下文章