LSTM与GRU有什么联系和区别?

Posted 月来客栈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LSTM与GRU有什么联系和区别?相关的知识,希望对你有一定的参考价值。


LSTM结构中的C(cell),和GRU结构中的H(隐藏单元),有什么联系和区别?


LSTM中的C和GRU中的H都是经过了遗忘和输入门(GRU中的更新们也是由遗忘和输入门组成的),也都是未经过输出门而直接往后传递的。他们有什么区别呢?

我自己的猜想:GRU的重置门就相当于LSTM中的更新门。

LSTM中的C经过输出门之后形成了H,因为有输出门所以H更关注当前状态的信息,而C携带者之前的所有状态的信息。GRU中的H就相当于LSTM中的C同样也携带者之前状态的信息,GRU中的重置门就相当于LSTM中的输出门,重置之后的H就相当于LSTM中更关注当前状态的H。


如图所示,左边为第一种形式也是网上常见的GRU画法。但是为了方便和LSTM对比,我画成了右边的形式,请先行对比。

LSTM与GRU有什么联系和区别?_线性变换

然后我们再来将LSTM与上面右边的GRU结构放到一起进行对比。

LSTM与GRU有什么联系和区别?_线性变换_02


  • LSTM与GRU有什么联系和区别?_重置_03

更多内容欢迎扫描关注公众号月来客栈!

LSTM与GRU有什么联系和区别?_公众号_04



以上是关于LSTM与GRU有什么联系和区别?的主要内容,如果未能解决你的问题,请参考以下文章

lstm和gru结构的再理解

lstm 单词embeding 怎么处理

lstm维度

PyTorch LSTM 中的“隐藏”和“输出”有啥区别?

3.5 tensorflow 中LSTM和GRU模块使用意境级讲解

DLTransformer与LSTM的区别和联系