人人都能看懂的LSTM

Posted Charmve

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人人都能看懂的LSTM相关的知识,希望对你有一定的参考价值。

点击上方“迈微AI研习社”,选择“星标★”公众号

重磅干货,第一时间送达

大家好,我是Charmve。

熟悉深度学习的朋友知道,LSTM是一种RNN模型,可以方便地处理时间序列数据,在NLP等领域有广泛应用。

在看了台大李宏毅教授的深度学习视频后,特别是介绍的第一部分RNN以及LSTM,整个人醍醐灌顶。本文就是对视频的记录加上了一些个人的思考。

0. 从RNN说起

循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络。相比一般的神经网络来说,他能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义,RNN就能够很好地解决这类问题。

1. 普通RNN

先简单介绍一下一般的RNN。其主要形式如下图所示(图片均来自台大李宏毅教授的PPT):

这里:

   为当前状态下数据的输入,  表示接收到的上一个节点的输入。

   为当前节点状态下的输出,  而为传递到下一个节点的输出。

通过上图的公式可

以上是关于人人都能看懂的LSTM的主要内容,如果未能解决你的问题,请参考以下文章

收藏 | 人人都能看懂的 LSTM

人人都能看懂的Django REST framework

人人都能看懂的Spring源码解析,Spring如何解决循环依赖

人人都能看懂的云计算知识科普 !

人人都能看懂的Django REST framework

人人都能看懂的Django REST framework