LSTM基础

Posted YJ-20

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LSTM基础相关的知识,希望对你有一定的参考价值。

DNN,CNN,RNN:
1.DNN:深度神经网络,或称多层感知机。解决早期单层感知机对于复杂函数不能模拟的情况。其形式为层之间全连接。实用sig等连续性函数模拟神经对机理的响应,训练算法使用    BP。

2.问题:只是名义上的深层。

  a:随着层数的加深,优化函数更加容易陷入局部最优解。并且会越来越偏离

  b:梯度消失情况更加严重。每传递一层,梯度衰减为原来的0.25;

  c:多层全连接导致参数膨胀;
 当时解决方法:

  a:实用预训练方法缓解最优解。

  b:为客服梯度消失,实用relu,maxou等传输函数代替sigMoid;
3.CNN:不是所有上下层神经元都能直接相连,而是通过“卷积核”作为中介。同一个卷积核在所有图像内是共享的,图像通过卷积操作后仍然保留原先的位置关系.对于一个图像分别     用多个卷积核进行描述,每个卷积核学习到不提不同的结构特征。最后一层是全连接层。

4.RNN:可以对变化的时间序列进行建模。对于自然语言处理,语音识别,手写体识别非常重要。

5.LSTM隐含层示例:

  

以上是关于LSTM基础的主要内容,如果未能解决你的问题,请参考以下文章

了解RNN模型的基础单元LSTM、GRU、RQNN 与 SRU

教程 | 使用MNIST数据集,在TensorFlow上实现基础LSTM网络

LSTM基础

(转)零基础入门深度学习 - 长短时记忆网络(LSTM)

(数据科学学习手札39)RNN与LSTM基础内容详解

Deep Learning基础--理解LSTM/RNN中的Attention机制