什么是梯度消失?怎么解决?

Posted pacino12134

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是梯度消失?怎么解决?相关的知识,希望对你有一定的参考价值。

累乘中一个梯度小于1,那么不断累乘,这个值会越来越小,梯度衰减很大,迅速接近0。

在神经网络中是离输出层近的参数,梯度越大,远的参数,梯度越接近0。

根本原因是sigmoid函数的缺陷。

方法:

1、好的初始化方法,逐层预训练,后向传播微调。

2、换激活函数,用relu,leaky——relu。靠的是使梯度靠近1或等于1,避免了在累乘过程中,结果迅速衰减。

以上是关于什么是梯度消失?怎么解决?的主要内容,如果未能解决你的问题,请参考以下文章

出现梯度消失和梯度爆炸的原因及解决方案

深度学习中的梯度消失与梯度爆炸及解决方案

一文读懂:梯度消失(爆炸)及其解决方法

机器学习梯度消失和梯度爆炸的原因分析表现及解决方案

机器学习梯度消失和梯度爆炸的原因分析表现及解决方案

剑指offer梯度消失和梯度爆炸