数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch

Posted AI架构师易筋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch相关的知识,希望对你有一定的参考价值。

1. 数值稳定性 梯度爆炸 梯度消失







2. 让训练更加稳定










f(x) = x


3. QA

  1. nan 一般是除以0导致的;inf表示无穷大,或者无穷小
  2. sigmoid会容易导致梯度消失,因为sigmoid的值在范围(0,1)
  3. 正态分布推导比较容易
  4. 4 * sigmoid(x) - 2 可以提高稳定性,因为在0附近的时候,使得f(x)=x

参考

https://www.bilibili.com/video/BV1u64y1i75a?p=1

以上是关于数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch的主要内容,如果未能解决你的问题,请参考以下文章

深度学习梯度爆炸与梯度消失

机器学习梯度消失和梯度爆炸的原因分析表现及解决方案

机器学习梯度消失和梯度爆炸的原因分析表现及解决方案

剑指offer梯度消失和梯度爆炸

出现梯度消失和梯度爆炸的原因及解决方案

再聊聊梯度消失与梯度爆炸