数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch
Posted AI架构师易筋
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch相关的知识,希望对你有一定的参考价值。
1. 数值稳定性 梯度爆炸 梯度消失
2. 让训练更加稳定
f(x) = x
3. QA
- nan 一般是除以0导致的;inf表示无穷大,或者无穷小
- sigmoid会容易导致梯度消失,因为sigmoid的值在范围
(0,1)
- 正态分布推导比较容易
4 * sigmoid(x) - 2
可以提高稳定性,因为在0附近的时候,使得f(x)=x
参考
https://www.bilibili.com/video/BV1u64y1i75a?p=1
以上是关于数值稳定性 梯度爆炸 梯度消失 + 模型初始化和激活函数 动手学深度学习v2 pytorch的主要内容,如果未能解决你的问题,请参考以下文章