ReLULReLUPReLUCReLUELUSELU

Posted 2022-11-23 think90

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了ReLULReLUPReLUCReLUELUSELU相关的知识，希望对你有一定的参考价值。

ReLU、LReLU、PReLU、CReLU、ELU、SELU

2018年01月22日 22:25:34 luxiaohai的学习专栏阅读数 28218更多

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_20909377/article/details/79133981

- ReLU
- LReLU
- PReLU
- CReLU
- ELU
- SELU

ReLU

技术图片
tensorflow中：tf.nn.relu(features, name=None)

LReLU

(Leaky-ReLU)
技术图片
其中 $a_{i}$

PReLU

技术图片
其中 $a_{i}$

CReLU

（Concatenated Rectified Linear Units）
技术图片
tensorflow中：tf.nn.crelu(features, name=None)

ELU

技术图片

其中α是一个可调整的参数，它控制着ELU负值部分在何时饱和。
右侧线性部分使得ELU能够缓解梯度消失，而左侧软饱能够让ELU对输入变化或噪声更鲁棒。ELU的输出均值接近于零，所以收敛速度更快
tensorflow中：tf.nn.elu(features, name=None)

SELU

技术图片
经过该激活函数后使得样本分布自动归一化到0均值和单位方差(自归一化，保证训练过程中梯度不会爆炸或消失，效果比Batch Normalization 要好)
其实就是ELU乘了个lambda，关键在于这个lambda是大于1的。以前relu，prelu，elu这些激活函数，都是在负半轴坡度平缓，这样在activation的方差过大的时候可以让它减小，防止了梯度爆炸，但是正半轴坡度简单的设成了1。而selu的正半轴大于1，在方差过小的的时候可以让它增大，同时防止了梯度消失。这样激活函数就有一个不动点，网络深了以后每一层的输出都是均值为0方差为1。

tensorflow中：tf.nn.selu(features, name=None)

技术图片

以上是关于ReLULReLUPReLUCReLUELUSELU的主要内容，如果未能解决你的问题，请参考以下文章