softmax求导/label_smoothing求导/知识蒸馏求导
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了softmax求导/label_smoothing求导/知识蒸馏求导相关的知识,希望对你有一定的参考价值。
文章目录
- softmax求导
- label_smoothing
- 知识蒸馏
softmax求导
链式求导
分别求解
则有
关于矩阵形式的求导可以参考另一篇矩阵求导术
label_smoothing
其中
求导结果与上面softmax相同
知识蒸馏
有两个分别对应教师网络和学生网络的输出
当
当
带入链式求导公式
将带入,并通过泰勒公式
假设logits的均值为0,即
所以,当导数等于0的时候,student网络生成的logit模仿的就是teacher网络的logit。
以上是关于softmax求导/label_smoothing求导/知识蒸馏求导的主要内容,如果未能解决你的问题,请参考以下文章