神经网络与深度学习笔记（番外）反向传播推导

Posted 2021-07-31 沧夜2021

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了神经网络与深度学习笔记（番外）反向传播推导相关的知识，希望对你有一定的参考价值。

回顾

我们设 $n^{[l]}$ 为第 $l$ 层的单元数

则它们的维数
$w^{[l]}, dw ：(n^{[l]},n^{[l-1]})\\\\$

$b^{[l]}, db ：(n^{[l]},1)\\\\$

$z^{[l]},a^{l}:(n^{[l]},1)\\\\$

$Z^{l},A^{l},dZ,dA:(n^{[l]},m)$

反向传播公式为：
$dz^{[l]} = da^{[l]} * g^{[l]'}(z^{[l]})\\\\$

$dw^{[l]} = dz^{[l]} * a^{[l-1]}\\\\$

$db^{[l]} = dz^{[l]}\\\\$

$da^{[l-1]} = w^{[l]^{T}}*dz^{[l]}$

首先我们知道
$z^{[l]} = w^{[l]}*a^{[l-1]} + b^{[l]}$

$a^{[l]} = g^{[l]}(z^{[l]})$

$\\jmath(a,y) = - yloga-(1-y)log(1-a)\\\\$

接下来开始推导过程：

由公式 $\\jmath(a,y) = - yloga-(1-y)log(1-a)\\$ 对 $a$ 求导得：
$\\frac{d\\jmath(a^{[l]},y)}{da^{[l]}} = -\\frac{y}{a^{[l]}} + \\frac{1-y}{1-a^{[l]}}\\\\$

$\\frac{d\\jmath(a^{[l]},y)}{dz^{[l]}} = \\frac{d\\jmath(a^{[l]},y)}{da^{[l]}}*\\frac{da^{[l]}}{dz^{[l]}}$

而

以上是关于神经网络与深度学习笔记（番外）反向传播推导的主要内容，如果未能解决你的问题，请参考以下文章