机器学习里的数学:矩阵求导Ⅱ
Posted AI土木小站
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习里的数学:矩阵求导Ⅱ相关的知识,希望对你有一定的参考价值。
矩阵对矩阵求导
链式法则
所谓链式法则,即从输入到输出的映射中存在一系列中间变量,输入对输出的导数可以转化为对中间变量求导,环环相扣,最终得到对输出的导数。
讨论一个最简单的例子,列向量y和列向量x存在如下关系
列向量y对列向量x的导数为
下面从链式法则的角度重新求导,先定义一个中间变量向量m,并且有
然后画出向量y到向量x的路径图
从向量y到向量x只有一条路径,没有分支,经过一个中间变量向量m,因此有
考虑向量y中第i个元素对向量x中第j个元素的导数
和直接求导的结果一样。
总结
矩阵求导是理解反向传播(BP)算法的基础。矩阵求导的一般原则是显式地表达变量之间的关系,然后根据求导法则计算即可。在面对复杂运算时,可以通过引入中间变量的方式,厘清输入到输出的路径,利用链式法则进行求导计算。
END
以上是关于机器学习里的数学:矩阵求导Ⅱ的主要内容,如果未能解决你的问题,请参考以下文章