机器学习中的矩阵求导Jacobian矩阵和Hessian矩阵
Posted wx62cea850b9e28
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习中的矩阵求导Jacobian矩阵和Hessian矩阵相关的知识,希望对你有一定的参考价值。
学习总结
(0)回顾矩阵向量化,和 克罗内克积的主要运算法则。
(1)梯度向量是雅克比矩阵的特例。
(2)Hessian矩阵是梯度向量g(x)对自变量x的Jacobian矩阵,描述了函数的局部曲率。
文章目录
零、回顾上一讲
矩阵对矩阵的求导。
假如有p×q矩阵F要对m×n的矩阵X求导,根据第一篇求导布局的定义,矩阵F的pq个元素要对矩阵X的mn个值分别求导,所以求导结果一共有mnpq个,求导的结果如何排列:
0.1 主流的矩阵对矩阵求导定义
现在主流的矩阵对矩阵求导定义是对矩阵先做向量化,然后使用向量对向量的求导。
这里的向量化一般使用列向量,即矩阵对矩阵的求导可以表示为:
对于矩阵F,列向量化,的维度是pq×1的向量,
的维度是mn×1的向量。
最终求导的结果,使用分母布局,得到 mn×pq 的矩阵。
0.2 矩阵对矩阵求导的微分法
向量化的矩阵对矩阵求导,主要是为了使用类似于前面讲过的微分法求导。之前(三)标量对向量矩阵求导的微分法里有:
机器学习中的线性代数之矩阵求导