标量向量矩阵微积分

Posted _less is more

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了标量向量矩阵微积分相关的知识,希望对你有一定的参考价值。

首先引入三个重要概念
1、分子布局(Numerator-layout notation)
2、分母布局(Denominator-layout notation)
3、混合布局(Mixed layout)

接下来我们会对这三个概念进行深入了解。

一、布局公约

当我们在探究机器学习、深度学习时,时常会遇到标量与向量,向量与矩阵等之间的微分,求其导数或梯度。但我们需要知道,不同的作者或上课的教授会使用不同的布局对导数的结果进行表示,所以我们经常会看到不同源的导数和梯度看起来大致相同,但维度总是不一致,那是因为他们用了不同的布局;再者,即便同一个作者,对不同类型的公式进行描述时,为了方便,可能也会使用不同的布局来进行表示,因此我们需要非常小心地理解其背后的表示方法,才不会被困扰。

二、向量对向量求导,结果为矩阵

∂ y ∂ x \\frac\\partial y\\partial x xy为例(都是向量)

简而言之,
分子布局 y y y x T x^T xT来表示结果。
分母布局 y T y^T yT x x x来表示结果。
混合布局分子布局一样,同样以 y y y x T x^T xT来表示结果,但不同的是它会把 x T x^T xT直接表示在 ∂ y ∂ x \\frac\\partial y\\partial x xy上,变成 ∂ y ∂ x T \\frac\\partial y\\partial x^T xTy

举例:
如果 y y y是m维度的列向量,维度表示为(m,1); x x x是n维度的列向量,表示为(n,1)。

按照分子布局 y y y仍然是(m,1),纵向排开,而 x T x^T xT变成(1,n),横向排开,则 ∂ y ∂ x \\frac\\partial y\\partial x xy最终维度为(m,n),m为纵向维度,n为横向维度。

按照分母布局 y T y^T yT变成(1,m),横向排开,而 x x x仍然是(n,1),纵向排开,则 ∂ y ∂ x \\frac\\partial y\\partial x xy最终维度为(n,m),n为纵向维度,m为横向维度。

按照混合布局,最终结果仍然是(m,n)维度。

三、其他资料


图片来源

如下是按分子布局来计算维度

图片来源

以上是关于标量向量矩阵微积分的主要内容,如果未能解决你的问题,请参考以下文章

矩阵求导

机器学习中的矩阵向量求导 矩阵向量求导之微分法

多变量微积分笔记12——平面向量场

详解矩阵求导法则

详解矩阵求导法则

标量向量矩阵张量之间的区别和联系