标量向量矩阵微积分
Posted _less is more
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了标量向量矩阵微积分相关的知识,希望对你有一定的参考价值。
首先引入三个重要概念
1、分子布局(Numerator-layout notation)
2、分母布局(Denominator-layout notation)
3、混合布局(Mixed layout)
接下来我们会对这三个概念进行深入了解。
一、布局公约
当我们在探究机器学习、深度学习时,时常会遇到标量与向量,向量与矩阵等之间的微分,求其导数或梯度。但我们需要知道,不同的作者或上课的教授会使用不同的布局对导数的结果进行表示
,所以我们经常会看到不同源的导数和梯度看起来大致相同,但维度总是不一致,那是因为他们用了不同的布局;再者,即便同一个作者,对不同类型的公式进行描述时,为了方便,可能也会使用不同的布局来进行表示
,因此我们需要非常小心地理解其背后的表示方法,才不会被困扰。
二、向量对向量求导,结果为矩阵
以 ∂ y ∂ x \\frac\\partial y\\partial x ∂x∂y为例(都是向量)
简而言之,
分子布局以
y
y
y和
x
T
x^T
xT来表示结果。
分母布局以
y
T
y^T
yT和
x
x
x来表示结果。
混合布局和分子布局一样,同样以
y
y
y和
x
T
x^T
xT来表示结果,但不同的是它会把
x
T
x^T
xT直接表示在
∂
y
∂
x
\\frac\\partial y\\partial x
∂x∂y上,变成
∂
y
∂
x
T
\\frac\\partial y\\partial x^T
∂xT∂y
举例:
如果
y
y
y是m维度的列向量,维度表示为(m,1);
x
x
x是n维度的列向量,表示为(n,1)。
按照分子布局, y y y仍然是(m,1),纵向排开,而 x T x^T xT变成(1,n),横向排开,则 ∂ y ∂ x \\frac\\partial y\\partial x ∂x∂y最终维度为(m,n),m为纵向维度,n为横向维度。
按照分母布局, y T y^T yT变成(1,m),横向排开,而 x x x仍然是(n,1),纵向排开,则 ∂ y ∂ x \\frac\\partial y\\partial x ∂x∂y最终维度为(n,m),n为纵向维度,m为横向维度。
按照混合布局,最终结果仍然是(m,n)维度。
三、其他资料
如下是按分子布局来计算维度
以上是关于标量向量矩阵微积分的主要内容,如果未能解决你的问题,请参考以下文章