深度学习2. 基础——线性相关生成子空间范数特征分解
Posted 编程圈子
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习2. 基础——线性相关生成子空间范数特征分解相关的知识,希望对你有一定的参考价值。
深度学习2. 基础——线性相关、生成子空间、范数、特征分解
一、一些线性代数概念
1. 余子式
行列式的阶越低越容易计算,于是很自然地提出,能否把高阶行列式转换为低阶行列式来计算,为此,引入了余子式和代数余子式的概念。
在
n
n
n阶行列式中,把所在的第i行与第
j
j
j列划去后,所留下来的
n
−
1
n-1
n−1阶行列式叫元的余子式。
数学表示上计作
M
i
j
M_ij
Mij。
1.1.1 行列式余子式
余子式定义
a
i
j
a_ij
aij 的代数余子式
A
i
j
=
(
−
1
)
i
+
j
M
i
j
A_ij=(-1)^i+jM_ij
Aij=(−1)i+jMij
行列式等于它任意一行(列)的各元素与其对应的代数式余子式乘积之和。
1.1.2 矩阵余子式
设 A A A为一个 m × n m×n m×n 的矩阵,k为一个介于1和 m m m之间的整数,并且 m ≤ n m≤n m≤n。 A A A的一个 k k k阶子式是在A中选取 k k k行 k k k列之后所产生的 k k k个交点组成的方块矩阵的行列式。
A
A
A的一个
k
k
k阶余子式是
A
A
A去掉了
m
−
k
m−k
m−k行与
n
−
k
n−k
n−k列之后得到的
k
×
k
k×k
k×k矩阵的行列式 。
由于一共有k种方法来选择该保留的行,有k种方法来选择该保留的列,因此A的k阶余子式一共有
C
m
∗
k
C
k
k
n
C^k_m*C^kk_n
Cm∗kCkkn个。
如果 m = n m=n m=n,那么 A A A关于一个 k k k阶子式的余子式,是 A A A去掉了这个 k k k阶子式所在的行与列之后得到的 ( n − k ) × ( n − k ) (n-k)×(n-k) (n−k)×(n−k)矩阵的行列式,简称为 A A A的 k k k阶余子式。
n × n n×n n×n的方块矩阵 A A A关于第 i i i行第 j j j列的余子式 M i j M_ij Mij是指 A A A中去掉第 i i i行第 j j j列后得到的 n − 1 n−1 n−1阶子矩阵的行列式。有时可以简称为 A A A的 ( i , j ) (i,j) (i,j)余子式。
2. 秩
秩是线性代数术语,在线性代数中,一个矩阵A的列秩是 A的线性无关的纵列的极大数目。类似地,行秩是 A的线性无关的横行的极大数目。
方阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵 A的秩。通常表示为 rk(A) 或 rank A。
二、线性组合 (linear combination)
定义一个包含
k
k
k 个实数变量的集合
x
1
,
x
2
,
.
.
.
,
x
k
x_1,x_2,...,x_k
x1,x2,...,xk ,且假设已知一个
k
k
k个实数权重集合
w
1
,
w
2
,
.
.
.
,
w
k
w_1,w_2,...,w_k
w1,w2,...,wk 。我们定义
s
=
w
1
x
1
+
w
2
x
2
+
,
.
.
.
,
+
w
k
x
k
s=w_1x_1+w_2x_2+,...,+w_kx_k
s=w1x1+w2x2+,...,+wkxk
s变量是对变量x的加权线性”混合”。因此,将s定义为变量的线性组合。
可以将线性组合的概念推广到矢量中。定义每个
x
i
x_i
xi 是一个矢量,因此,它们的线性组合s也是一个矢量。当然.每个矢量必须有相同数量的元素。请注意,s的每个分量都是一个由被组合矢量的相对应元素构成的线性组合。
1. 标量的线性组合
形式上,一组向量的线性组合,是指每个向量乘以对应标量系数之后的和,即:
∑
i
c
i
v
(
i
)
\\sum_ic_iv^(i)
i∑civ(i)
定义标量为2,4,1,5,权重为0.1,0.4,0.25,0.25。求其线性组合s。
解:线性组合
s
=
0.1
∗
2
+
0.4
∗
4
+
0.25
∗
1
+
0.25
∗
5
=
3.3
s=0.1*2 + 0.4*4 + 0.25*1 + 0.25*5 = 3.3
s=0.1∗2+0.4∗4+0.25∗1+0.25∗5=3.3
2. 矢量的线性组合
A x = ∑ i x i A : , j A_x=\\sum_ix_iA_:,j Ax=i∑xiA:,j
3. 生成子空间
一组向量的生成子空间(span)是原始向量线性组合后所能抵达的点的集合。
确定
A
x
=
b
Ax=b
Ax=b 是否有解,相当于确定向量b 是否在 A 列向量的生成子空间中。这个特殊的生成子空间被称为 A 的列空间 (column space)或者 A的值域(range)。
4. 线性相关
在线性代数里,矢量空间的一组元素中,若没有矢量可用有限个其他矢量的线性组合所表示,则称为线性无关或线性独立 (linearly independent),反之称为线性相关(linearly dependent)。
例如在三维欧几里得空间R的三个矢量(1, 0, 0),(0, 1, 0)和(0, 0, 1)线性无关;但(2, −1, 1),(1, 0, 1)和(3, −1, 2)线性相关,因为第三个是前两个的和。
5. 方阵(square)
m=n的矩阵
方阵的左逆和右逆是相等的。
6. 奇异的方阵(singular)
奇异矩阵是线性代数的概念,就是该矩阵的秩不是满秩。首先,看这个矩阵是不是方阵(即行数和列数相等的矩阵。若行数和列数不相等,那就谈不上奇异矩阵和非奇异矩阵)。
然后,再看此矩阵的行列式|A|是否等于0,若等于0,称矩阵A为奇异矩阵;若不等于0,称矩阵A为非奇异矩阵。 同时,由|A|≠0可知矩阵A可逆,这样可以得出另外一个重要结论:
- 可逆矩阵就是非奇异矩阵
- 非奇异矩阵也是可逆矩阵
- 如果A为奇异矩阵,则 A X = 0 AX=0 AX=0有无穷解, A X = b AX=b AX=b有无穷解或者无解。
- 如果A为非奇异矩阵,则 A X = 0 AX=0 AX=0有且只有唯一零解, A X = b AX=b AX=b有唯一解。
三、范数
有时我们需要衡量一个向量的大小。在机器学习中,我们经常使用称为**范数(norm)**的函数来衡量向量大小。形式上,
L
p
L^p
Lp范数定义为:
∥
x
∥
=
(
∑
i
∣
x
i
∣
p
)
1
/
p
\\beginVmatrix x \\endVmatrix=(\\sum_i|x_i|^p)^1/p
x
=(i∑∣xi以上是关于深度学习2. 基础——线性相关生成子空间范数特征分解的主要内容,如果未能解决你的问题,请参考以下文章
深度学习(deeplearing)(5月完成)共三部分 第一部分应用数学与机器学习(5.1-5.10)线性代数