深度学习2. 基础——线性相关生成子空间范数特征分解

Posted 编程圈子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习2. 基础——线性相关生成子空间范数特征分解相关的知识,希望对你有一定的参考价值。

深度学习2. 基础——线性相关、生成子空间、范数、特征分解

一、一些线性代数概念

1. 余子式

行列式的阶越低越容易计算,于是很自然地提出,能否把高阶行列式转换为低阶行列式来计算,为此,引入了余子式和代数余子式的概念。
n n n阶行列式中,把所在的第i行与第 j j j列划去后,所留下来的 n − 1 n-1 n1阶行列式叫元的余子式。
数学表示上计作 M i j M_ij Mij

1.1.1 行列式余子式

余子式定义
a i j a_ij aij 的代数余子式 A i j = ( − 1 ) i + j M i j A_ij=(-1)^i+jM_ij Aij=(1)i+jMij

行列式等于它任意一行(列)的各元素与其对应的代数式余子式乘积之和。

1.1.2 矩阵余子式

A A A为一个 m × n m×n m×n 的矩阵,k为一个介于1和 m m m之间的整数,并且 m ≤ n m≤n mn A A A的一个 k k k阶子式是在A中选取 k k k k k k列之后所产生的 k k k个交点组成的方块矩阵的行列式。

A A A的一个 k k k阶余子式是 A A A去掉了 m − k m−k mk行与 n − k n−k nk列之后得到的 k × k k×k k×k矩阵的行列式 。
由于一共有k种方法来选择该保留的行,有k种方法来选择该保留的列,因此A的k阶余子式一共有 C m ∗ k C k k n C^k_m*C^kk_n CmkCkkn个。

如果 m = n m=n m=n,那么 A A A关于一个 k k k阶子式的余子式,是 A A A去掉了这个 k k k阶子式所在的行与列之后得到的 ( n − k ) × ( n − k ) (n-k)×(n-k) (nk)×(nk)矩阵的行列式,简称为 A A A k k k阶余子式。

n × n n×n n×n的方块矩阵 A A A关于第 i i i行第 j j j列的余子式 M i j M_ij Mij是指 A A A中去掉第 i i i行第 j j j列后得到的 n − 1 n−1 n1阶子矩阵的行列式。有时可以简称为 A A A ( i , j ) (i,j) ij余子式。

2. 秩

秩是线性代数术语,在线性代数中,一个矩阵A的列秩是 A的线性无关的纵列的极大数目。类似地,行秩是 A的线性无关的横行的极大数目。
方阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵 A的秩。通常表示为 rk(A) 或 rank A。

二、线性组合 (linear combination)

定义一个包含 k k k 个实数变量的集合 x 1 , x 2 , . . . , x k x_1,x_2,...,x_k x1,x2,...,xk ,且假设已知一个 k k k个实数权重集合 w 1 , w 2 , . . . , w k w_1,w_2,...,w_k w1,w2,...,wk 。我们定义 s = w 1 x 1 + w 2 x 2 + , . . . , + w k x k s=w_1x_1+w_2x_2+,...,+w_kx_k s=w1x1+w2x2+,...,+wkxk
s变量是对变量x的加权线性”混合”。因此,将s定义为变量的线性组合。
可以将线性组合的概念推广到矢量中。定义每个 x i x_i xi 是一个矢量,因此,它们的线性组合s也是一个矢量。当然.每个矢量必须有相同数量的元素。请注意,s的每个分量都是一个由被组合矢量的相对应元素构成的线性组合。

1. 标量的线性组合

形式上,一组向量的线性组合,是指每个向量乘以对应标量系数之后的和,即:
∑ i c i v ( i ) \\sum_ic_iv^(i) iciv(i)
定义标量为2,4,1,5,权重为0.1,0.4,0.25,0.25。求其线性组合s。
解:线性组合
s = 0.1 ∗ 2 + 0.4 ∗ 4 + 0.25 ∗ 1 + 0.25 ∗ 5 = 3.3 s=0.1*2 + 0.4*4 + 0.25*1 + 0.25*5 = 3.3 s=0.12+0.44+0.251+0.255=3.3

2. 矢量的线性组合

A x = ∑ i x i A : , j A_x=\\sum_ix_iA_:,j Ax=ixiA:,j

3. 生成子空间

一组向量的生成子空间(span)是原始向量线性组合后所能抵达的点的集合。
确定 A x = b Ax=b Ax=b 是否有解,相当于确定向量b 是否在 A 列向量的生成子空间中。这个特殊的生成子空间被称为 A 的列空间 (column space)或者 A的值域(range)。

4. 线性相关

在线性代数里,矢量空间的一组元素中,若没有矢量可用有限个其他矢量的线性组合所表示,则称为线性无关或线性独立 (linearly independent),反之称为线性相关(linearly dependent)。
例如在三维欧几里得空间R的三个矢量(1, 0, 0),(0, 1, 0)和(0, 0, 1)线性无关;但(2, −1, 1),(1, 0, 1)和(3, −1, 2)线性相关,因为第三个是前两个的和。

5. 方阵(square)

m=n的矩阵
方阵的左逆和右逆是相等的。

6. 奇异的方阵(singular)

奇异矩阵是线性代数的概念,就是该矩阵的秩不是满秩。首先,看这个矩阵是不是方阵(即行数和列数相等的矩阵。若行数和列数不相等,那就谈不上奇异矩阵和非奇异矩阵)。
然后,再看此矩阵的行列式|A|是否等于0,若等于0,称矩阵A为奇异矩阵;若不等于0,称矩阵A为非奇异矩阵。 同时,由|A|≠0可知矩阵A可逆,这样可以得出另外一个重要结论:

  1. 可逆矩阵就是非奇异矩阵
  2. 非奇异矩阵也是可逆矩阵
  3. 如果A为奇异矩阵,则 A X = 0 AX=0 AX=0有无穷解, A X = b AX=b AX=b有无穷解或者无解。
  4. 如果A为非奇异矩阵,则 A X = 0 AX=0 AX=0有且只有唯一零解, A X = b AX=b AX=b有唯一解。

三、范数

有时我们需要衡量一个向量的大小。在机器学习中,我们经常使用称为**范数(norm)**的函数来衡量向量大小。形式上, L p L^p Lp范数定义为:
∥ x ∥ = ( ∑ i ∣ x i ∣ p ) 1 / p \\beginVmatrix x \\endVmatrix=(\\sum_i|x_i|^p)^1/p x =(ixi以上是关于深度学习2. 基础——线性相关生成子空间范数特征分解的主要内容,如果未能解决你的问题,请参考以下文章

《深度学习笔记》——线性代数基础

第二章 线性代数

深度学习(deeplearing)(5月完成)共三部分 第一部分应用数学与机器学习(5.1-5.10)线性代数

机器学习中的数学基础

线性代数知识回顾:矩阵的秩,矩阵的范数,矩阵的条件数,矩阵的特征值和特征向量

深度学习深度学习基础知识