高等代数06
Posted 万物皆数
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了高等代数06相关的知识,希望对你有一定的参考价值。
在线性代数中,我们花了3篇讲解(双)线性函数的相关结论。这里我想把核心内容再阐述一遍,在忽略一些细节的同时,希望对整体结构有更深刻的理解。需要注意的是,这里双线性函数只是起点,后面的内积、酉变换、正规变换,都在不断地打破和拓展之前的概念,最终还是为了讨论特殊线性变换的标准型。
1. 双线性函数
1.1 双线性函数与正交
在有了双线性函数的定义后,可知在任意选定的一组基下,双行线函数\\(f\\)可由其度量矩\\(A\\)完全确定。站在矩阵的角度,相关概念也变得更加直观。比如固定左向量\\(\\alpha\\)而得到的线性函数\\(\\alpha_L\\),可以对应到\\(A\\)的行向量的线性组合(系数为\\(\\alpha\\)坐标)。而全体\\(\\alpha_L\\)组成的线性函数空间\\(W_L\\),则同构于\\(A\\)的行向量生成的线性空间。那些使得\\(\\alpha_L=0\\)的全体\\(\\alpha\\)(双线性函数的左根\\(\\text{rad}_Lf\\)),则同构于\\(\\alpha A=0\\)的解空间。对应右边的向量\\(\\beta\\),也有定义\\(W_R\\)和右根\\(\\text{rad}_Rf\\)。当\\(A\\)满秩时,左右根皆为空,这时称双线性函数是非退化的。
不同基下的度量矩阵\\(A,B\\)也不相同,并且与两组基的变换矩阵\\(P\\)有关系式\\(B=PAP\'\\),这样的矩阵\\(A,B\\)称为合同矩阵。反之,同一组基下度量矩阵合同的变换,可以认为是同构的。为了讨论同构意义下双线性函数空间的结构,我们熟悉的方法是“不变”子空间的分割,为此还要规定式(1)左的正交性。可以证明,满足正交性的双线性函数必然是对称或反对称的,即\\(A=A\'\\)或\\(A=-A\'\\)。而双线性函数空间\\(T_2(V)\\)是对称\\(S_2(V)\\)和反对称\\(A_2(V)\\)双线性函数空间的直和,故而有些讨论可以集中在后两个空间上。
\\[f(\\alpha,\\beta)=0\\;\\Leftrightarrow\\;f(\\beta,\\alpha)=0\\;\\Leftrightarrow\\;\\alpha\\perp\\beta\\tag{1}\\]
正交性自然地引出了向量或子空间正交补(子空间)\\(\\alpha^\\perp,\\,W^\\perp\\)的概念。然后根据线性方程组的理论,容易推导\\(W,W^\\perp\\)维度之间的关系(行列向量维数与解空间的关系)。特别地有,双线性函数的左右根相同,可以记作\\(V^\\perp=\\text{rad}\\,f\\)。还有如果\\(f\\)在子空间\\(W\\)下非退化,易证\\(W\\)和\\(W^\\perp\\)无交集、且维度之和是\\(n\\),从而它们是\\(V\\)的正交分割(式(2))。
\\[\\text{rad}\\,f|_W=0\\;\\Rightarrow\\;W\\oplus W^\\perp=V\\tag{2}\\]
式(2)可直接用于对称和反对称双线性函数(矩阵)的标准型讨论上。若是对称矩阵,先任选\\(f(\\alpha,\\alpha)\\neq 0\\),根据式(2)先将\\(V\\)分解成\\(\\alpha\\oplus\\alpha^\\perp\\),然后依此继续分解\\(\\alpha^\\perp\\),直至剩下一个\\(\\text{rad}\\,f\\)。在选定的基下(根空间任意选),函数的度量矩阵是一个对角矩阵(合同标准型)。再看反对称矩阵,先任选\\(f(\\alpha,\\beta)=1\\),根据式(2)从\\(W=\\left<\\alpha,\\beta\\right>\\)开始正交分解,最终得到\\(\\begin{bmatrix}0&1\\\\-1&0\\end{bmatrix}\\)和\\(0\\)组成的分块对角矩阵。
合同矩阵的秩是不变的,对称矩阵和反对称矩阵的秩在标准型上有明显的表现。反对称矩阵的秩一定是偶数,且标准型在任何域上的形式都是最简的。对称矩阵在不同域上还可以进一步讨论,以下先假定它的秩为\\(r\\)。在复数域上,通过调整基的系数,可得到标准型\\(\\text{diag}\\{I_r,0_{n-r}\\}\\)。在实数域上则可以得到标准型\\(\\text{diag}\\{I_p,-I_q,0_{n-r}\\}\\),其中\\(p+q=r\\)。依次记三个子空间为\\(V^+,V^-,V^\\perp\\),注意前两者并不唯一,而后者就是根空间。另外不难证明,任何“正”子空间都与\\(V^-\\oplus V^\\perp\\)无交集,这就可以证得:\\(p,q\\)在任何标准型中都是一样的(惯性定律),它们被称为正(负)惯性指数。
1.2 内积与酉空间
实数域(或其子域)有更多实际的场景,把函数限定在实数域上还可以度量线性空间。为了引出长度的概念,还要对函数增加一个限定,即有\\(f(\\alpha,\\alpha)>0\\)恒成立。这时\\(f\\)只能选择对称函数,且正惯性指数就是\\(n\\)(称为正定的),这样的函数也叫内积,记作\\(\\alpha\\cdot\\beta\\)。引入内积后的实线性空间也叫欧几里得空间。接下来自然就是定义向量的长度\\(\\left\\|\\alpha\\right\\|\\)、距离\\(d(\\alpha,\\beta)\\)、角度(式(3)),以及得到三角不等式和勾股定理(式(4,5),这里不再重复讲述。
\\[\\theta=\\arccos{\\frac{\\alpha\\cdot\\beta}{\\left\\|\\alpha\\right\\|\\cdot\\left\\|\\beta\\right\\|}}\\tag{3}\\]
\\[\\left|\\:\\left\\|\\alpha\\right\\|-\\left\\|\\beta\\right\\|\\:\\right|\\leqslant\\left\\|\\alpha+\\beta\\right\\|\\leqslant\\left\\|\\alpha\\right\\|+\\left\\|\\beta\\right\\|\\tag{4}\\]
\\[\\left\\|\\alpha\\right\\|^2+\\left\\|\\beta\\right\\|^2=\\left\\|\\alpha+\\beta\\right\\|^2\\tag{5}\\]
有时候也需要在复数域空间上定义度量的概念,但双线性函数显然不能满足要求,这时要将实内积的定义进行扩展。首先第一元仍然是线性的,然后交换变量满足式(6)左的Hermite性(可推导出第二元的半线性)。这样的二元函数在选定的基下也有式(6)右的合同矩阵(共轭对称矩阵),同样也能定义正交性以及解析其标准合同矩阵。最后如果加上正定性的要求,这样的二元函数就是复内积,或简称内积。引入内积后的复线性空间也叫酉空间,其上也可以定义长度(模)、距离、角度,以及有三角不等式和勾股定理。
\\[f(\\beta,\\alpha)=\\overline{f(\\alpha,\\beta)}\\;\\Rightarrow\\;A\'=\\overline{A}\\tag{6}\\]
Hermite性可以兼容实空间的线性,且复内积也是兼容实空间的实内积的,进而酉空间其实是阿基米德空间的母空间。所以如果不特别强调,以下我们都在复数域上讨论。另外,在定义了正交的空间中(不限定为内积),如果二元函数是非退化的,则使用Schmidt正交化总可以找到一组正交基。在内积空间中,还可以找到单位向量组成的标准正交基,这时内积空间同构于向量对于基的系数组成的坐标空间,而内积就等于坐标向量的内积(式(7))。
\\[\\alpha\\cdot\\beta=x_1\\overline{y_1}+x_2\\overline{y_2}+\\cdots+x_n\\overline{y_n}\\tag{7}\\]
1.3 正规变换与对角化
在内积限制下的线性变换(映射)比较常见,这里有必要讨论一下它的标准型。首先限定变换下向量间的距离是不变的(保距变换),不难证明它是一个双射的线性变换,而且等价于:将一组标准正交基变换为另一组标准正交基。也就是说变换矩阵满足\\(P\\overline{P\'}=I\\),这样的矩阵叫酉矩阵(实数域下叫正交矩阵),这样的变换则叫酉变换(实数域叫正交变换)。酉矩阵是名副其实的“单位矩阵”,它的行列式的模为1(利用特征式),所有特征值的模也为1(利用单位向量的变换),所有行(列)向量是正交的单位向量。
当我们讨论酉变换\\(A\\)(酉矩阵)的标准型时,其实并不一定有内积空间的定义,但如果补齐这部分定义,就能利用其独有的结构特点。正交性可以使空间分割变得非常方便,结合线性变换需要的\\(A\\)-子空间,容易想到去寻找一组正交的特征向量。先随意找到一个特征向量\\(\\eta\\),并生成\\(A\\)-子空间\\(W\\),容易证得\\(V=W\\oplus W^\\perp\\)。接下来利用双射性可知\\(W^\\perp\\)也是\\(A\\)-子空间(式(8),这一步不可缺少),从而可以在\\(W^\\perp\\)中继续寻找特征向量,最终得到式(9)的标准型。由于寻找的特征向量是正交的,\\(P\\overline{P\'}\\)一定是一个对角矩阵,如果把特征向量单位化,\\(P\\)也可以是酉矩阵。
\\[\\alpha\\cdot A\\beta=A\\alpha\'\\cdot A\\beta=\\alpha\'\\cdot\\beta=0\\tag{8}\\]
\\[PAP^{-1}=\\text{diag}\\,\\{\\lambda_1,\\lambda_2,\\cdots,\\lambda_n\\}\\tag{9}\\]
任意变换矩阵\\(A\\)都定义在某组基下,如果将这组基定义为标准正交基,该定义便可扩展成整个域上的内积空间。刚才我们看到了正交在对角化中的作用,现在来继续榨取这个工具的威力,把对角化的范围尽量扩大。值得提醒的是,这里的讨论需借助内积的概念,因此线性空间被限定在数域上,对角化也只讨论正交对角化。现在回顾上面的讨论,最关键的一个条件是:如果\\(W\\)是\\(A\\)-子空间,则\\(W^\\perp\\)也是\\(A\\)-子空间。为此就要有\\(\\alpha\\cdot A\\beta=\\alpha\'\\cdot\\beta\\),其中\\(\\alpha,\\alpha\'\\in W;\\;\\beta\\in W^\\perp\\)。如果不限定向量的范围,等式中的\\(\\alpha\'\\)总是有解的,记\\(A^*:\\alpha\\rightarrow\\alpha\'\\),不难证明它是线性变换,且满足\\(A^*=\\overline{A\'}\\),它也称为\\(A\\)的伴随变换。
伴随变换的矩阵关系\\(A^*=\\overline{A\'}\\),使得它的定义可以更加自由灵活,比如教材上一般定义为\\(A\\alpha\\cdot\\beta=\\alpha\\cdot A^*\\beta\\)。这里还会发现一个简单事实,如果\\(W\\)是\\(A\\)-子空间,那么\\(W^\\perp\\)就是\\(A^*\\)-子空间。想要从特征空间\\(W=\\left<\\eta\\right>\\)开始构造对角化,就要证明\\(W^\\perp\\)是\\(A\\)-子空间,这也等价于\\(W\\)是\\(A^*\\)-子空间。不过在此之前,我们先从\\(A\\)可正交对角化出发,看看变换还有什么必要条件。记正交对角化\\(A=PDP^{-1}\\),则有\\(A^*=P\\bar{D}P^{-1}\\),这时\\(AA^*=A^*A\\)。 反之,可交换性使得\\(A,A^*\\)能像标量一样在表达式里“自由穿梭”,比如容易有\\(\\left\\|A\\alpha\\right\\|=\\left\\|A^*\\alpha\\right\\|\\),更一般的还有\\(\\left\\|f(A)\\alpha\\right\\|=\\left\\|f(A^*)\\alpha\\right\\|\\)。
特别地,则有我们需要的\\(\\left\\|(A-\\lambda I)\\alpha\\right\\|=\\left\\|(A^*-\\overline\\lambda I)\\alpha\\right\\|=0\\),即\\(W\\)是\\(A^*\\)-子空间。综合这两段的讨论便有,数域上的线性变换\\(A\\)可正交对角化的充要条件是:\\(A\\)有\\(n\\)个特征值且\\(AA^*=A^*A\\)(或式(10)的等价条件),满足式(10)的变换也称为正规变换。然后就可以构造一些常见的正规变换,比如上面讨论的酉变换,再比如复数域上的共轭对称变换\\(A=\\overline{A\'}\\),也被称为Hermite变换,实数域上就是熟知的对称变换。酉变换和Hermite变换天然有\\(n\\)个特征值,而注意到Hermite变换的特征值都是实数,所以对称变换也有\\(n\\)个特征值(放到复数域看),它们都可以正交对角化。
\\[AA^*=A^*A\\;\\Leftrightarrow\\;\\left\\|A\\alpha\\right\\|=\\left\\|A^*\\alpha\\right\\|\\tag{10}\\]
2. 多重线性函数
(暂且搁置)
以上是关于高等代数06的主要内容,如果未能解决你的问题,请参考以下文章
欢迎购买复旦大学高等代数教材(第三版)和高等代数学习指导书(第三版)