第1章矩阵的几何理论 第2章λ矩阵与若尔当标准形 第3章矩阵的分解 第4章赋范线性空间与矩阵范数引言什么是矩阵的几何理论 矩阵理论源于古典的高等数学,例如,“线性空间”是二维向量空间的推广;“线性算子”是函数概念的推广;“等积变换”是正交坐标系概念的推广……. 建立这种“以高等数学为背景、并用公理化来定义多维空间相应的抽象概念”的理论,我们称之为“矩阵的几何理论”. 在这里讲的矩阵几何理论,主要内容有: 1.1节阐述线性空间上的线性算子及其矩阵;1.2节介绍内积空间上常用的线性算子(正交变换与酉变换)及其矩阵;1.3节扼要介绍埃尔米特变换及其矩阵.所有论述是在假定读者已经具备线性代数和高等数学初步知识的基础上进行的,这里所讨论的内容既是已有线性代数和高等数学知识的推广和深化,也是本书的理论基础. 1.1线性空间上的线性算子与矩阵[*4/5]1.1.1线性空间[*2]1. 数环与数域每一个数学概念都有其适用范围,线性空间的概念与在什么范围内取数有直接的关系,为了准确地叙述和理解线性空间这个数学概念,首先引入数域的概念. 定义1.1.1设Z为非空数集且其中任何两个相同或互异的数之和、差与积仍属于Z(即数集关于加、减、乘法运算封闭),则称Z是一个数环. 只含一个0的数集Z={0}显然是个数环. 根据数环的定义有: (1) 任何数环Z必含有0.因为若a∈Z,则a-a=0∈Z; (2) 若a∈Z,则-a∈Z.因为0-a=-a∈Z. 由此可知,Z={0}是最小的数环. 定义1.1.2如果P是至少含有两个互异数的数环,并且其中任何两个数a与b之商(b≠0)仍属于P(换言之,数集关于四则运算都封闭),则说P是一个数域. 根据数域的定义有: (1) 任何数域P中必含有0与1,因为P中至少有一个数a≠0,而a/a=1∈P. (2) 若a≠0,则1/a=a-1∈P. 全体整数(包括0)组成一个数环.全体有理数组成一个数域,并且是最小的数域,因为数中至少含有0与1,由0与1通过和、差、积运算形成整数环,再加上商运算即形成有理数域,记为Q. 全体实数组成一个数域,叫作实数域,记为R. 全体复数组成一个数域,叫作复数域,记为C. 读者可以验证,形如a+b2(其中a,b为有理数)的数的全体也构成一个数域,并且它包含了有理数域. 2. 线性空间 线性空间是线性代数中n维向量空间概念的抽象和推广.为了便于理解这个抽象概念,我们先回顾n维向量空间中的向量在加法及数与向量的乘法方面的运算性质,然后再把具有同样运算性质的一切集合,抽象概括为线性空间. 在n维向量空间Kn={α=(a1,a2,…,an)|ai∈R 或 ai∈C,i=1,2,…,n}中,向量α是有序数组,且对向量的加法及数与向量乘法是封闭的(指运算结果都仍是Kn中的向量),且满足如下8条性质(设α,β,γ都是n维向量,λ,μ是常数): (1) α+β=β+α(加法交换律); (2) (α+β)+γ=α+(β+γ)(加法结合律); (3) α+0=α(存在零向量0); (4) α+(-α)=0(存在负向量-α); (5) λ(α+β)=λα+λβ(数因子分配律); (6) (λ+μ)α=λα+μα(分配律); (7) λ(μα)=(λμ)α(数因子结合律); (8) 1α=α. 值得指出的是,要研究的集合已远远超出了n维向量空间Kn的范围,元素不一定是有序数组,但集合中元素的加法及数与元素的乘法运算,却具有Kn中相应的性质.我们先看如下几个熟悉的例子. 例1.1.1以实数为系数,次数不超过n的一元多项式的全体(包括0),记作P[x]n={anxn+an-1xn-1+…+a1x+a0|an,an-1,…,a1,a0∈R}.按多项式相加及乘常数的规则,则P[x]n对这两种运算是封闭的,因为若f(x)∈P[x]n,g(x)∈P[x]n,则f(x)+g(x)∈P[x]n; 若k∈R,则kf(x)∈P[x]n,且易验证对P[x]n的这两种运算,也有如Kn中所述的8条性质. 例1.1.2常系数二阶齐次线性微分方程y″-3y′+2y=0的解的集合Y={ae2x+bex|a,b∈R},对于函数的加法及数与函数乘法两种运算也是封闭的,因为若y1=a1e2x+b1ex∈Y,y2=a2e2x+b2ex∈Y,则y1+y2=(a1+a2)e2x+(b1+b2)ex∈Y; 当k∈R时,则ky1=ka1e2x+kb1ex∈Y,且满足如Kn中所述的8条性质. 例1.1.3在所有n阶实矩阵的集合Rn×n中,如果A,B∈Rn×n,则A+B∈Rn×n; 如果k∈R,则kA∈Rn×n.即集合对于这两种运算是封闭的,且也都满足如Kn中所述的8条性质. 此外,在数学、力学及其他学科中,还有如例1.1.1~例1.1.3的大量这样的集合.因此,有必要不考虑集合的具体内容的涵义来研究这类集合的公共性质,并把这类集合概括成一个数学名词,于是就有如下的线性空间的概念. 定义1.1.3设V是一个非空集合,P是一个数域.如果V满足如下两个条件: 1) 在V中定义一个封闭的加法运算,即当x,y∈V时,有唯一的和x+y∈V,并且加法运算满足4条性质: (1) x+y=y+x(交换律); (2) x+(y+z)=(x+y)+z(结合律); (3) 存在零元素0∈V,对于V中任何一个元素x都有x+0=x; (4) 存在负元素,即对任一元素x∈V,存在有一元素y∈V,使x+y=0,且称y为x的负元素,记为-x,于是有x+(-x)=0. 2) 在V中定义一个封闭的数乘运算(数与元素的乘法),即当x∈V,λ∈P时,有唯一的λx∈V,且数乘运算满足4条性质: (5) (λ+μ)x=λx+μx(分配律); (6) λ(x+y)=λx+λy(数因子分配律); (7) λ(μx)=(λμ)x(结合律); (8) 1x=x. 其中x,y,z表示V中的任意元素; λ,μ是数域P中任意数; 1是数域P中的单位数. 我们称V是数域P上的线性空间.不管V的元素如何,当P为实数域R时,称V为实线性空间; 当P为复数域C时,就称V为复线性空间. 通常我们把V中满足8条性质且为封闭的加法及数乘两种运算,统称线性运算.简言之,凡定义了线性运算的集合,就称线性空间.因此,线性运算是线性空间的本质,它反映了集合中元素之间的某种代数结构.当仅研究集合的代数结构时,便抽象出线性空间的概念. 下面列举一些线性空间的例子. 在Kn中,所有实n维向量的集合Rn是实数域R上的线性空间; 所有复n维向量的集合Cn是复数域C上的线性空间.作为特例,几何空间全体向量组成的集合R2或R3是实数域R上的线性空间. 例1.1.1~例1.1.3中的集合,在其各自的加法及数乘运算的定义下,都构成实数域R上的线性空间.我们称例1.1.3所给的线性空间Rn×n为矩阵空间. 此外,检验集合是否构成线性空间,逐条检验运算是否为线性运算是至关重要的.例如,次数等于n(n≥1)的多项式的集合,关于通常的多项式加法与数乘运算是不能构成线性空间的.因为两个n次多项式的和可能不是n次多项式,如当n>1时,f(x)=xn+x,g(x)=-xn+1,则f(x)+g(x)=x+1就不属于原来的集合,亦即对加法运算不封闭,故不是线性空间.还要注意,检验线性运算不能只检验对运算的封闭性,特别是当定义的加法及数乘运算不是通常意义下的运算时,则应仔细检验其余8条性质. 下面再举一个不是线性空间的例子. 例1.1.4平面上全体向量组成的集合,对于通常意义下的向量加法和如下定义的数乘k·α=0,虽然对两种运算都封闭,但因1·α=0,不满足运算性质(8),即定义的运算不是线性运算,所以不是线性空间. 一般来说,同一个集合,若定义两种不同的线性运算,就构成不同的线性空间; 若定义的运算不是线性运算,也就不能构成线性空间.所以,线性空间的概念是集合与运算二者的结合.为了对线性空间的理解更具有一般性,请看下面的线性空间所表现的代数结构. 例1.1.5设R+为所有正实数组成的数集,其加法及数乘运算定义为(奇怪的加法与数乘)ab=ab,[]a,b∈R+, ka=ak,[]k∈R,a∈R+.证明R+是实线性空间. 证明实际上要验证10条: 对加法封闭: 设a,b∈R+,则有ab=ab∈R+; 对数乘封闭: 设k∈R,a∈R+,则有ka=ak∈R+; (1) ab=ab=ba=ba; (2) (ab)c=(ab)c=(ab)c=a(bc)=a(bc); (3) 1是零元素,因为a1=a·1=a; (4) a的负元素是1/a,因为a1/a=a·1/a=1; (5) k(ab)=k(ab)=(ab)k=akbk=(ka)(kb); (6) (λ+μ)a=aλ+μ=aλaμ=(λa)(μa); (7) λ(μa)=λaμ=(aμ)λ=aλμ=(λμ)a; (8) 1a=a1=a. 因此,R+是实线性空间. 线性空间还是物理、力学中满足叠加原理的系统的数学模型,请看下例. 图1.1 例1.1.6考察一根梁因受荷载而产生变形的问题(如图1.1所示).设所考察的情况都在弹性范围之内,即应变与应力总是成比例的,在实际应用时结论只适用于小应变的情况. 设支点没有位移,则挠度曲线是在区间[-a,a]上的连续函数,且有f(-a)=0,f(0)=0,f(a)=0.考察所有这样的挠度曲线(函数形式)的集合: D={f|f∈C2[-a,a], f(-a)=0, f(0)=0, f(a)=0},这里C2[-a,a]表示所有在区间[-a,a]上有二阶连续导数的函数的集合. 设荷载F1产生挠度曲线y=f1(x),F2产生挠度曲线y=f2(x),由叠加原理知: F1与F2同时作用,则产生的挠度曲线为y=f1(x)+f2(x),这正是函数的加法. 这种加法显然是封闭的,且满足线性空间定义前4条性质(0就是恒等于零的函数——对应于零荷载; 与f相反的元素就是-f,它对应于反方向的荷载). 如果荷载F1是F2的k倍,即F1=kF2,则f1(x)=kf2(x),即f1=kf2.这正是常数与函数的乘法,它也是封闭的,且满足线性空间定义后4条性质,所以挠度曲线的集合D构成一个线性空间. 总之,在各种不同的领域都可以举出许多线性空间的例子.正因为线性空间是n维向量空间的抽象和推广,所以为了几何直观,有时我们又把线性空间叫作向量空间.但这里的向量不一定是有序数组,而是广义的向量,可以是以数学对象(如函数、矩阵等)为向量,也可以是以物理对象(如力、速度等)为向量. 3. 线性空间的基本性质 根据线性空间的定义,可以推证线性空间的下述性质: 性质1线性空间的零元素是唯一的. 事实上,如果01,02是线性空间V中的两个零元素,则根据定义有01=01+02=02+01=02.性质2任一元素的负元素是唯一的. 事实上,设x1,x2均为x∈V的负元素,则x1=x1+(x+x2)=(x1+x)+x2=x2.性质3设λ,0,-1,1∈P,x,-x,0∈V,则 (1) 0x=0; (2) (-1)x=-x; (3) λ0=0; (4) 若λx=0,则λ=0或x=0. 事实上,因为x+0x=1x+0x=(1+0)x=1x=x,所以0x=0; 因为x+(-1)x=1x+(-1)x=[1+(-1)]x=0x=0, 所以(-1)x=-x; 因为λ0=λ[x+(-1)x]=λx+(-λ)x=[λ+(-λ)]x=0x=0, 故λ0=0; 最后,若λ≠0,且x≠0,则x=1x=1[]λλx=1[]λ(λx)=1[]λ0=0,这与x≠0矛盾,故λ≠0与x≠0不能同时成立. 定义1.1.4只含一个元素的线性空间叫作零空间,显然,这个元素便是零元素. 4. 基、维数与坐标 由上面线性空间的定义容易知道,有限个向量组成的集合,总不能满足加法及数乘运算的封闭性,所以除只由一个零向量构成的零空间{0}外,一般线性空间都有无穷多个向量.于是提出两个问题: (1) 在无穷多个向量中能否找到有限个具有代表性的向量,使得线性空间中任一个向量都可以用这有限个向量来表示? (2) 线性空间的向量是抽象的,如何把它与具体的数组向量(a1,a2,…,an)联系起来,使线性空间中抽象的线性运算转化为数组向量的线性运算? 为了圆满地解答这两个问题,首先需要定义线性空间中向量组的线性相关性等基本概念. 如果x1,x2,…,xr(r≥1)为线性空间V中一组向量,k1,k2,…,kr是数域P中的数,那么向量x=k1x1+k2x2+…+krxr(1.1.1)称为向量x1,x2,…,xr的一个线性组合,有时也说向量x可用向量组x1,x2,…,xr线性表示. 例1.1.7对于例1.1.2中的线性空间Y,我们知道它的向量是微分方程y″-3y′+2y=0的解y=c1ex+c2e2x,其中c1与c2是独立的两个任意常数.这表明y是它的两个特解向量ex与e2x的线性组合. 如果式(1.1.1)中的k1,k2,…,kr不全为零,且使k1x1+k2x2+…+krxr=0,(1.1.2)则称向量组x1,x2,…,xr线性相关,否则就称其为线性无关.换句话说,如果等式(1.1.2)只有在k1=k2=…=kr=0时才成立,则称x1,x2,…,xr线性无关. 显然,如果x1,x2,…,xr中有一个为零元,则这r个元素必然是线性相关的,例如x1=0,则可置k1≠0,而令k2=k3=…=kr=0,使式(1.1.2)成立. 例1.1.8在Rn中,设有两个向量组ε1=(1,0,…,0), ε2=(0,1,…,0),  εn=(0,0,…,1),及ε′1=(1,1,…,1,1), ε′2=(0,1,…,1,1),  ε′n=(0,0,…,0,1).分别考察线性方程组k1ε1+k2ε2+…+knεn=0及k1ε′1+k2ε′2+…+knε′n=0.由于它们对应的系数行列式1[]0[]…[]0 0[]1[]…[]0 [][][] 0[]0[]…[]1=1≠0及1[]1[]…[]1[]1 0[]1[]…[]1[]1 [][][][] 0[]0[]…[]0[]1=1≠0,从而两个线性方程组都只有零解k1=k2=…=kn=0,故这两个向量组是线性无关的. 又如,例1.1.1中的线性空间P[x]n,取向量组1,x,x2,…,xn,当对任意x,使k1·1+k2x+k3x2+…+kn+1xn=0时,k1,k2,…,kn+1必须同时为零,因此,1,x,x2,…,xn线性无关; 同理,例1.1.2中的向量组ex,e2x,当c1ex+c2e2x=0时,c1与c2必须同时为零,所以ex与e2x也线性无关. 与Rn类似,在线性空间V中下列命题成立. 命题1.1.1当r≥2时,V中的向量组x1,x2,…,xr线性相关的充要条件是其中至少有一个向量可由向量组中其余向量线性表示; 而线性无关的充要条件则是其中每一个向量都不能由向量组中其余向量来线性表示. 命题1.1.2若V中向量组的某一子向量组线性相关,则该向量组也线性相关. 命题1.1.3若V中某向量组线性无关,则其任一子向量组也线性无关. 定义1.1.5设V是数域P上的线性空间,x1,x2,…,xn(n≥1)是属于V的任意n个向量,如果它满足: (1) x1,x2,…,xn线性无关; (2) V中任一向量x均可由x1,x2,…,xn来线性表示; 则称x1,x2,…,xn是V的一组基(或基底),并称x1,x2,…,xn为基向量. 线性空间V的基向量所含向量的个数n,称为线性空间V的维数,记为dim V=n,并称V为n维线性空间,可简记为Vn. 由定义1.1.5可见,维数实际上就是V中线性无关向量组中向量的最大个数,而基只不过是V中的最大线性无关组而已. 特别地,零空间的维数是0. 若在V中可以找到任意多个线性无关的向量,则称V是无限维线性空间. 按照上述定义,不难看出,例1.1.1中的线性空间P[x]n是n+1维的,因为前面已验证向量组1,x,x2,…,xn线性无关,且P[x]n中任一向量都可由这组向量线性表示,即f(x)=a0·1+a1x+a2x2+…+anxn.因此,1,x,x2,…,xn是P[x]n中的一组基.同样,例1.1.2中的线性空间Y是二维的,ex,e2x是Y中的一组基; 而例1.1.3中的矩阵空间Rn×n是n2维的线性空间,这是因为Rn×n的任一向量A=∑n[]i,j=1kijEij,其中Eij是第i行第j列的元素为1、其余为0的n阶方阵,且易验证Eij(i,j=1,2,…,n)线性无关,故dim Rn×n=n2,Eij(i,j=1,2,…,n)就是Rn×n的一组基. 读者不难验证,齐次线性方程组Ax=0的基础解系就是其解空间的一组基. 注意,一个线性空间的基不是唯一的.例如,在例1.1.8中已验证Rn中向量组ε1=(1,0,…,0),ε2=(0,1,…,0),…,εn=(0,0,…,1)及ε′1=(1,1,…,1,1),ε′2=(0,1,…,1,1),…,ε′n=(0,0,…,0,1)都是线性无关的,而且对任一向量x=(x1,x2,…,xn)∈Rn,分别有[]x=x1ε1+x2ε2+…+xnεn, []x=x1ε′1+(x2-x1)ε′2+…+(xn-xn-1)ε′n,所以它们都是Rn的基,并且称ε1,ε2,…,εn是Rn的自然基. 可以证明(见习题1(1)第18题),线性空间里不同基所含向量的个数是相等的,即线性空间的维数是确定的,不会因选取的基不同而改变. 另外,还必须指出,线性空间的基、维数与所考虑的数域有关. 例1.1.9如果把复数域C看作是自身上的线性空间,数1就是一组基,那么它是一维的; 如果把C看作是实数域R上的线性空间,数1,i就是一组基,那么它是二维的. 关于无限维线性空间的例子也是有的.如所有实系数多项式的集合(幂级数为向量)P[x]∞={a0+a1x+a2x2+…+anxn+…|ai∈R}在通常的多项式加法及数乘多项式的运算下形成的实线性空间,就是无限维的,因为对任意整数N,都有N个线性无关的向量1,x,x2,…,xN-1. 又如在[a,b]上所有实连续函数的集合C[a,b],它也是无限维的线性空间,因为找不到有限个连续函数作为它的基. 关于无限维线性空间的讨论,已超出本门课程的范围,它属于“泛函分析”课程研究的对象,本书主要讨论有限维线性空间. 定理1.1.1设x1,x2,…,xn是Vn的一组基,对于任何向量x∈Vn,则它可唯一地由x1,x2,…,xn线性表示. 证明设x由x1,x2,…,xn线性表示的式子有两个,即x=λ1x1+λ2x2+…+λnxn, x=μ1x1+μ2x2+…+μnxn,以上两式相减得(λ1-μ1)x1+(λ2-μ2)x2+…+(λn-μn)xn=0.由x1,x2,…,xn的线性无关性,知λ1=μ1,λ2=μ2,…,λn=μn.证毕 这样,线性空间Vn可表示为Vn={x=λ1x1+λ2x2+…+λnxn|λi∈R,i=1,2,…,n},这就较清楚地显示出线性空间中向量的构造,即Vn中的基x1,x2,…,xn的确起到了“代表”的作用,从而回答了前面提到的第一个问题.现在,我们来考虑第二个问题. 反之,任给一组有序数λ1,λ2,…,λn,总有唯一的向量x=λ1x1+λ2x2+…+λnxn∈Vn,这样,Vn中的向量x与有序数组(λ1,λ2,…,λn)之间存在着一种一一对应的关系.因此可以用这组有序数来表示向量x.于是我们有以下定义. 定义1.1.6设x1,x2,…,xn是线性空间Vn的一组基,对于任一向量x∈Vn,总有且仅有一组有序数a1,a2,…,an使x=a1x1+a2x2+…+anxn.这组有序数a1,a2,…,an就称为向量x在基x1,x2,…,xn下的坐标,并记作X=(a1,a2,…,an)或X=(a1,a2,…,an)T.例1.1.10若x1,x2,…,xn为Vn的一组基,则每个基向量恰好可表示为xi=0x1+…+0xi-1+1xi+0xi+1+…+0xn,即相应的坐标为Xi=(i-1个[]0,…,0,1,0,…,0),i=1,2,…,n由此还可见,假如在定义1.1.3中没有第(8)条1x=x的运算性质,我们就无法把xi写成基x1,x2,…,xn的线性组合,从而基、维数、坐标等概念也就无从谈起了. 需要指出,同一向量x在不同的基(或称坐标系)下的坐标往往是不同的. 例1.1.11在线性空间P[x]n中,多项式 f(x)=a0+a1x+a2x2+…+anxn