logo资料库

中科院自动化所考博--矩阵论笔记.doc

第1页 / 共25页
第2页 / 共25页
第3页 / 共25页
第4页 / 共25页
第5页 / 共25页
第6页 / 共25页
第7页 / 共25页
第8页 / 共25页
资料共25页,剩余部分请下载后查看
线性空间与线性变换
范数理论及其应用
矩阵分析及其应用
矩阵分解
特征值的估计以及对称矩阵的极性
广义逆矩阵
一些特殊的矩阵类
线性空间与线性变换 集合的表示形式:穷举 and 满足某种性质({1,2,3} and {x|1
矩阵的值域:由矩阵的列向量张成的线性子空间,记为 R(A)=L(a1,…,an)。 矩阵的秩 等于 矩阵值域的维数。 核空间(零空间):{x | Ax = 0},记为 N(A)。矩阵零空间的维数记为零度 n(A)。 Rank(A)+ n(A)= A 的列数;Rank(AT)+ n(AT)= AT 的列数 = A 的行数。 所以 n(A)- n(AT)= A 的列数 – A 的行数。 线性子空间的交:如果 V1 和 V2 是线性空间 V 的子空间,那么 V1 和 V2 的交也是 V 的子空 间。 Dim(V1)+ Dim(V2)= Dim(V1 + V2)+ Dim(V1 ∩ V2) 线性子空间的和:{z=x+y | x∈V1,y∈V2}也属于 V 的子空间。 直和(直接和):子空间和中的任意一个向量,只能唯一的由子空间 V1 的一个向量以及子 空间 V2 的一个向量表示。 直和的充分必要条件为 V1∩V2 = L(0) or Dim(V1)+ Dim(V2)= Dim(V1 + V2) 两个子空间的并集不一定是线性子空间。 线性变换(旋转,微分,基分):如果线性空间 V 的一个变换 T 满足 T(mx+ny)= mT(x)+ nT(y)  T(x+y)=T(x)+T(y)and T(mx)=mT(x) 线性变换把 线性相关的向量组 变换为线性相关的向量组。 线性变换把 线性无关的向量组 有可能 变换为线性相关的向量组(零变换)。 线性变换的值域(象子空间)和核空间(核子空间):R(T)= {Tx | x∈V} (x)= 0,x∈V}。线性变换的值域以及核 均为 V 的线性子空间。 N(T)= {x | T 线性变换的象子空间的维数为变换的秩,核子空间的维数为变换的零度(亏)。 线性变换的秩和亏在一定条件下与矩阵的秩和零度有相同的数量关系。 线性空间 V 的一组基{x1,…,Xn},T 为线性空间 V 的线性变换,则 R(T)= L(T(x1),…, T(xn)) 并且 dim(R(T))+ dim(N(T))= n。 单位变换:Te(x)= x。 零变换:T0(x)= 0。 线性变换性质(均可等价于变换矩阵): 1、 加法 (T1+T2)x = T1(x)+ T2(x)。 2、 数乘 (kT)x = k(Tx)。 3、 相乘 (T1T2)x = T1(T2(x))。 4、 逆变换 T-1T = TT-1 = Te。 5、 变换的多项式 Tn = Tn-1T,T0 = Te。T-n = (T-1)n。 T(m+n)= TmTn,(Tm)n = Tmn。 T1+T2 = A + B。 kT = kA。 T1T2 = AB。 T-1 = A-1。 矩阵多相式。
线性变换的矩阵表示:根据线性变换的定义,乍看起来,必须把线性空间 V 中所有向量的 象都找出来才能表示一个线性变换 T。但是,以为 T 是线性变换,因此只要把 V 中的基向量 的象确定下来便可。(体会里面的思想) 线性变换 T 可以由矩阵 A 表示: T(x)= T((x1,…,xn)(a1,…,an)T)= T(x1,…,xn)(a1,…,an)T; 由于 x1,…,x2 这组基的 T 变换后仍 可以由这组基表示  (x1,…,x2)A(a1,…,an)T; 因此线性变换 T 的矩阵为 A  T(x) = Ax。 向量的坐标以及线性变换的矩阵 随着 基的变换 而变换(加深理解矩阵相似的概念)。 设 A 是线性空间 V 的线性变换 T 的矩阵,那么: dim(R(T))= dim(R(A));dim(N(T))= dim(N(A))。 线性空间 V 中两个基{x1,…,xn},{y1,…,yn},且线性变换 T 在两个基下的矩阵分别为 A,B;且 两个基满足(y1,…,yn)= (x1,…,xn)C。那么: T(y1,…,yn)= T(x1,…,xn)C = (x1,…,xn)AC = (y1,…,yn)C-1AC = (y1,…,yn)B。所以有: B = C-1AC(相似,存在 n 阶可逆矩阵 C,使的 B = C-1AC,那么 A 相似于 B,A~B)。 相似的性质: 1、 反身性 A~A。 2、 对称性 A~B  B~A。 3、 传递性 A~B 且 B~C  A~C。 如果 B = P-1AP,且 f(t)是多项式,那么矩阵多项式 f(B) = P-1f(A)P。 如何选择线性空间的基,使的线性变换在该基下的矩阵形状最简单(引入特征值以及特征向 量)。 线性变换 T 的特征值和特征向量 等于 对应矩阵的特征值和特征向量。 特征矩阵:ηI - A。(顺序别反了) 特征多项式: 特征矩阵的行列式 det()。 特征值: 特征多项式的根(零点)。 特征向量:特征值所对应的非零向量。 计算线性变换的特征值/向量的步骤: 1、 找到线性空间的一组基。 2、 求线性变换 T 在该基下的对应矩阵(基在 T 变换后的向量,在相同基下的坐标,组 成变换的对应矩阵)。 3、 得到特征矩阵。 4、 得到特征多项式。 5、 求得多项式的根。 6、 求得根对应的非零向量(矩阵的特征向量)。 7、 由特征向量和基得到线性变换 T 的特征向量。
线性变换 T 的任意一个特征值η,T 的属于特征值η的全部特征向量加上零向量组成线性子 空间。 矩阵 A 的迹(对角元素的和)等于 A 的所有特征值(n 个 相同特征值也得加进去)的和。 A 的全体特征值的乘积等于 det(A): A 的行列式。 矩阵的迹的性质: 1、 tr(AB)= tr(BA)。通过迹的定义式可以推出来。 2、 相似矩阵的迹相同,tr(B)= tr(P-1AP)= tr(APP-1)= tr(A)。 3、 相似矩阵有相同的特征多项式。(线性变换的特征多项式与基无关,由变换决定) 4、 假设 A1,…,Am 均为方阵,且 A = diag(A1,…,Am)。那么 det(ηI - A)=连乘 det(η I - Ai)。 5、 假设 A 为 mXn 的矩阵,B 为 nXm 的矩阵。那么 AB 的特征多项式 fAB(η)与 BA 的特征多项式 gBA(η)有:ηn fAB(η)= ηm gBA(η)。 任意 n 阶矩阵与三角矩阵相似。 计算相似三角矩阵的步骤(p36):与归纳法证明的步骤相似。 矩阵 A 的特征多项式 f(η),则有 f(A)= 0。 1、 不论 A 是否可逆,由 An+a1An-1+…+anI = 0  An+a1An-1+…+an-1A = anI = anA-1A  anA-1= An-1+a1An-2+…+an-1I。 2、 A 的逆可以由他的 n-1 次矩阵多项式表示。A 的 n 次方也是。可以简化计算。 最小多项式(唯一):首系数为 1,系数最小的且以矩阵 A 为根的多项式。(一般为 A 的特征 多项式的因式, 最小多项式与特征多项式零点相同(个数不一定相同))。 如果 A 的特征多项式为(η-1)2(η-2),那么 A 的最小多项式为(η-1)(η-2)。 矩阵 A 的最小多项式可以整除以 A 为根的任意首系数为 1 的多项式。 矩阵 A 中同一个特征值的特征向量线性无关,不同特征值的特征向量线性无关,不同特征 值的特征向量组线性无关。 线性变换 T 可以在某一个基下表示为对角矩阵的 充分必要条件为 T 有 n 个线性无关的特征 向量。 矩阵 A 为 n 阶,A 与对角矩阵相似的 充分必要条件为 A 有 n 个线性无关的特征向量。 如果 n 阶矩阵有 n 个不同的特征值,那么矩阵与对角矩阵相似。但是与对角矩阵相似不一定 有 n 个不同的特征值。 如果 A 矩阵在 P-1AP 为对角阵,那么变换 A 在新基(x1,…,xn)P 下的对应矩阵便是那个对角 矩阵。 线性空间 V 的线性变换 T 能在某个基下为对角矩阵的充分必要条件为 所有特征值的特征向
量张城的空间的维度和 为 n。 任意的矩阵均存在可逆矩阵 P,使的矩阵相似于 Jordan 标准型。线性空间 V 中线性变换 T 必然存在一个基,是的变换的坐标为 Jordan 标准型。 特征子空间:矩阵的特征向量张成的空间。 相似矩阵有相同的特征多项式  有相同的特征值  有相同的 det。 多项式矩阵:矩阵中的元素含有η多项式(特征矩阵ηI-A 便是特殊的多项式矩阵)。 多项式矩阵的标准形:使用初等变换(行/列乘以η的多项式加到另一行/列)把多项式矩阵 变换为对角矩阵,前 s 个对角元素不为 0,后面 n-s 个对角元素全为 0。一个多项式矩阵的 标准形不随矩阵的初等变换而改变(因此标准形的对角元素为多项式矩阵的不变因子/不变 因式)。(除了初等变换计算不变因子,还可以通过其他方式计算 p48-50 问号标记) 把多项式矩阵的每个不变因子均分解为不可约因式的乘积,这样的不可约因式称为多项式矩 阵的初等因子,所有初等因子的全体称为多项式矩阵的初等因子组(注意初等因子组的形 式)。 求特征矩阵的 Jordan 标准形方法一: 1、 求特征矩阵ηI-A 的初等因子组,(η-η1)m1,…, (η-ηn)mn。其中ηi 与ηj 有可能 相等。 2、 写出每个初等因子对应的 Jordan 块(注意 Jordan 块的形式)。 3、 写出以这些 Jordan 块构成的 Jordan 标准形。 4、 写出标准形后,由 P-1AP=Jordan,求出 P 可逆矩阵(其中可能出现广义特征向量, 所有特征向量的个数不足 n,然后选一个线性无关向量满足 Jordan 等式,此向量便 是广义特征向量(与特征向量一样,对应于相应的特征值))。 求特征矩阵的 Jordan 标准形方法二: 矩阵 A 的特征值η,如果特征多项式中的重数为 m,但是特征值对应的特征向量个数为 n, 当 n= 0 且 当且仅当 x=0 时有(x,x)=0。
xTy。 欧式空间:定义了内积的实线性空间。 向量:(x,y)= 函数:(f,g)= 积分(fg)。 矩阵:(A,B)= 求和(aijbij)= tr(ATB)。 只要一个操作,满足内积的性质,便可以定义内积,从而得出对象的长度以及两个对象之 间的夹角。以及两个对象之间的正交性。 正交向量组。 正交三角函数组。 线性空间 V 中的一组基{x1,…,xn},在此坐标系下有两个向量 x= (x1,…,xn)(η1,…,ηn)T 和 y=(x1,…,xn)(γ1,…,γn)T,均可以以这组基进行表示。 那么(x,y)= xTy = (η1,…,ηn)A(γ1,…,γn)T, 其中 A=(aij)nxn,aij=(xi,xj)。 其中 A 为线性空间 V 的基的度量矩阵/Gram 矩阵。 基组成的矩阵为 C,那么基的度量矩阵 A=CTC,为正定对称矩阵。 度量矩阵/Gram 矩阵完全度量了内积,因此也可以用任意的正定矩阵作为度量矩阵来规定内 积。(向量的长度以及夹角等量,可以通过内积刻画,这也是度量矩阵名字的含义)。 在欧式空间内,n 个非零向量组成的正交向量组称为正交基;由单位向量组成的正交基为标 准正交基。 一个基为标准正交基的充分必要条件是其度量矩阵/Gram 矩阵为单位矩阵。 Schmidt 正交化方法(给一组基,转化为正交基/标准正交基): 1、 取 y1=x1; 2、 取 y2=x2+ηy1;利用正交条件得出η的值。 3、 取 y3=x3+ηy2+γy1;利用正交得出参数值。 4、 以此类推。得到正交基,单位化后得到标准正交基。 (x1,x2,…,x3) = (y1,y2,…,yn)A;通过上述正交化方法,得到 A 为上三角矩阵。 任意欧式空间,为其子空间以及子空间的正交补子空间的直和。 任意矩阵 A(mxn): 1、 A 的值域的正交补空间 等价于 AT 的零空间。 2、 AT 的值域的正交补空间, 等价于 A 的零空间。 3、 A 的值域子空间 与 AT 的零空间的直和 为 Rm 空间。 4、 AT 的值域子空间 与 A 的零空间的直和 为 Rn 空间。 正交变换:保持空间 V 中任意向量 x 的长度不变。(Tx,Tx)= (x,x)。(Tx,Ty)= (x,y)。 正交变换对应的矩阵为正交矩阵(列向量两两正交),ATA=I。 正交矩阵可逆,正交矩阵的逆矩阵仍是正交矩阵,两个正交矩阵乘积仍是正交矩阵。 欧式空间的线性变换是正交变换的充分必要条件是 其相对于标准正交基的矩阵为正交矩
阵。在别的基下不确定。 对称变换:空间中任意向量有(Tx,y)= (x,Ty)。那么 T 为 V 中的一个对称变换。 变换为对称变换的充分必要条件是 其相对于标准正交基的矩阵为 对称矩阵。 实对称矩阵的特征值都是实数。 实对称矩阵不同特征值所对应的特征向量是正交的。但是同意特征值的特征向量不一定正 交,但是可以 Schmidt 正交化。 欧式空间是针对实数域上的线性空间。 酉空间是复线性空间。 酉空间/复内积空间,定义一个操作(x,y)内积: 1、(x,y)= (y,x)H。其中(y,x)H 是(y,x)的共轭转置。 2、(x,y+z)= (x,y)+ (x,z)。 3、(kx,y)= k(x,y)。 4、(x,x)>= 0。当且仅当 x=0 时,实数(x,x)=0。 在复向量空间中(x,y)= xHy。其中 xH 是 x 的共轭转置。 酉变换:酉空间 V 中的正交变换 T,满足(Tx,Tx)= (x,x)。(Tx,Ty)= (x,y)。 酉变换在酉空间的标准正交基下的矩阵 A 为酉矩阵。AHA=AAH=I。 酉矩阵的逆矩阵还是酉矩阵,两个酉矩阵的乘积还是酉矩阵。 酉对称变换/Hermite 变换:满足(Tx,y)= (x,Ty)。 Hermite 变换在酉空间的标准正交基下的对应矩阵为 Hermite 矩阵:AH=A。 Hermite 矩阵的特征值都是实数。 Hermite 矩阵的不同特征值的特征向量必然正交。 正交矩阵 == 酉矩阵 对称矩阵 == Hermite 矩阵 正规矩阵:满足 AHA=AAH,正交矩阵,酉矩阵,实对称矩阵,Hermite 矩阵,对角矩阵均属 于正规矩阵。 复矩阵 A 酉相似于对角矩阵 充分必要条件为 A 为正规矩阵。 实矩阵 A 且 A 特征值都是实数, A 正交相似于对角矩阵 充分必要条件为 A 为正规矩阵。 实对称矩阵正交相似于对角矩阵。 T 为对称变换,存在标准正交基,使的 T 的矩阵为对角矩阵。
范数理论及其应用 数值方法的收敛性、稳定性及误差分析等问题,范数理论很重要(向量范数、矩阵范数)。 向量范数: 1、 非负性:当 x≠0,||x||>0;当 x=0,||x||=0。 2、 齐次性:||ax|| = |a|||x||。 3、 三角不等式:||x+y|| ≤ ||x|| + ||y||。 p-范数: 对于不小于 1 的任意实数 p 以及向量 x; (∑|xi|p)1/p 满足范数的单个条件。 或者再区间[a,b]上的连续函数集合,集合中一个元素为 f(t),那么其 p≥1 范数为; (∫|f(t)|p)1/p 加权范数/椭圆范数: A 是一个任意的对称正定矩阵(联想度量矩阵),则向量 x; ||x||A = (xTAx)1/2 。 线性空间中,||x||a,||x||b 为空间中任意两种向量范数,那么必定存在两个与向量 x 无关 的正常数 m,n 满足: m||x||b ≤ ||x||a ≤ n||x||b。 等价范数:满足这个不等式的两种范数 等价范数说明,如果向量序列 xk 再一种范数下收敛到 x;那么再另一种范数下也会收敛到 x。 虽然不同范数下向量大小不同。 广义矩阵范数: 1、 非负性:(参考向量范数) 2、 齐次性:(参考向量范数) 3、 三角不等式:(参考向量范数) 矩阵范数: 1、 非负性:(参考向量范数) 2、 齐次性:(参考向量范数) 3、 三角不等式:(参考向量范数) 4、 相容性:||AB|| ≤ ||A||||B||。 矩阵范数(A 为 m X n 的矩阵): 1、||A||m1 = ∑∑|aij| 。 2、||A||m∞ = n max|aij| 。
分享到:
收藏