西安科技大学 研究生 数值分析课件7章矩阵特征值与特征向量的计算.doc
《西安科技大学 研究生 数值分析课件7章矩阵特征值与特征向量的计算.doc》由会员分享,可在线阅读,更多相关《西安科技大学 研究生 数值分析课件7章矩阵特征值与特征向量的计算.doc(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、7 矩阵特征值与特征向量的计算 ,Ax,x,设为n阶方阵,所谓的特征值问题是求数和非零向量,使成立。数AAx,称作的一个特征值,非零向量称作与特征值对应的特征向量。求给定方阵的特征值Ax与特征向量是先求解特征方程 ,()|0,EA然后对应于每一个特征值,再求解退化的齐次线性方程组 ,i()0,EAx,i从而得到的特征值及对应的特征向量。 A,xi但是这种方法计算机很大,计算过程复杂,因此有必要研究相对简单的数值解法。本章主要介绍三类计算特征值的方法:计算大型(稀疏)矩阵主特征的幂法与反幂法,计算中小型(实对称)矩阵全部特征值的Jacobi法,计算中小型矩阵全部特征值的QR法。 7.1 特征值估
2、计 在矩阵特征值计算中,有时需要对特征值所在范围给出一个估计。这里介绍一种从矩阵的元素出发,运用较简便的运算估计特征值的方法。 nm,AaC,()定义7-1 设,称由不等式 ij|zaR,iiiiA在复平面上确定的区域为矩阵的第个盖尔圆(Gerschgorin圆),并用表示。 GinRa,|其中称为盖尔圆的半径。 G(1,2,)in,?,iijij,1ji,nm,AaC,()定理7-1 矩阵的一切特征值均落在它的个盖尔圆的并集中,即 nijn,Gin(1,2,)?。 :ij,1jT,A证明 设是的任一特征值,是对应的特征向量。 xxxx,(,)?12nn|max|xx,Axx,()axx,x,
3、0令,则。由,可得。即 ii,iijji00001,in,1jn(,a)x,ax,iiiijj0000,1j,ji0nnxxjj于是有 ,a,a,a,R ,iiijiji00000xx,j1j1ii00,jiji00A,Gn这表明任一特征值,从而也在的第个盖尔圆的并集中。 i010.10.20.3,,0.530.10.2,例7-1 估计矩阵的特征值范围。 A,10.310.5,0.20.30.14,,解 的4个盖尔圆为: AGz:|1|0.6,Gz:|3|0.8,Gz:|1|1.8,,Gz:|4|0.6,,1234画在复平面上其区域如图7-1所示。 图7-1 例7-1盖尔圆分布图 A于是的全部
4、特征值就在这4个盖尔圆的并集中。为了更确切地知道某个特征值落在哪个或哪几个盖尔圆的并集中,给出如下第二盖尔圆盘定理。 A定理7-2 若的个盖尔圆中,有个盖尔圆构成的一个连通域(所谓连通域,是指nm其中的任意两点都可以用位于该区域内的一条折线连接起来),且该连通域与其余个nm,A盖尔圆严格分离,则在该连通域中恰好有的个特征值(重特征值按重数重复计算)。特mA别地,每个孤立的盖尔圆恰有的一个特征值(证明从略)。 A由定理2可知,在例1中与中各有的一个特征值,而与构成的连通部分GGGG2431中有两个特征值,但不能确定这两个特征值具体落在哪个盖尔圆中。 10.8,,例7-2 估计矩阵的特征值范围。
5、A,0.50,A解 的两个盖尔圆为: Gz:|1|0.8,Gz:|0|0.5,, 12在复平面上的区域如图7-2所示。 图7-2 例7-2盖尔圆分布图 此时只能判断的两个特征值落在与的并集中,至于是每个盖尔圆中各有一个特AGG21征值还是两个特征值都落在其中一个盖尔圆上则无法确定。实际上,由于1,所以两个特征值都不会在盖尔圆中,而是落,(10.6)j|0.40.5,G,1,221,22在盖尔圆中。 G1对于某些矩阵,可利用相似变换矩阵具有相同特征值的性质得到更确切的特征值范围。 设,取正数构成对角阵,对作相似AAa,()ddd,?Dddd,diag(,)?ijnm,12n12nd,1i,()变
6、换,令BDADa,由于B相似于A,所以B与A的特征值完全相同,又ijnn,dj由于与的主对角线元素对应相等,所以与的盖尔圆圆心相同。这表明,若适当选BABA取正数,可以改变盖尔圆的半径,从而有可能将相交的盖尔圆分离得到仅含一ddd,?12ni个特征值的孤立盖尔圆。选取的一般方法是:欲使A的第个盖尔圆的半径ddd,?G12ni大而其余盖尔圆变小,就取,其余。 dji,1()d,1ji2050.8,,A,4101例7-3 求矩阵的特征值范围。 ,1210j,A解 的3个盖尔圆为: , Gz:|20|5.8,Gz:|10|5,Gzj:|10|3,123其中与相交,而孤立。记中所含的一个特征值为,如图
7、7-3所示。 GGGG,23313A为分离与,可以让的第3行元素绝对值变大,第3列元素绝对值变小。 GG21现取,则 D,diag(1,1,2)2050.4,,1BDAD,4100.5 ,2410j,图7-3 例3盖尔圆分布图 图7-4 例7-3分离后盖尔圆分布图 ,Gz:|20|5.4,Gz:|10|4.5,Gzj:|10|6,其3个盖尔圆分别是:, 123,BG显然,的盖尔圆是3个孤立的盖尔圆,如图7-4,注意,此情况下,的半径变大了。 3例7-4 设矩阵按行严格对角占优,则可逆。 AAa,()ijnn,n证明 由线性代数知,可逆的充分条件是,而(其中是的A|A,A,|0A,jj,1j特征
8、值),所以只要证明即可。 ,0(1,2,)jn,?j,设是的任一特征值,则必存在某个盖尔圆使。 AG,a,R,a,iiiijij,i,0,若,则有,而这与按行严格对角占优矛盾,故应有,由A,0a,a,iiijjj,i的任意性,得。 |0A,7.2 幂法与反幂法 在线性代数中,设A是阶方阵,若A存在个线性无关的特征向量,则称这个特nnn征向量构成A的一个完全的特征向量组。 例如,对矩阵 320,110,,A,230B,430, ,005102,AB通过求解特征方程,不难求出的三个特征值为,的三个特征值,1,5123AB为。方阵可以找到三个线性无关的特征向量,而方阵找不到三个线,2,1123AB性
9、无关的特征向量。我们称方阵可对角化,而不可对角化。 7.2.1 幂法 幂法的基本思想是构造一个向量序列使之逼近主特征值(矩阵的按模最大的特征值)对应的特征向量,然后求出主特征值。该方法简单易行,但收敛速度较慢。 Aa,()现设有一个完全的特征向量组xxx,?,其对应的特征值是ijnn,12nA,?,。已知的主特征值是单根,即特征值满足条件 12n1|,? 12nAu任取一个非零初始向量,由矩阵构造向量序列 0uAu,10,2uAuAu,210, ?,,k1uAuAu,,kk10,?,nARuxxx,?由于的完全特征向量组可以作为向量空间的一组基,因此可由线12n0性表示,即有 uaxaxax,
10、,?a,0 (设) 01122nn1kkkkuAuaxaxax,,,?0111222knnnn于是 ,,kkki()(),,,,axaxax,111111iik,2i1,n,iki,1(i,2,?,n)k,其中。注意到,故当时,因此有 ,ax(),0,kkii,21i1k uax,k111kk由于是主特征值对应的特征向量,其乘上常数因子仍为的特征向量,故当充x,a11111分大时,迭代向量是的特征向量的近似向量。 u,k1i为了利用迭代向量求出主特征值的近似值,设表示的第个分量,则 ,()uu1kik()()()uax,,kiiki,1111 ,1()()()uax,,kiiki11()uki
11、,1于是 ,lim1k,()ukik这表明两相邻迭代向量对应分量的比值收敛于主特征值,亦即当充分大时,可用两相邻迭代向量的分量比作为主特征值的近似值,即 ()uki,1 ,1()ukiA若主特征值是的重实特征值,即,对应的个线性无,?(1)rnrr12r关特征向量为。则有 xxx,?12nrn,,kkkiuAuaxax(),, ,kiiii01,iir,,111,k当充分大时, rk uax,kii1,i1即u仍为主特征值对应的特征向量的近似向量,相邻两迭代向量的分量比仍为主特征k值的近似值。综上所述,有 A定理7-3 设是n阶实矩阵,具有完全的特征向量组,主特征值是重根,即 r|(1),?r
12、n 112rrn,u则对任意非零初始向量,迭代向量 0k uAu,k0ru()ukki,1lim(0),axa,满足 , lim,1ii1k,kk,()u,1i1kir()ukki,1,或 , uax,kii11()u,i1kiAAuu,这样用非零初始向量及矩阵构造向量序列以计算的主特征值及相应的0k1特征向量的方法称为幂法。不过从上面的讨论中可以看到,如果或,迭代向,1|1,11k,量当时,其不为零的分量就会趋于无穷大或趋于零。为克服这个缺点,可以在每uk步迭代中加上对向量规范化的步骤,使迭代向量的数量级保持在一个稳定的量级上,归纳起来,幂法的计算步骤为: (0)k,1步骤1 给定非零初始向
13、量,精度,令;令 ,; u,vu,max()v0120010()k 迭代,其中表示绝对值最大的分量; 步骤2u,Avmax(u)u,max()ukk,1kk1kuk步骤3 规范化; v,kmax()uk()(1)kk,()k步骤4 若且,则即为的近似特征向量,即vv,v,|,kk,11k11112k,k,1为的近似值;否则,转步骤2继续迭代。 ,1例7-5 用幂法计算 1.01.00.5,,A,1.01.00.25 ,0.50.252.0,的主特征值和相应的特征向量,结果见表7-1。 表7-1 T max()u(规范化向量) vK kK0 (1,1,1) 1 1 (0.9091,0.8182,
14、1) 2.7500000 5 (0.7651,0.6674,1) 2.558791 10 (0.7494,0.6508,1) 2.558791 15 (0.7483,0.6497,1) 2.5366256 16 (0.7483,0.6497,1) 2.5365840 17 (0.7482,0.6497,1) 2.5365598 18 (0.7482,0.6497,1) 2.5365598 19 (0.7482,0.6497,1) 2.5365374 20 (0.7482,0.6497,1) 2.5365323 而此题的准确值为 T,2.5365258 x,(0.748221,0.649661,
15、1.000000)117.2.2 幂法的加速 ,2r,r,1幂法的收敛速度由比值来确定,越小收敛越快,而当时收敛可能很慢。r,1为了克服这一缺点,常采用原点平移法对幂法进行加速。 ABp,?设BApE,,其中是待定参数。显然,若的特征值为,则的相12nABkin(1,2,),?,ppp,?应特征值为,且、的特征向量相同。这是因i12nAB|0AE,|()|0BkEApkE,,,为对有特征方程,而对有特征方程,所以 iii,,,pkkp, iiii另一方面,若是的对应的特征向量,即 Ax,iiAxx,iii则 BxApExAxpxpx,()(),iiiiii原点平移法的思想是引入矩阵,恰当的选择
16、参数,使是的主特征值,BBpkp,11,p22rr,max且其速比,这样用幂法求的主特征值的收敛速度就快于用BkBA1,p,11幂法求A的主特征值,而一旦求出,由可得A的主特征值,达到了加速的kkp,,1111目的。但是为了选取恰当的选择参数,需要对的特征值的分布的大致了解。 Ap例7-6 设4阶方阵A有特征值 ,15(1,2,3,4)jjj,2其速比。作变换 r,0.9A,1BApEp,(12)k12rr,B则的特征值为,其速比。 k,2k,1k,0k,1BA2134k21A设的实特征值满足 ,?121nn,若的值可大致估计出,若要求,考察待定参数p的选取。 ,2n1B在原点平移法通过变换后
17、,不论p如何选取,矩阵的主特征值也只能是B,A,pEBp在,p或 ,p。若希望求,,就应选择,使,p称为的主特征值,即 n111|,pp 1nB这时的收敛速比r是比值|/|,pp和|/|,pp中的较大者,即 n1B21,|,p|,p,n2r,max, ,B|,pp,11Bprrp()显然依赖于的选取,记做。为了使应用幂法求的主特征值的收敛速度尽可能BB*快,我们希望选择最佳参数,使 p* rprp()min(),BB*由r的表示式(求二者之间的较大值)和对r(p)的最小化要求,只有当 r(p)BBB|,pp 2nrp(),pp,时,达到最小。由于会有得到矛盾的结果(),所以只能是 B2n2n,
18、pp() 2n,,*2np,即 2,类似地,若用反幂法求最小特征值,若,可大致估计,取最佳平移参数 nn,11,,*n,11 p,2例7-7 取,用原点平移法,计算例7-7中矩阵的主特征值。 Ap,0.75解 作变换,则 BApE,0.2510.5,,B,10.250.25 ,0.50.251.25,对B应用幂法,计算结果见表7-2。即,则A的主特征值为 k,1.7865914,11,,,k0.752.536591411与例7-5比较,上述结果比例7-5迭代15次还好。 表7-2 T max()u(规范化向量) vk kK0 (1,1,1) 1 5 (0.7516,0.6522,1) 1.79
19、14011 6 (0.7491,0.6511,1) 1.7888443 7 (0.7488,0.6501,1) 1.7873300 8 (0.7484,0.6499,1) 1.7869152 9 (0.7483,0.6497,1) 1.7866587 10 (0.7482,0.6497,1) 1.7865914 7.2.3 反幂法 AA设方阵按模最小的特征值是,且,则可逆。于是,由,可得,0Axx,nnnnn11,1,1,1,1AAA,这表明是的主特征值。反幂法就是将幂法应用于,通过求出Axx,nn,nnA的主特征值得到的按模最小的特征值及其对应的特征向量。 A定理7-4 设是阶实矩阵,具有完
20、全的特征向量组,其特征值满足 n|0,? 12nuv,则对任意非零初始向量,按下述方式构造的迭代向量 00u,1k , uAv,v,kkk,1max()uk满足 x1nlim,u,, vlimmax()kk,kk,max()xnn1vxx,/max()u,, max()knnk,nA在实际计算中,可先对进行LU分解,通过求解 Lyv,Uuy, , kk,1kk来求解方程组。反幂法的计算步骤为: Auv,kk,1(0)步骤1 预先取定非零向量;给定精度;取; uv,max()u0012n0LUALU,k,1步骤2 对矩阵作分解,;令; A步骤3 求解方程组 , Lyv,Uuy,kk,1kk得到迭
21、代向量; ukuk步骤4 规范化 v,kmax()uk()(1)kk,步骤5 若且,则即为的对应于的近似特征向Avv,v,|,kk,11knnn21k,k,1量,即为的近似值;否则,令,转步骤3继续迭代。 ,n()k,n7.3 矩阵的两种正交变换 本节先介绍镜面(初等)反射变换和平面旋转变换,它们是QR算法和Jacobi算法的基础。 7.3.1 豪斯荷尔德(House holder)变换 BB定义7-2 设有方阵,若当时,则称是上 b,0ij,,1(,1,2,)ijn,?ijHessenberg矩阵,即 bbb?,11121n,bbb?21222n,B, ,?,bbnnnn,1,,,1定义7-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 西安科技大学 研究生 数值分析课件7章矩阵特征值与特征向量的计算 西安 科技大学 数值 分析 课件 矩阵 特征值 特征向量 计算
限制150内