第8章-矩阵特征值计算..ppt
《第8章-矩阵特征值计算..ppt》由会员分享,可在线阅读,更多相关《第8章-矩阵特征值计算..ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、上页上页下页下页第第8章章 矩阵特征值计算矩阵特征值计算8.1 特征值性质和估计特征值性质和估计8.2 幂法及反幂法幂法及反幂法8.3 正交变化与矩阵分解正交变化与矩阵分解8.4 QR方法方法上页上页下页下页8.1 特征值性质和估计特征值性质和估计 工程技术中有多种振动问题,如桥梁或建筑物的工程技术中有多种振动问题,如桥梁或建筑物的振动,机械零件、飞机机翼的振动,及一些稳定性分振动,机械零件、飞机机翼的振动,及一些稳定性分析和相关分析在数学上都可转化为求矩阵特征值与特析和相关分析在数学上都可转化为求矩阵特征值与特征向量的问题征向量的问题.下面先复习一些矩阵的特征值和特征向量的基础下面先复习一些
2、矩阵的特征值和特征向量的基础知识及性质知识及性质.上页上页下页下页8.1.1 特征值问题及性质特征值问题及性质求求A的特征值问题的特征值问题(1.1)等价于求等价于求A的特征方程的特征方程设矩阵设矩阵A Rnn,特征值问题是求,特征值问题是求 C和非零向和非零向量量x Rn,使,使的根的根.在在5.1.3节已经给出特征值的一些性质,下面节已经给出特征值的一些性质,下面再补充一些基本性质再补充一些基本性质.Ax=x (1.1)其中其中 是矩阵是矩阵A的的特征值特征值,x是矩阵是矩阵A属于特征值属于特征值 的的特征向量特征向量.本章讨论计算矩阵特征值的数值方法本章讨论计算矩阵特征值的数值方法,在在
3、科学和工程技术中很多问题在数学上都归结为求矩科学和工程技术中很多问题在数学上都归结为求矩阵的特征值问题阵的特征值问题.上页上页下页下页 定理定理1 设设 为为ARnn的特征值的特征值,且且Ax=x,x 0,则有则有 (2)-为为A-I的特征值,即的特征值,即(A-I)x=(-)x;(1)c 为的为的cA特征值特征值(c 0为常数为常数);(3)k为为Ak的特征值,即的特征值,即Akx=kx;(4)设设A为为非奇异矩阵,那么非奇异矩阵,那么 0,且且-1为为A-1的特的特征值,即征值,即A-1x=-1x.上页上页下页下页 定理定理2 (1)设矩阵设矩阵ARnn可对角化,即存在非可对角化,即存在非
4、奇异矩阵奇异矩阵P使使的充分必要条件是的充分必要条件是A具有具有n个线性无关的特征向量个线性无关的特征向量.(2)如果矩阵如果矩阵ARnn有有m个个(mn)不同的特征不同的特征值值 1,2,m,则对应的特征向量则对应的特征向量 x1,x2,xm 线性无关线性无关.上页上页下页下页 定理定理3(对称矩阵的正交约化对称矩阵的正交约化)设设ARnn为对称为对称矩阵,则矩阵,则 (3)存在一个正交矩阵存在一个正交矩阵P使的使的且且 1,2,n为为A的特征值,而的特征值,而P(u1,u2,un)的的列向量列向量uj为为A的对应于的对应于 j 的单位特征向量的单位特征向量.(1)A的特征值均为实数;的特征
5、值均为实数;(2)A有有n个线性无关的特征向量;个线性无关的特征向量;上页上页下页下页 定义定义 设设ARnn为为对称矩阵对称矩阵,对于任一非零向对于任一非零向量量x 0,称,称为对应于向量为对应于向量x的的瑞利瑞利(Rayleigh)商商.定理定理4 设设ARnn为为对称矩阵对称矩阵(其特征值依次记其特征值依次记为为 1 2 n),则则 (1).(对任何非零对任何非零xRn);(2).;(1.3)上页上页下页下页 证明证明 只证只证(1),关于,关于(2)自己作练习自己作练习.由于由于A为实对称矩阵,可将为实对称矩阵,可将 1,2,n 对应的对应的特征向量特征向量 x1,x2,xn 正交规范
6、化,则有正交规范化,则有(xi,xj)=ij,设,设x 0为为Rn中中任一向量,则有任一向量,则有于是于是从而从而(1)成立成立.结论结论(1)说明说明瑞利商瑞利商必位于必位于 n和和 1之之间间.上页上页下页下页8.1.2 特征值估计与扰动特征值估计与扰动 定义定义1 设设n阶矩阵阶矩阵A=(aij),令,令 (1);(2)集合集合 称为复平称为复平面上以面上以aii为为圆心,以圆心,以ri为半径的为半径的n阶矩阵阶矩阵A的的n个个格什格什戈林戈林(Gerschgorin)圆盘圆盘.上页上页下页下页 定理定理5(Gerschgorin圆盘定理圆盘定理)特别地,如果特别地,如果A的一个圆盘的一
7、个圆盘Di是与其它圆盘分离是与其它圆盘分离(即即孤立圆盘孤立圆盘),则,则Di中中精确地包含精确地包含A的一个特征值的一个特征值.(1)设设n阶矩阵阶矩阵A(aij),则,则A的每一个特征值必的每一个特征值必属于下面某个圆盘之中属于下面某个圆盘之中 (2)如果如果A有有m个个圆盘圆盘组成一个连通的并集组成一个连通的并集S,且且S与余下与余下n-m个个圆盘圆盘是分离的,则是分离的,则S内恰包含内恰包含A的的m个特征值个特征值.或者说或者说 A的特征值都在的特征值都在n个圆盘的个圆盘的并集并集中中.上页上页下页下页 证明证明 只就只就(1)给出证明给出证明.设设 为为A的特征值,即的特征值,即 A
8、x=x,其中,其中 x=(x1,x2,xn)T 0.或或 记记 ,考虑,考虑Ax=x的第的第k个方程,个方程,即即于是于是即即上页上页下页下页这说明,这说明,A的每一个特征值必位于的每一个特征值必位于A的一个圆盘的一个圆盘中,并且相应的特征值中,并且相应的特征值 一定位于第一定位于第k个圆盘中个圆盘中(其中其中k是对应特征向量是对应特征向量x绝对值最大的分量的下标绝对值最大的分量的下标).利用相似矩阵性质,有时可以获得利用相似矩阵性质,有时可以获得A的特征值进的特征值进一步的估计,即适当选取非奇异对角阵一步的估计,即适当选取非奇异对角阵并做相似变换并做相似变换 .适当选取适当选取 可使可使某些
9、圆盘半径及连通性发生变化某些圆盘半径及连通性发生变化.上页上页下页下页 例例1 估计矩阵估计矩阵A的特征值范围,其中的特征值范围,其中 解解 矩阵矩阵A的的3个圆盘为个圆盘为 由定理由定理8,可知,可知A的的3个特征值位于个特征值位于3个圆盘的并个圆盘的并集中,由于集中,由于D1是是孤立圆盘,所以孤立圆盘,所以D1内恰好包含内恰好包含A的一的一个特征值个特征值 1(为实特征值为实特征值),即,即A的其它两个特征值的其它两个特征值 2,3包含在包含在D2,D3的并集中的并集中.上页上页下页下页现在取对角阵现在取对角阵做相似变换做相似变换 矩阵矩阵A1的的3个圆盘为个圆盘为上页上页下页下页显然,显
10、然,3个圆盘都是孤立圆盘,所以,每一个圆个圆盘都是孤立圆盘,所以,每一个圆盘都包含盘都包含A的一个特征值的一个特征值(为实特征值为实特征值),且有估计,且有估计上页上页下页下页 定理定理6(Bauer-Fike定理定理)设设 是是A+IRnn的一个的一个特征值,且特征值,且P-1AP=D=diag(1,2,n),则有,则有其中其中|p为矩阵的为矩阵的p范数,范数,p=1,2,.证明证明 由于由于 (A)时时显然成立显然成立,故只考虑故只考虑 (A).这时这时D-I非奇异,设非奇异,设x是是A+I对应于对应于 的特征向量,由的特征向量,由(A+I-I)x=0左乘左乘P-1可得可得而对角矩阵而对角
11、矩阵(D-I)-1的范数为的范数为所以有所以有这就得到这就得到(1.5)式式.这时总有这时总有(A A)中的一个中的一个 取到取到m值值.上页上页下页下页 由定理由定理6可知可知|P-1|P|=cond(P)是特征值扰动的是特征值扰动的放大系数,但将放大系数,但将A对角化的相似变化矩阵不是唯一的,对角化的相似变化矩阵不是唯一的,所以取所以取cond(P)的下确界的下确界称为特征值问题的条件数称为特征值问题的条件数.只要只要v(A)不很大,矩阵微不很大,矩阵微小扰动只带来特征值的微小扰动小扰动只带来特征值的微小扰动.但是但是v(A)难以计算难以计算,有时只对一个有时只对一个P,用,用cond(P
12、)代替代替v(A).特征值问题的条件数和解线性方程组时的矩阵是特征值问题的条件数和解线性方程组时的矩阵是两个不同的概念,对于一个矩阵两个不同的概念,对于一个矩阵A,两者可能一大一,两者可能一大一小,例如二阶矩阵小,例如二阶矩阵A=diag(1,10-10),有,有v(A)=1,但解,但解线性方程组的矩阵条件数线性方程组的矩阵条件数cond(A)=1010.上页上页下页下页 关于计算矩阵关于计算矩阵A的特征值问题,当的特征值问题,当n=2,3时,我们时,我们还可按行列式展开的办法求特征方程还可按行列式展开的办法求特征方程p()=0的根的根.但但当当n较大时,如果按展开行列式的办法较大时,如果按展
13、开行列式的办法,首先求出首先求出p()的系数,再求的系数,再求p()的根,工作量就非常大,用这的根,工作量就非常大,用这种办法求矩阵特征值是不切实际的,由此需要研究种办法求矩阵特征值是不切实际的,由此需要研究A的特征值及特征向量的数值方法的特征值及特征向量的数值方法.本章将介绍一些计算机上常用的两类方法,一类本章将介绍一些计算机上常用的两类方法,一类是幂法及反幂法是幂法及反幂法(迭代法迭代法),另一类是正交相似变化的,另一类是正交相似变化的方法方法(变化法变化法).上页上页下页下页8.2 幂法及反幂法幂法及反幂法 幂法与反幂法都是求幂法与反幂法都是求实矩阵实矩阵的特征值和特征向的特征值和特征向
14、量的量的向量迭代法向量迭代法,所不同的是幂法是计算矩阵的,所不同的是幂法是计算矩阵的主主特征值特征值(矩阵矩阵按模最大的特征值按模最大的特征值称为称为主特征值主特征值,其模,其模就是该矩阵的就是该矩阵的谱半径谱半径)和和相应特征向量相应特征向量的一种向量迭的一种向量迭代法,特别适用于大型稀疏矩阵代法,特别适用于大型稀疏矩阵.而反幂法则是计而反幂法则是计算非奇异算非奇异(可逆可逆)矩阵矩阵按模最小的特征值按模最小的特征值和和相应特征相应特征向量向量的一种向量迭代法,特别是计算海森伯格阵或的一种向量迭代法,特别是计算海森伯格阵或三对角阵的对应一个给定近似特征值的特征向量的三对角阵的对应一个给定近似
15、特征值的特征向量的有效方法之一有效方法之一.下面分别介绍幂法与反幂法下面分别介绍幂法与反幂法.上页上页下页下页8.2.1 幂法幂法(又称又称乘幂法乘幂法)现讨论求现讨论求 1及及x1的方法的方法.设实矩阵设实矩阵A=(aij)有有一个一个完全的特征向量组完全的特征向量组,即,即A有有n个线性无关的特征向量个线性无关的特征向量,设矩阵,设矩阵A的特征值为的特征值为 1,2,n,相应的特征向量为相应的特征向量为x1,x2,xn.已知已知A的主特征值的主特征值 1是实根,且满足条件是实根,且满足条件上页上页下页下页 幂法的幂法的基本思想基本思想是是:任取任取非零非零的初始向量的初始向量v0,由由矩阵
16、矩阵A构造一向量序列构造一向量序列vk称为迭代向量,由假设,称为迭代向量,由假设,v0可唯一表示为可唯一表示为上页上页下页下页于是于是其中其中由假设由假设 故故 从而从而为为 1的特征向量的特征向量.上页上页下页下页所以当所以当k充分大时,有充分大时,有即为矩阵即为矩阵A的的对应特征值对应特征值 1 的一个近似特征向量的一个近似特征向量.用用(vk)i 表示表示vk的第的第i个分量,则当个分量,则当k充分大时,有充分大时,有即为即为A的的主特征值主特征值 1的近似值的近似值.由于由于 这种由已知非零向量这种由已知非零向量v0及矩阵及矩阵A的乘幂的乘幂Ak构造向构造向量序列量序列vk以计算以计算
17、A的的主特征值主特征值 1(利用利用(2.7)式式)及相及相应特征向量应特征向量(利用利用(2.5)式式)的方法就称为的方法就称为(乘乘)幂法幂法.上页上页下页下页 迭代公式实质上是由矩阵迭代公式实质上是由矩阵A的乘幂的乘幂 Ak与非零向量与非零向量v0相乘来构造向量序列相乘来构造向量序列vk=Akv0,从而计算主特征从而计算主特征值值 1及其对应的特征向量,这就是及其对应的特征向量,这就是幂法幂法的思想的思想.的收敛速度由比值的收敛速度由比值来确定,来确定,r 越小收敛越快,但当越小收敛越快,但当r 1 1时收敛可能很慢时收敛可能很慢.总结上述讨论,有下面的定理总结上述讨论,有下面的定理.上
18、页上页下页下页 定理定理7 设设ARnn有有n个线性无关的特征向量,个线性无关的特征向量,主特征值主特征值 1满足满足|1|2|n|,则对则对任何非零向量任何非零向量v0(a1 0),(2.4)式和式和(2.7)式成立式成立.又设又设A有有n个线性无关的特征向量,个线性无关的特征向量,1对应的对应的r个线性个线性无关的特征向量为无关的特征向量为x1,x2,xr,则由则由(2.2)式有式有 如果如果A的主特征值为实的重根的主特征值为实的重根,即即 1=2=r,且且|r|r+1|n|,上页上页下页下页为为 1的特征向量,这说明当的特征向量,这说明当A的主特征值是实的重根的主特征值是实的重根时,定理
19、时,定理7的结论还是正确的的结论还是正确的.应用应用幂法幂法计算计算A的主特征值的主特征值 1及其对应的特征向及其对应的特征向量时量时,如果如果|1|1(或或|1|2|n|,则对,则对任意非零任意非零初始向量初始向量v0=u0(a1 0),有,有幂法计算公式为幂法计算公式为(uk,vk)则有则有 (1)(2)上页上页下页下页例例2 用幂法计算矩阵用幂法计算矩阵的主特征值和相应的特征向量的主特征值和相应的特征向量.解解取取 v0=u0=(1,1,1)T,则则上页上页下页下页计算结果如下表计算结果如下表k0(1,1,1)1(0.9091,0.8182,1)2.75000005(0.7651,0.6
20、674,1)2.558791810(0.7494,0.6508,1)2.538002915(0.7483,0.6497,1)2.536625616(0.7483,0.6497,1)2.536584017(0.7482,0.6497,1)2.536559818(0.7482,0.6497,1)2.536545619(0.7482,0.6497,1)2.536537420(0.7482,0.6497,1)2.5365323上页上页下页下页这个结果是用这个结果是用8位浮点数字进行运算得到的位浮点数字进行运算得到的,uk的分量值是舍入值的分量值是舍入值.于是得到于是得到及相应的特征向量及相应的特征向量
21、(0.7482,0.6497,1)T.1和相应的和相应的特征向量的真值特征向量的真值(8位数字位数字)为为上页上页下页下页例例 用幂法计算矩阵用幂法计算矩阵的主特征值与其对应的特征向量的主特征值与其对应的特征向量.解解取取 v0=u0=(0,0,1)T ,则则上页上页下页下页直到直到k=8 时的计算结果见下表时的计算结果见下表k1 2,4,1,4 0.5,1,0.252 4.5,9,7.75 90.5,1,0.86113 5.7222,11.4444,8.36111.44440.5,1,0.73604 5.4621,10.9223,8.2306 10.92230.5,1,0.75365 5.5
22、075,11.0142,8.2576 11.01420.5,1,0.74946 5.4987,10.9974,8.2494 10.99740.5,1,0.75017 5.5002,11.0005,8.2501 11.00050.5,1,0.75008 5.5000,11.0000,8.2500 11.00000.5,1,0.7500从而从而上页上页下页下页8.2.2 加速方法加速方法1、原点平移法原点平移法 由前面讨论知道,应用幂法计算由前面讨论知道,应用幂法计算A的主特征值的的主特征值的收敛速度主要由比值收敛速度主要由比值 r=|2/1|来决定,但当来决定,但当r 接近于接近于1时,收敛可能
23、很慢时,收敛可能很慢.这时,一个补救办法是采用加这时,一个补救办法是采用加速收敛的方法速收敛的方法.其中其中p为参数,设为参数,设A的特征值为的特征值为 i,则,则对矩阵对矩阵B的特征的特征值为值为 i-p,而且而且A,B的特征向量相同的特征向量相同.引进矩阵引进矩阵 B=A-pI.上页上页下页下页 如果要计算如果要计算A的主特征值的主特征值 1,只要只要选择合适的数选择合适的数p,使使 1-p为矩阵为矩阵B=A-pI 的主特征值,且的主特征值,且 那么,对矩阵那么,对矩阵B=A-pI应用幂法求其主特征值应用幂法求其主特征值 1-p,收收敛速度将会加快敛速度将会加快.这种通过求这种通过求B=A
24、-pI的主特征值和特的主特征值和特征向量,而得到征向量,而得到A的主特征值和特征向量的方法叫的主特征值和特征向量的方法叫原原点平移法点平移法.对于对于A的特征值的某种分布,它是十分有的特征值的某种分布,它是十分有效的效的.上页上页下页下页例例3 设设AR44有特征值有特征值比值比值r=|2/1|0.9.做变换做变换B=A-12I (p=12),则则B的的特征值为特征值为应用幂法计算应用幂法计算B的主特征值的主特征值1的收敛速度的比值为的收敛速度的比值为 虽然常常能够选择有利的虽然常常能够选择有利的p值值,使幂法得到加速使幂法得到加速,但设计一个自动选择适当参数但设计一个自动选择适当参数p的过程
25、是困难的的过程是困难的.上页上页下页下页 下面考虑当下面考虑当A的特征值是实数时,怎样选择的特征值是实数时,怎样选择p使采使采用幂法计算用幂法计算 1得到加速得到加速.且使且使收敛速度的比值收敛速度的比值 设设A的特征值都是实数,且满足的特征值都是实数,且满足则对实数则对实数p,使矩阵使矩阵A-pI的主特征值为的主特征值为 1-p或或 n-p时,时,当当我们计算我们计算 1及及x1时,时,首先应选取首先应选取p使使上页上页下页下页显然,当显然,当 2-p=-(n-p)时,即时,即P=(2+n)/2P*时时 为最小值,这时为最小值,这时收敛速度的比值收敛速度的比值为为 当希望计算当希望计算 n时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 矩阵 特征值 计算
限制150内