第六章--矩阵分析及其应用-矩阵理论课件.ppt
《第六章--矩阵分析及其应用-矩阵理论课件.ppt》由会员分享,可在线阅读,更多相关《第六章--矩阵分析及其应用-矩阵理论课件.ppt(205页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 矩阵分析及其应用矩阵分析及其应用虽然在微积分开端时期贝克莱将无穷小称虽然在微积分开端时期贝克莱将无穷小称为为“上帝的幽灵上帝的幽灵”,进而导致,进而导致“第二次数第二次数学危机学危机”,直到柯西的,直到柯西的“极限论极限论”和戴德和戴德金等的金等的“实数理论实数理论”的出现危机才算彻底的出现危机才算彻底解决。但微积分在近代社会的巨大作用我解决。但微积分在近代社会的巨大作用我们早已深有体会,们早已深有体会,将微积分中的极限、导将微积分中的极限、导数、积分、级数等分析思想和方法应用于数、积分、级数等分析思想和方法应用于矩阵的研究矩阵的研究,自然就在情理之中。,自然就在情理之中。1、矩
2、阵序列与矩阵级数、矩阵序列与矩阵级数 微积分的基础是数列极限的收敛理论及微积分的基础是数列极限的收敛理论及其衍生出来的级数理论。矩阵可看成一个其衍生出来的级数理论。矩阵可看成一个“超数超数”,因此,因此类比类比可得可得矩阵序列矩阵序列与与矩阵矩阵级数级数,只要找到,只要找到度量两个度量两个“超数超数”距离距离的的适当工具。在矩阵里,这就是适当工具。在矩阵里,这就是范数范数。尽管。尽管使用给定基下的分量和元素等也可以,但使用给定基下的分量和元素等也可以,但明显用范数记号简洁明晰,且有助于证明。明显用范数记号简洁明晰,且有助于证明。一、矩阵序列的收敛性一、矩阵序列的收敛性定义定义1 1 设有设有
3、中的中的矩阵序列矩阵序列这里这里 。如果如果 ,则称此,则称此矩阵序列收矩阵序列收敛敛,其,其极限极限为为 ,记为,记为定理定理3 3 中的中的矩阵系列矩阵系列 分别分别收敛于收敛于 ,则,则定理定理4 4 中的中的矩阵序列矩阵序列 收敛于收敛于 ,且,且所有所有 和和 都可逆都可逆,则,则注意注意定理中条件定理中条件“所有所有 和和 都可逆都可逆”必不可少,例如下面的必不可少,例如下面的 不可逆,虽然不可逆,虽然 可逆,且可逆,且用矩阵的范数理论来研究矩阵序列的收敛性是用矩阵的范数理论来研究矩阵序列的收敛性是最常用、最简洁的方法最常用、最简洁的方法。特别地,若特别地,若 ,则,则 的的充充要
4、条件要条件是是定理定理5 5 中的中的矩阵序列矩阵序列 收敛于收敛于 的的充要条件充要条件是对任意一种矩阵范数是对任意一种矩阵范数 ,都有,都有所以所以由范数的等价性,对于由范数的等价性,对于 上任意一个范数上任意一个范数 ,必存在正常数,必存在正常数 ,使,使由于向量是特殊的矩阵,因此我们有由于向量是特殊的矩阵,因此我们有推论推论1 1 中的中的向量序列向量序列 收敛于收敛于 的的充要条件充要条件是对任意一种向量范数是对任意一种向量范数 ,都有,都有证明证明:设矩阵设矩阵 的的Jordan分解分解为为则则从而由定理从而由定理3 3可知,可知,由于谱半径不易计算,联系到由于谱半径不易计算,联系
5、到谱半径不超过任谱半径不超过任何一种矩阵范数何一种矩阵范数,实际常用范数来判断矩阵是,实际常用范数来判断矩阵是否是收敛矩阵。否是收敛矩阵。只有很难找到这样的范数,才只有很难找到这样的范数,才计算出矩阵的所有特征值,进而得到谱半径。计算出矩阵的所有特征值,进而得到谱半径。定理定理7 7 中的矩阵中的矩阵 是是收敛矩阵收敛矩阵的的充分充分条件条件是是存在存在一种矩阵范数一种矩阵范数 ,使得,使得二、矩阵级数二、矩阵级数定义定义8 8 设有设有 中的矩阵序列中的矩阵序列 ,矩阵矩阵级数级数指的是指的是无穷和无穷和称称矩阵级数收敛矩阵级数收敛,且其,且其和和为为 ,如果其,如果其部分部分和序列和序列收
6、敛于收敛于 ,即,即定义定义9 9 中的矩阵级数中的矩阵级数 称为称为绝绝对收敛对收敛的,如果数项级数的,如果数项级数都绝对收敛。这里都绝对收敛。这里定理定理1010 中的矩阵级数中的矩阵级数 绝对绝对收敛的收敛的充要条件充要条件是是正项级数正项级数 收敛,收敛,这里矩阵范数是任意的。这里矩阵范数是任意的。同数项级数相吻合的是,判定矩阵级数是否绝同数项级数相吻合的是,判定矩阵级数是否绝对收敛可借助范数理论转化为判定对收敛可借助范数理论转化为判定正项级数正项级数的的敛散性。敛散性。证明证明:必要性。必要性。从而从而若级数若级数 绝对收敛,则绝对收敛,则 都都收敛,故收敛,故所以正项级数所以正项级
7、数 收敛。收敛。根据范数的等价性,对任意矩阵范数,正项根据范数的等价性,对任意矩阵范数,正项级数级数 收敛。收敛。证明证明:充分性。充分性。若级数若级数 收敛,则由矩阵范数的收敛,则由矩阵范数的等价性可知,正项级数等价性可知,正项级数 收敛,故收敛,故所以所以 都收敛,即都收敛,即 绝对绝对收敛,因此矩阵级数收敛,因此矩阵级数 绝对收敛。绝对收敛。定理定理1212 设幂级数的收敛半径为设幂级数的收敛半径为 ,则,则当当 时幂级数时幂级数 收敛;收敛;当当 时幂级数时幂级数 发散。发散。证明证明:设矩阵设矩阵 的的Jordan分解分解为为则则从而从而其中其中这里规定这里规定 时,时,最后讨论最特
8、殊的最后讨论最特殊的诺伊曼诺伊曼(Neumann)级数级数,即即幂级数幂级数 的收敛半径是的收敛半径是 ,并且收敛于,并且收敛于所以我们通过所以我们通过类比类比可以得到可以得到定理定理1313 上的上的诺伊曼诺伊曼(Neumann)级数级数收敛的收敛的充要条件充要条件是是 。并且。并且诺伊曼诺伊曼(Neumann)级数级数收敛于收敛于定理定理1414的证明需要用到上一章的引理的证明需要用到上一章的引理6 6,即:,即:引理引理6 6 对对 ,若,若 ,则矩,则矩阵阵 非奇异,且非奇异,且证明证明:所以所以Neumann级数收敛。则级数收敛。则由于由于 ,由题知,由题知两边取范数,并利用引理两边
9、取范数,并利用引理6 6,得,得例例 15 15 判断判断方阵幂级数方阵幂级数收敛,并求其和。收敛,并求其和。解:解:方阵方阵 的的谱半径谱半径满足满足所以方阵幂级数收敛,并且所以方阵幂级数收敛,并且2、矩阵函数及其计算、矩阵函数及其计算矩阵函数在力学、控制理论及信号处理等矩阵函数在力学、控制理论及信号处理等学科中具有重要应用。学科中具有重要应用。类比类比普通函数,矩普通函数,矩阵函数的特殊之处在于其自变量与因变量阵函数的特殊之处在于其自变量与因变量都是方阵。对应于矩阵函数的多种表示方都是方阵。对应于矩阵函数的多种表示方式式(幂级数幂级数、Jordan表示表示、多项式表示多项式表示、积积分表示
10、分表示等等),定义矩阵函数的方式也很多。,定义矩阵函数的方式也很多。一、矩阵函数的定义及性质一、矩阵函数的定义及性质定义定义1 1 设一元函数设一元函数 可展开为收敛半径可展开为收敛半径为为 的幂级数,即的幂级数,即矩阵矩阵 的谱半径的谱半径 ,则,则矩阵函数矩阵函数 即为相应的矩阵幂级数即为相应的矩阵幂级数(收敛时收敛时)的和,即的和,即在在高等数学高等数学和和复变函数复变函数中,有幂级数展开式:中,有幂级数展开式:相应地,我们有矩阵函数:相应地,我们有矩阵函数:以及以及含参数的矩阵函数含参数的矩阵函数:根据欧拉公式根据欧拉公式 ,可以推出:可以推出:遗憾的是,指数运算规则一般不成立遗憾的是
11、,指数运算规则一般不成立:例如,令例如,令有有则则可以验证可以验证 确实两两不等。确实两两不等。那么那么什么条件下指数运算规则成立呢?什么条件下指数运算规则成立呢?定理定理2 2 如果如果 ,那么,那么证明证明:而而推论推论 设设 ,则,则二、矩阵函数的计算二、矩阵函数的计算由矩阵函数的定义,矩阵函数的计算转化为矩由矩阵函数的定义,矩阵函数的计算转化为矩阵幂级数和的计算,主要就是阵幂级数和的计算,主要就是矩阵幂的计算矩阵幂的计算。首先联想到首先联想到矩阵的对角化问题矩阵的对角化问题,即希望利用,即希望利用特特征值分解征值分解来计算矩阵函数。由于对角矩阵的对来计算矩阵函数。由于对角矩阵的对角元就
12、是矩阵的特征值,而相似矩阵就是相应角元就是矩阵的特征值,而相似矩阵就是相应的特征向量构成的矩阵。这样对任意矩阵,则的特征向量构成的矩阵。这样对任意矩阵,则可以使用可以使用Jordan分解分解。这两种方法的计算都比。这两种方法的计算都比较复杂,因此最后我们给出较复杂,因此最后我们给出待定系数法待定系数法。Jordan分解法分解法计算原理计算原理 设任意矩阵设任意矩阵 的的Jordan分解分解为为则对于任意则对于任意复系数多项式复系数多项式 ,有,有其中其中特别地,当矩阵特别地,当矩阵 可对角化时可对角化时,我们有下,我们有下面的面的特征值分解法。特征值分解法。特征值分解法特征值分解法计算原理计算
13、原理 设设可对角化矩阵可对角化矩阵 的的特征值分解特征值分解为为则有则有例例 3 3 求矩阵函数求矩阵函数 、和和 ,其中,其中解:解:求得求得 的的Jordan分解分解为为其中其中当当 时时 ,则,则当当 时时%ex601.m A=-1 1 0;-4 3 0;1 0 2;expm(A)%调用expm函数%expm uses the Pad approximation with scaling%and squaring.ans=-2.7183 2.7183 0 -10.8731 8.1548 0 0.7658 1.9525 7.3891%ex601.m(续)(续)A=-1 1 0;-4 3 0
14、;1 0 2;syms t%声明符号变量t S=expm(A*t);S=simple(S)%简化矩阵函数的结果S=-exp(t)*(2*t-1),t*exp(t),0 -4*t*exp(t),exp(t)*(2*t+1),0 exp(t)*(2*t-exp(t)+1),-exp(t)*(t-exp(t)+1),exp(2*t)当当 时时%ex601.m(续)(续)A=-1 1 0;-4 3 0;1 0 2;syms t%声明符号变量t A1=sin(A*t)%内置函数sin(A)给出错误结果A1=-sin(t),sin(t),0-sin(4*t),sin(3*t),0 sin(t),0,sin
15、(2*t)%ex601.m(续)(续)A=-1 1 0;-4 3 0;1 0 2;j=sqrt(-1);%虚数单位i A2=(expm(j*A*t)-expm(-1)*j*A*t)/(2*j)%利用Euler公式公式,调用函数expm A2=simple(A2)%简化矩阵函数的结果A2=sin(t)-2*t*cos(t),t*cos(t),0 -4*t*cos(t),sin(t)+2*t*cos(t),0 sin(t)-2*cos(t)*sin(t)+2*t*cos(t),2*cos(t)*sin(t)-sin(t)-t*cos(t),sin(2*t)例例 4 4 求矩阵函数求矩阵函数 和和
16、,其中,其中解:解:矩阵矩阵 的特征值为的特征值为 对应的特征向量为对应的特征向量为 对应的特征向量为对应的特征向量为 因此相似矩阵为因此相似矩阵为 从而从而%ex602.m A=4 6 0;-3-5 0;-3-6 1;syms t%声明符号变量t S=expm(A*t);S=simple(S)%简化矩阵函数的结果S=2*exp(t)-1/exp(2*t),2*exp(t)-2/exp(2*t),0 1/exp(2*t)-exp(t),2/exp(2*t)-exp(t),0 1/exp(2*t)-exp(t),2/exp(2*t)-2*exp(t),exp(t)%ex602.m(续)(续)A=
17、4 6 0;-3-5 0;-3-6 1;j=sqrt(-1);%虚数单位i B=(expm(j*A)+expm(-1)*j*A)/2%利用Euler公式,调用函数expmB=1.4968 1.9129 0 -0.9564 -1.3726 0 -0.9564 -1.9129 0.5403%ex602.m(续)(续)A=4 6 0;-3-5 0;-3-6 1;P,D=eig(A);j=sqrt(-1);C=P*(expm1(j*D)+expm1(-1)*j*D)/2)*inv(P)+eye(size(A)%函数expm1返回e(x)-1ans=1.4968 1.9129 0 -0.9564 -1.
18、3726 0 -0.9564 -1.9129 0.5403利用幂级数求矩阵函数,要求相应的函数利用幂级数求矩阵函数,要求相应的函数必须必须能够展开成收敛的幂级数能够展开成收敛的幂级数,这个条件一般不容这个条件一般不容易满足易满足。而根据。而根据特征值分解法特征值分解法,我们可以根据,我们可以根据矩阵的谱矩阵的谱即矩阵的特征值的集合来定义矩阵函即矩阵的特征值的集合来定义矩阵函数,这样就拓宽了矩阵函数的定义范围,尤其数,这样就拓宽了矩阵函数的定义范围,尤其是对那些是对那些不能展开成收敛的幂级数的函数不能展开成收敛的幂级数的函数也可也可以定义出相应的矩阵函数。以定义出相应的矩阵函数。一般地,如果矩阵
19、一般地,如果矩阵 的最小多项式为的最小多项式为则对于任意复值函数则对于任意复值函数 ,只要,只要有意义,我们就说函数有意义,我们就说函数 在在矩阵矩阵 的谱的谱 上有定义。上有定义。则定义任意复值函数则定义任意复值函数 的的矩阵函数矩阵函数为为定义定义5 5 设设复值函数复值函数 在矩阵在矩阵 的的谱上有谱上有定义定义,矩阵,矩阵 有有Jordan分解分解其中其中例例 6 6 求矩阵函数求矩阵函数 和和 ,其中,其中解:解:求得求得 的的Jordan分解分解为为其中其中显然显然 和和 在在 都有意义,都有意义,因此因此 和和 都有意义。都有意义。%ex602.m(续)(续)A=-1 1 0;-
20、4 3 0;1 0 2;F=logm(A)%函数logm(A)返回lnAF=-2.0000 1.0000 -0.0000 -4.0000 2.0000 0 1.3069 -0.3069 0.6931%ex602.m(续)(续)A=-1 1 0;-4 3 0;1 0 2;G=sqrtm(A)G=-0.0000 0.5000 -0.0000 -2.0000 2.0000 0.0000 0.5858 -0.0858 1.4142需要指出的是,需要指出的是,计算相应的矩阵函数时,涉及计算相应的矩阵函数时,涉及到的算法主要分为到的算法主要分为特征值方法特征值方法(特征值分解、特征值分解、Jordan分解
21、、分解、Schur分解等分解等)和)和逼近方法逼近方法(泰泰勒逼近、勒逼近、pade逼近逼近等)。考虑到计算复杂性及等)。考虑到计算复杂性及稳定性,具体实现时前一类方法实际采用的是稳定性,具体实现时前一类方法实际采用的是Schur分解法分解法(例如例如matlab中的中的logm函数函数),后一类方法实际则采是后一类方法实际则采是Pade逼近法逼近法(例如例如matlab中的中的expm函数函数)。详见)。详见Golub&Van Loan矩阵计算矩阵计算和和Matlab帮助文档。帮助文档。在在定义定义5 5中,矩阵函数中,矩阵函数 只与函数只与函数 在在 上的值有关,这启发我们,如果能够求上的
22、值有关,这启发我们,如果能够求出一个尽可能简单的函数出一个尽可能简单的函数 (比如复系数多(比如复系数多项式),使得两者在项式),使得两者在 上等值,那么便有上等值,那么便有 。此就是著名的。此就是著名的Hermite多项式插值问题多项式插值问题。则存在唯一的复值多项式函数则存在唯一的复值多项式函数 ,使得,使得定理定理7 7 设复值函数设复值函数 在矩阵在矩阵 的谱上有的谱上有定义,矩阵定义,矩阵 有有最小多项式最小多项式以及以及待定系数法待定系数法计算原理计算原理 设矩阵设矩阵 的的特征多项式特征多项式为为由带余除法,设有由带余除法,设有确定出余式确定出余式再根据再根据Cayley-Ham
23、ilton定理,有定理,有从而从而则可由则可由例例 8 8 求矩阵函数求矩阵函数 ,其中,其中解:解:求得求得 的的Jordan分解分解为为其中其中 矩阵矩阵 的的特征多项式特征多项式为为 因此设因此设则则当当 时时 ,则,则 解得解得因此因此 注意到此例中注意到此例中因此因此 即矩阵的高次幂都可以转化为低次幂,因此即矩阵的高次幂都可以转化为低次幂,因此 从而矩阵幂级数求和问题转化为数项级数求和从而矩阵幂级数求和问题转化为数项级数求和。递推公式法递推公式法计算原理计算原理 由矩阵由矩阵 的的特征多项式或最小多特征多项式或最小多项式项式得到矩阵的递推关系式,代入矩阵函数得到矩阵的递推关系式,代入
24、矩阵函数的矩阵幂级数定义形式中,从而将矩阵函数的矩阵幂级数定义形式中,从而将矩阵函数的计算转化为数项级数求和问题。的计算转化为数项级数求和问题。显然这种方法适用于递推关系式不太复杂的显然这种方法适用于递推关系式不太复杂的情形。情形。例例 9 9 设设4阶矩阵阶矩阵 的特征值为的特征值为 ,求求解:解:由题由题 的特征多项式为的特征多项式为因此因此从而从而从而从而四、矩阵函数的最完美定义四、矩阵函数的最完美定义(不要求掌握不要求掌握)定义定义1010 设复值函数设复值函数 在闭曲线在闭曲线 的内部的内部解析,且解析,且 包围了包围了 ,则矩阵函数为,则矩阵函数为显然这是复变函数中显然这是复变函数
25、中Cauchy积分定理积分定理的矩阵形的矩阵形式。式。3、矩阵的微分与积分、矩阵的微分与积分实际使用时,矩阵函数与函数矩阵的微分、实际使用时,矩阵函数与函数矩阵的微分、积分常常同时出现。研究矩阵函数和函数积分常常同时出现。研究矩阵函数和函数矩阵的微分、积分,这对研究微分方程组矩阵的微分、积分,这对研究微分方程组以及优化问题等都非常重要。其中尤为重以及优化问题等都非常重要。其中尤为重要的是要的是梯度分析的方法梯度分析的方法,张贤达在,张贤达在矩阵矩阵分析及应用分析及应用中将之列为矩阵分析的五大中将之列为矩阵分析的五大分析方法之首,并有详细介绍。分析方法之首,并有详细介绍。一、一元函数矩阵的微积分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 矩阵 分析 及其 应用 理论 课件
限制150内