《线性变换和特征值.pptx》由会员分享,可在线阅读,更多相关《线性变换和特征值.pptx(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 定义6.2 设 是实数域上的向量空间,T是一个从 到 的映射,若映射T满足 1)2)则称T为从 到 的线性映射,或称线性变换。线性映射就是保持线性组合的映射。第1页/共64页例6.1 试证所有矩阵相乘的关系式 即 都是 的线性映射。证:利用矩阵的数乘及乘法运算,是 的映射。显然有 及 即T是 的线性映射。第2页/共64页 例6.2 向量空间V中的恒等变换 是线性变换。证明:设 ,则有 所以恒等变换E是线性变换。第3页/共64页6.2 方阵的特征值和特征向量6.2.1 特征值和特征向量的定义和计算 定义6.3 设 是 阶方阵,若存在数 和 维非零列向量 ,使得 (6-1)成立,则称数 为方阵A
2、的特征值,称非零向量 为方阵A对应于特征值 的特征向量。将(6-1)式变形为 (或 )(6-2)第4页/共64页 满足这个方程的 和 就是我们要求的特征值和特征向量。(6-2)式是含个 方程的 元齐次线性方程组,它有非零解的充要条件是 (6-3)记作 (6-4)称 为方阵A的特征多项式,方程 称为方阵A的特征方程,特征值即为特征方程的根。由于 是 的 次多项式,所以方程 在复数域内有 个根(重根按重数计算)。第5页/共64页 矩阵A的特征值和特征向量的计算步骤:第一步:求特征值。先通过行列式(6-4)的计算,写出其特征多项式 ,这一步的难度是计算一个高阶的矩阵的行列式,需要很大的计算工作量;第
3、二步:并进行因式分解 然后求出特征方程 的全部根 这就是A的所有特征值;第三步:把每个特征值 分别代入方程,求齐次线性方程组 的非零解 ,它就是A对应于特征值 的一个特征向量(不是惟一的)。第6页/共64页 例6.4 求矩阵 的特征值和特征向量。解:A的特征多项式 所以A的全部特征值为 对于特征值 解齐次线性方程组 ,即 可得它的一个基础解系 第7页/共64页 所以 都不为 零)是A对应于特征值 的全部特征向量。对于特征值 ,解齐次线性方程组 ,得它的一个基础解系 ,所以 是A对应于特征值8的全部特征向量。第8页/共64页6.2.2 方阵的特征值和特征向量的性质 性质1 阶矩阵A与其转置矩阵有
4、相同的特征值。性质2 设 是矩阵A的 个特征值,则 1)2)称 为矩阵A的迹,记为 第9页/共64页 性质3 设 为方阵A的特征值,则 1)当A可逆时,是 的特征值 2)是A的伴随矩阵 的特征值 3)是 的特征值;进而有矩阵A的 次多项式 的特征值为第10页/共64页 例6.5 设矩阵 1)求及的特征值;2)进一步求矩阵的特征值。解:1)由A的特征方程 可得A的全部特征值为1,2,-1。的特征值为,即-2,13,-8。第11页/共64页 2)解法1:先计算 ,令 ,求出特征方程 的根即可。解法2:因为 所以A可逆,为对应于A的特征值 的特征向量,则 又 所以 从而矩阵 的特征值为 ,即 第12
5、页/共64页 定理6.1 设 为方阵A的互不相同的特征值,分别为对应于特征值 的特征向量,则 线性无关。推论 矩阵A的 个互不相同特征值所对应的 组各自线性无关的特征向量并在一起仍是线性无关的。第13页/共64页6.2.3 特征值和特征向量的MATLAB求法 MATLAB提供了计算方阵的特征值和特征向量各步骤的函数。这三个步骤是:(1)用f=poly(A)可以计算方阵A的特征多项式系数向量f;(2)用lamda=roots(f)可以求特征多项式f的全部根lamda(表示为列向量);(3)用函数p=null(lamda*I-A)直接给出基础解p,将n个特征列向量p排在一起,就是的特征向量矩阵。第
6、14页/共64页 取例6.4为典型,解题的程序ea604为 A=3,2,4;2,0,2;4,2,3;f=poly(A),r=roots(f),r=real(r)B1=r(1)*eye(3)-A;B1=rref(B1,1e-12),p1=null(B1,r)B2=r(2)*eye(3)-A;p2=null(B2,r)B3=r(3)*eye(3)-A;p3=null(B3,r)第15页/共64页 程序运行的结果为:f=1.0000-6.0000-15.0000-8.0000(特征多项式系数向量)r=8.0000(三个特征根即特征值,后两个是重根)-1.0000+0.0000i(微小虚数可用r=re
7、al(r)去除)-1.0000-0.0000i第16页/共64页 实际上MATLAB已经把求特征根和特征向量的步骤集成化,其中也包括了处理计算误差的功能,所以一条命令就解决问题了。这个功能强大的子程序名为eig(特征值英文是eigenvalue,特征向量英文是eigenvector),调用的形式是:p,lamda=eig(A)输出变元中的lamda是特征值,p是特征向量。把例6.4的系数矩阵A代入,即可得到:第17页/共64页6.3 相似矩阵与矩阵的对角化 定义6.4 设A和B是 阶方阵,若存在可逆矩阵P,使得 ,则称矩阵A与B相似,把A变成 的变换称为相似变换,可逆矩阵P被称为把A变成B的相
8、似变换矩阵。相似矩阵具有以下性质。设矩阵A与B相似 1)2)第18页/共64页 3)A与B的迹相同 4)若A可逆,则B必可逆,且 也相似 定理6.2 设矩阵A与B相似,则它们的特征多项式相同,从而有相同的特征值.推论 若 阶方阵A与对角矩阵 相似,则 是矩阵A的全部特征值。此时,必存在可逆矩阵P,使得 ,称为把矩阵A对角化,也称矩阵A可对角化。第19页/共64页 定理6.3 阶方阵A可对角化的充分必要条件A是有 个线性无关的特征向量。证明:必要性 设 阶方阵A可对角化,则存在可逆矩阵 使 ,从而 即 于是有 ,所以 是方阵A的特征值,是对应于特征值 的特征向量。由于矩阵P可逆,det(P)0,
9、必线性无关。第20页/共64页 充分性 设 是A的 个特征值,是与之对应的 个线性无关的特征向量,令 ,则有 即 所以方阵A可对角化。推论 若 阶方阵A的特征值互不相同,则方阵A一定可对角化。第21页/共64页 例6.7 判断矩阵 能否对角化?解:由 得A的特 征值为 求得 对应的特征向量 ,再求 对应的特征向量。把 作行阶梯变换,得到 相当于方程组 它只有一个线性无 关的特征向量 ,即A总共只有两个线性无关的特征向量,所以A不能对角化。第22页/共64页 用MATLAB解此题时,要检验特征向量组的秩,判断独立的特征向量数。故程序如下:A=-1,1,0;-4,3,0;1,0,2,p,lamda
10、=eig(A),rp=rank(p)运行的结果是:由于特征向量组的秩为2,说明只有两个线性无关的特征向量,因此不能对角化。第23页/共64页6.4 实对称矩阵的对角化 定理6.4 实对称矩阵的特征值必为实数。定理6.5 实对称矩阵的不同特征值对应的 特征向量必正交。证明:设A为n阶实对称矩阵,是矩阵A的两个不同的特征值,是矩阵A对应的特征向量,即 因为 于是 由于 ,所以 ,即 正交。第24页/共64页 定理6.6 设A为n阶对称矩阵,则存在正交矩阵P,使得 这里 是以A的n个特征值为对角元素的对角矩阵。推论1 设A为n阶实对称矩阵,是A的 重特征值,则A必有 个对应于特征值 的线性无关的特征
11、向量.推论2 实对称矩阵一定可对角化.推论3 n阶实对称矩阵A,存在n个正交单位特征向量。第25页/共64页 n阶实对称矩阵对角化的步骤 第一步:解特征方程 ,求出A的全部互不相等的特征值 它们的重数依次为 第二步:求出矩阵A的特征值 对应的特征向量,得到 个线性无关的特征向量;第三步:将每个特征值 对应的 个线性无关的特征向量正交化、单位化,这样得到n个两两正交的单位特征向量 ;第四步:令 ,P是正交矩阵,使得 。必须注意:中对角元素的排列次序与P中列向量的排列次序要一致。第26页/共64页例6.10 设解:当 时,即 解得 单位特征向量可取为 第27页/共64页 解得 为任意常数。基础解系
12、中的两个向量恰好正交,只需单位化,可得两个单位正交的特征向量第28页/共64页 从而得到正交矩阵 有 本例用MATLAB解时的程序为:A=4,0,0;0,3,1;0,1,3;p,lamda=eig(A)程序运行的结果与笔算的相同,为:第29页/共64页6.5 二次型及其标准形 6.5.1 二次型的概念 定义6.5 含有n个变量 的二次齐次函数:(6-10)称为n元二次型,简称二次型。为实数时,称 为实二次型;为复数时,称 为复二次型。本章书仅讨论实二次型。第30页/共64页 令 ,则二次型(6.10)可写成 用矩阵形式表示为 (6-11)其中 第31页/共64页 例 6.13 写出下列二次型的
13、矩阵 解:由已知的二次型系数,得矩阵元素为:故得的 矩阵为第32页/共64页6.5.2 二次型的标准形及惯性定理 定义6.6 若秩为r 的二次型 通过可逆线性变换x=Cy 可化为只含平方项的二次型,即 (6-12)那么,此二次型称为 的标准形,标准形中所含平方项的个数等于二次型 的秩.例6.15 设二次型 分别作下列二个可逆线性变换,求新二次型.第33页/共64页1)=2)解:1)将线性关系直接代入并化简、整理 第34页/共64页 2)由于 因此,此例表明:二次型 的标准形不是唯一的。第35页/共64页 *实二次型的规范形的定义:对秩为r的实系数二次型 ,设它通过可逆线性变换x=Cy化为下面的
14、标准形:其中 ()0,若再作如下的可逆变换:则上面的标准形可进一步化为如下的形式:这个二次型称为实二次型的规范形,显然它是唯一的.第36页/共64页 定理6.7(惯性定理)设秩为r的实二次型 ,通过可逆线性变换,可化为如下的标准形:其中 0(),则数p称为实二次型 的正惯性指数,q=r-p称为负惯性指数.惯性定理是指:实二次型的标准形中正系数的平方项的个数是唯一确定的,它等于正惯性指数,而系数为负的平方项的个数也是唯一确定的,它就等于负惯性指数。第37页/共64页 6.5.3 化实二次型为标准形的方法 1)正交变换法 正交变换法的具体步骤与求特征值和特征向量相仿 第一步:写出二次型 的矩阵A,
15、并由特征方程 求出全部互不相同特征值 第二步:求出A的对应于 的特征向量,即求齐次线性方程组 的基础解系。如果某些 是重根,则将其对应的特征向量正交化、单位化。这样便可得到n个两两正交的单位特征向量 第38页/共64页 第三步:令 ,则P是正交矩阵,二次型 通过正交变换x=Py化为标准形 上述步骤也可用eig函数来完成。其调用格式为:P,lamda=eig(A)P和lamda将分别给出特征向量组(即正交矩阵)和特征向量。此外MATLAB中还提供了一个用以计算正交变换矩阵的函数Rorth(A)。它的结果和eig函数算出的特征向量矩阵是一样的,只是排列的顺序不同.第39页/共64页 2)配方法 如
16、果二次型中含有变量 的平方项,则先把含有 的各项集中,按 配方,然后按此法对其它变量配方,直至都配成平方项.如果二次型中不含平方项,但某个 则先作一个可逆线性变换:使二次型 出现平方项,再按上面方法配方。第40页/共64页 例6.16 设 令A的二次型 等于常数,这是一个椭圆的方程,其图形如图6.1(a)所示。现要求将它变为标准形并画出图形。第41页/共64页图6.1 两种二次型经坐标变换到主轴方向 第42页/共64页 (1)正交变换法 如果做一个基坐标的旋转变换,让坐标轴转过45度,这个椭圆的主轴就与新的坐标方向 ,相同,如图6.1(b)所示,其方程将变为标准形椭圆方程。从解析几何知此变换关
17、系为:cos sin sin cos 写成矩阵形式y Px 其中 第43页/共64页 或取其逆变换,写成x Ry 其中 用此变换式代入二次型的表达式,有 本题的数据是45度,得到 第44页/共64页 便有 及 所以从几何图形上寻找二次型主轴的问题,在线性代数中就等价于:使矩阵A经过正交变换R实现对角化。(2)用配方法第45页/共64页 令 得到 它所对应的变换 图6.1中的(c)和(d)表示了对另一种双曲线二次型的坐标变换,它的方程为:第46页/共64页 图6.2 两种对角化方法的不同变换:正交变换法,图形相似(左),配方法,图形崎变(右)第47页/共64页6.5.4 二次型的正定和负定 图6
18、.3 二次型曲面的几种类型第48页/共64页 一般的,二元变量的二次圆锥曲线 在非退化(指它的二次项系数不全为零)情况下,它的类型决定于其二次项的对称矩阵A的特征值。具体如下:A的特征值 对应圆锥曲线的类型 驻点是否极值点 (正定或负定)椭圆极值点 (不定)双曲线 鞍点(费极值点)或 (半正定)抛物线极值线 第49页/共64页 定义6.8 若对任给定的 1)恒有 ,则称 为正定(负定)二次型,此时对称矩阵A称为正定(负定)矩阵;2)恒有 ,则称 为半正定(半负定)二次型,此时对称矩阵A称为半正定(半负定)矩阵。3)其它的二次型称为不定二次型。定理6.8 n元实二次型 正定的充要条件是它的标准形
19、中的n个系数全为正,或 的正惯性指数为n。第50页/共64页 证明:设 经过可逆线性变换化为标准形,充分性 若 ,对任意 有 ,所以 必要性 设 为正定二次型。假设有 ,取 时,从而 ,这与 是正定的相矛盾。所以 推论 实对称矩阵A正定的充分必要条件是A的特征值全大于零。第51页/共64页 定义6.9 设 为n阶方阵,依次取A的前k行与前k列所构成的行列式 称为A的k阶顺序主子式。定理 6.9 设n元实二次型 为正定,则下列结论等价:1)对任意n维非零向量 2)的标准形中的n个系数全为正;3)实对称矩阵A的特征值全大于0;4)正惯性指数p=n;第52页/共64页 5)实对称矩阵A的各阶顺序主子
20、式全大于0,即 结论5)称为霍尔维茨定理。类似地,n元实二次型 为负定,则下列结论等价 1)的标准形中的n个系数全为负 2)实对称矩阵A的特征值全小于0 3)负惯性指数q=n 4)实对称矩阵A的各阶顺序主子式中,奇数阶的全小于0,偶数阶的全大于0 第53页/共64页 例6.19 判断二次型 的负定性.解:二次型 的矩阵为 由 可知 为负定二次型 注:本题也可通过判断-A为正定矩阵来解决 第54页/共64页 例6.20 求 的取值,使得二次型 为正定二次型.解:二次型 的矩阵为 由于 为正定二次型,故所有顺序主子式全大于零,即 解出 ,即为所求.第55页/共64页6.6 奇异值分解的简介 定义6
21、.10 设矩阵 ,若存在非负实数 和n维非零向量 m维非零向量v使得 (6-13)则称 为A的奇异值,u和v分别称为A对应于奇异值 的右奇异向量和左奇异向量。由式(6-13)可得 (6-14)(6-15)第56页/共64页 定理6.10(矩阵的奇异值分解)设A是mn矩阵,设 是A的奇异值,则 ,其中U是m阶正交矩阵,V是n阶正交矩阵,而 此式也可以表示为:(6-16)其中,是矩阵U的第i列 是矩阵V的第j列 .第57页/共64页 MATLAB中设有奇异值分解函数,其调用格式为U,S,V=svd(A),其中U是mm归一化正交矩阵,S是mn对角矩阵,它的左上方是rr rmin(m,n)对角矩阵,其
22、r个特征值已按递减规则,其余各块元素都是全零。排列的V是nn归一化正交矩阵。根据S中大于门限值的特征值数目,就可以求出矩阵的数字秩,rank(A)就是按这个思路编写的。在大于门限值的特征值中,最大和最小的两个元素之比,就是矩阵的条件数,可以调用r=cond(A)算出。第58页/共64页例6.21 设 求它的各奇异值,及条件数。解:这样阶次的问题,只能用计算机来解了。程序为 A=2,7,9,-5,4;-9,-9,5,3,-2;-2,5,-1,-3,5;-4,9,0,9,-4 U,S,V=svd(A),condA=S(1,1)/S(4,4)运行结果为:第59页/共64页 不难验证:U,V都是规范正
23、交矩阵,都有 A的四个奇异值为:16.5933 13.9809 11.2638 5.9432,A的条件数为:condA=16.5933/5.9432=2.7920第60页/共64页6.7 应用实例 6.7.1 人口迁徙模型 假设在一个大城市中的总人口是固定的,人口的分布则因居民在市区和郊区之间迁徙而变化。每年有6%的市区居民搬到郊区去住,而有2%的郊区居民搬到市区。假如开始时有30%的居民住在市区,70%的居民住在郊区,问十年后市区和郊区的居民人口比例是多少?30年、50年后又如何?第61页/共64页解:这个问题可以用矩阵乘法来描述。令人口变量 其中 为市区人口所占比例,为郊区人口所占比例,k表示年份的次序。在k0的初始状态为:一年以后,市区人口为 郊区人口 用矩阵乘法可写成:第62页/共64页 从初始时间到k年,A不变,因此 用下列MATLAB程序ea661进行计算:A0.94,0.02;0.06,0.98 x00.3;0.7,x1A*x0,x10A10*x0,x30A30*x0,x50A50*x0 程序运行的结果为:第63页/共64页感谢您的观看!第64页/共64页
限制150内