2022年新理解矩阵定义 .pdf
《2022年新理解矩阵定义 .pdf》由会员分享,可在线阅读,更多相关《2022年新理解矩阵定义 .pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、新理解矩阵1前边我承诺过会写一些关于自己对矩阵的理解。其实孟岩在理解矩阵这三篇文章中,已经用一种很直观的方法告诉了我们有关矩阵以及线性代数的一些性质和思想。而我对矩阵的理解,大多数也是来源于他的文章。当然,为了更好地理解线性代数,我还阅读了很多相关书籍,以求得到一种符合直觉的理解方式。孟岩的blog 已经很久没有更新了,在此谨引用他的标题,来叙述我对矩阵的理解。当然, 我不打算追求那些空间、算子那些高抽象性的问题,我只是想发表一下自己对线性代数中一些常用工具的看法,比如说矩阵、行列式等。同时,文章命名为“ 理解矩阵 ” ,也就是说这不是矩阵入门教程,而是与已经有一定的线性代数基础的读者一起探讨
2、关于矩阵的其他理解方式,仅此而已。我估计基本上学过线性代数的读者都能够读懂这篇文章。首先,我们不禁要追溯一个本源问题:矩阵是什么?我们不妨回忆一下,矩阵是怎么产生的。矩阵可以看成是一个个向量的有序组合,这说明矩阵可以类比向量; 但是向量又是怎么产生的?向量则是一个个数字的有序组合,这又把我们的研究方向指向了“ 数字是什么 ” 这个问题上。比如,数字1 是什么?它可以代表1 米,可以代表 1 千克,也可以代表1 分钟、 1 摄氏度甚至1 个苹果。它为什么有这么多的表示意义?答案很简单,因为在本质上,它什么都不是,它就是数字1,一个记号,一个抽象的概念。正因为它抽象,它才可以被赋予各种各样直观的意
3、义!回到矩阵本身,我们才会明白,矩阵的作用如此之大,就是因为书本上那个很枯燥的定义矩阵就是m 行 n 列的一个数表!它把矩阵抽象出来,让它得到了“ 进化 ” 。它是一个更一般化的概念:一个向量可以看作一个矩阵,甚至一个数都可以看成一个矩阵,等等。代数方面的理解当然,上述说法是含糊的,我们还是需要确切知道它究竟有什么用?这可以从代数和几何的角度来分析,因为做到数形结合才是最完美的。首先我们知道数学最基本的元素就是数字,严格来说是自然数,如0,1,2,.;有了数字,我们就可以做到很多东西。但是数字是单一的, 而我们很多时候都要批量处理一些类似的运算,比如同时要计算1+2,1+3,2+3,4+5这四
4、个算式。 不论是从记录还是从研究的角度来说,分开研究它们都是比较繁琐的。于是一种“ 批量 ” 的记号产生了,我们记为(1,1,2,4)+(2,3,3,5) ,用两个不同记号记录它们,比如A=(1,1,2,4),B=(2,3,3,5),我们就可以将它记为A+B。这样不论在研究还是记录方面都能够给我们方便。于是一个我们称之为“ 向量 ” 的东西产生了,也就是说,从代数的角度来讲,向量是为了研究批量运算而产生的。但是向量并没有解决所有的批量运算的问题。比如 3 元一次方程组a11x1+a12x2+a13x3=b1a21x1+a22x2+a23x3=b2名师资料总结 - - -精品资料欢迎下载 - -
5、 - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 13 页 - - - - - - - - - a31x1+a32x2+a33x3=b3单单用向量我们还是没有办法很好地研究这一类问题。于是我们就要想法子创造出一些新的记号,由于左边的系数的具有一定的排列顺序和统一的形式,我们不妨把它们单独写出来a11,a12,a13a21,a22,a23a31,a32,a33并用一个简单的符号A来表示它,然后把未知数和右边的常数都分别写成向量形式x=x1,x2,x3T和b=b1,b2,b3T(多加了上标T 表示列向量)。我们期待上面的方程
6、组可以写成一个简单的形式Ax=b由此我们可以定义一个3 阶方阵乘以一个3 维列向量的乘法了,这是一种 纯粹的定义 ,是为了方便我们记录和研究的定义。在此基础上, 我们就可以研究更多的东西,比如矩阵乘矩阵会得到什么?同样, 这里要研究的矩阵都是指n 阶方阵这个最核心的东西,我们要先把核心问题研究透彻,不然一开始就考虑所有的繁杂的情况,容易让我们陷入迷惘中而不知所措。在研究一般乘法之前,我们先来了解一下关于运算定律问题。我们知道在实数中,加法满足结合律和交换律, 乘法满足结合律、 交换律和分配律。 哪些定律可以迁移到矩阵乘法中的呢?交换律是无法先验的,它是个定义问题,我可以定义它成立也可以定义不成
7、立,但是为了运算的方便, 我们还是希望它满足更多地运算定律,所以我们先来考虑结合律,希望它能够满足这一定律。也就是说(AB)x=A(Bx)其中Bx已经是我们所熟知的运算(由定义而来),它将得到一个列向量,所以我们也可以轻易算出A(Bx),从直观上来讲,AB应该也是一个n 阶方阵,我们可以先把它设出来,然后与列向量x 进行运算, 最后把两边的结果一一对应起来,就得到了AB这个 n 阶方阵中各个元素的表达式。我们最终可以发现,它就是我们书本上定义的表达式。以 2 阶方阵为例,令A 为a,bc,dB 为e,fg,h名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - -
8、- - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 13 页 - - - - - - - - - AB 为p,qr,s并令x=x,yT,那么(AB)x就等于px+qy,rx+syT而Bx=ex+fy,gx+hyT,那么A(Bx)=aex+afy+bgx+bhy,cex+cfy+dgx+dhyT那么根据各个元素的对应,就得到p=ae+bg,q=af+bh,r=ce+dg,s=cf+dh 。这就完成了2 阶方阵乘法的定义。现在我们就可以从代数的角度来讲,矩阵是为了简化批量线性运算的一个“ 终极武器 ” !这就是矩阵的一个比较直观和有用的代数意义。如果根据我们这个定
9、义去考虑交换律,我们会发现矩阵一般不符合交换律。这不能不说是一个遗憾。但是没关系,它服从结合律这一个事实,已经赋予了这个工具极大的力量。比如线性方程组Ax=y,我们有By=B(Ax)=(AB)x,如果我们想办法找到一个矩阵B,使得AB=I,那么就很棒了,因为我只要用矩阵B 作用于向量y 就可以得到方程组的解了,事实上这样的矩阵 B 是存在的,这就是逆矩阵。要是没有结合律,这一切都免谈!由于这是实数基本运算(线性运算)的“ 批量版 ” ,那么我们就可以很自然地把实数的一些公式延伸为矩阵版(只要不是涉及到交换律就行)。比如,在实数中,我们有公式11- x=1+x+x2+x3+.1+x那么我们求矩阵
10、的逆阵时,也有类似的公式(I- A)-1=I+A+A2+A3+.I+A其中 I 是单位矩阵, A 是一个 “ 比较小 ” 的矩阵。至于“ 比较小 ” 怎么定义,现在还说不清楚,可以认为是矩阵的行列式值比较小。类似的,根据1+x- 1+12x也能够相应地给出(I+12A)2 I+A,这是求矩阵 “ 平方根 ” 的一个近似公式。得益于我们定义的矩阵乘法,批量的运算可以直接用单个量的运算公式进行,不用我们煞费苦心、 绞尽脑汁地构思新的公式。这就是矩阵的强大所在!它在解决很多线性问题时有着奇迹般的美妙,最简单的例子莫过于线性方程组Ax=y的解为y=A-1x,解答方程组的时候就好像求解一元方程那样有简单
11、的形式!还有一些关于指数的定义等等,以后在应用时会把它介绍的。它们都好像非常精美的 “ 艺术品 ” !下一回, 我们将从几何角度来理解矩阵。当然, 这里边的绝大多数内容在孟岩的文章里头都已经提到了,我只是重提旧论而已,希望读者不会厌烦。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 13 页 - - - - - - - - - 新理解矩阵2上一篇文章中我从纯代数运算的角度来讲述了我对矩阵的一个理解,可以看到, 我们赋予了矩阵相应的运算法则,它就在代数、 分析等领域显示出了
12、巨大作用。但是纯粹的代数是不足够的,要想更加完美,最好是找到相应的几何对象能够与之对应,只有这样,我们才能够直观地理解它,以达到得心应手的效果。几何理解我假设读者已经看过孟岩的理解矩阵三篇文章,所以更多的细节我就不重复了。我们知道,矩阵 Aa11,a12a21,a22事实上由两个向量a11,a21T和a12,a22T(这里的向量都是列向量)组成, 它描述了一个平面(仿射)坐标系。换句话说,这两个向量其实是这个坐标系的两个基,而运算y=Ax则是告诉我们,在A这个坐标系下的x 向量,在I坐标系下是怎样的。这里的I坐标系就是我们最常用的直角坐标系,也就是说,任何向量(包括矩阵里边的向量),只要它前面
13、没有矩阵作用于它,那么它都是在直角坐标系下度量出来的。(事实上,单位矩阵I 是默认的直角坐标系,这一说法并非总是成立的,但是我们现在寻求直观的理解方式,我们就用最简单的东西来实行。)太多的文字未必能够把问题说清楚,我们需要一张图来解释一下:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 13 页 - - - - - - - - - 图上所用的矩阵A 是3,21,3这构成了一个仿射坐标系,在这个坐标系下,有一个向量x=2,2T,它在直角坐标系下测得的坐标为10,8T,现在我
14、们不难发现,直接用矩阵乘法来计算,有Ax=3? 2+2? 2,1? 2+3? 2T=10,8T正是我们所期待的!为什么会有这样的特点?其实这源于我们对矩阵乘法的定义,反过来, 如果我们用这样的几何方式来定义矩阵乘法,那么我们也将得到在书本上了解到的矩阵乘法计算公式。更高阶的矩阵也可以作同样的类比。推导过程只是一道很简单的练习题,读者不妨自己动笔尝试一下?现在我们又回到孟岩文章上的说法了,对于矩阵作用于一个向量(对应的一个点),我们既可以看作点没有变,只不过是坐标系从直角坐标系变换为仿射坐标系而已;另一方面, 我们也可以看做矩阵把直角坐标系的一个A 点“ 运动 ” (变换)到了A 点。这两种说法
15、都行,正如孟岩所说的 “ 运动是相对的 ” 。更正确地讲, 两种说法都要同时被提及,才算是最好的理解。矩阵是一个点到另外一个点的变换,变换的方式就是坐标系的变换。当然,上面只讨论了矩阵乘以向量的乘法,那么矩阵乘以矩阵呢?比如AB,我们就可以看作是矩阵B给出了一个坐标系,但是这个坐标系的各个分量是在A坐标系下测量得到的,而A是在直角坐标系下测量得到的,所以要把B的各个分量 (列向量) 与矩阵 A 作乘法后,才得到了这个仿射坐标系在直角坐标系下的“ 像” 。 这很直接地导致了矩阵乘以矩阵的计算公式,也很显然地回答了“ 为什么 n 阶方阵只有与n 阶方阵相乘才有意义” ,因为两者要在同一空间中测量,
16、才能够完整而唯一地把测量值确定下来。正如,在n+1 维的空间中讨论n 个 n维向量是没有意义的,因为在 n+1 维空间中的观测者看来,它们只不过是一个“ 面” ,多出的一个维度可以随意变化;在n 维空间中讨论n+1 维向量就更没有意义了,因为维度根本就不够用。有了这个直观的几何意义,很多问题看起来几乎都是显然的了,比如那些行列式问题,还有相似矩阵等等,这将在下回谈到。张量介绍我们已经大概了解到,数字的有序组合产生了向量,向量的有序组合产生了矩阵。这样两个新构造出来的对象,作用一个比一个大。那么有人会联想到:矩阵的有序组合,就可以产生一个 “ 立方阵 ” , 它的功能会不会更加强大?更一般的,n
17、 维立方阵呢?这种联想是有道理的,数学上也有这样的研究对象,它就是张量 。最通俗的说法,n 阶张量就是一个n 维立方阵,所以0 阶张量就对应一个数,向量、矩阵分别对应 1 阶和 2 阶张量,我们所说的三维立方阵,就是3 阶张量啦。当然,张量属于很高深名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 13 页 - - - - - - - - - 的数学理论, 它的性质和作用不可能这么简单就说清楚了。回想当年, 爱因斯坦就是用张量分析作为工具, 建立起他那伟大的广义相对论的。如
18、果有机会的话, 我们一定会重新造访它。接下来,我们还是回到矩阵问题,谈谈矩阵的行列式。新理解矩阵3亲爱的读者朋友们, 科学空间版的理解矩阵已经来到了BoJone认为是最激动人心的部分了,那就是关于行列式的叙述。这部分内容没有在孟岩的文章中被谈及到,是我自己结合了一些书籍和网络资源而得出的一些看法。其中最主要的书籍是数学桥,而追本溯源,促进我研究这方面的内容的是matrix67 的那篇教材应该怎么写。本文包含了相当多的直观理解内容,在我看来,这部分内容也许不是正统的观点,但是至少在某种程度上能够促进我们对线性代数的理解。大多数线性代数引入行列式的方式都是通过讲解线性方程组的,这种方式能够让学生很
19、快地掌握它的计算, 以及给出了一个最实际的应用 (就是解方程组啦)。但是这很容易让读者走进一个误区,让他们认为线性代数就是研究解方程组的。这样并不能让读者真正理解到它的本质,而只有当我们对它有了一个直观熟练的感觉,我们才能很好地运用它。行列式的出现其实是为了判断一个矩阵是否可逆的,它通过某些方式构造出一个“ 相对简单 ” 的函数来达到这个目的,这个函数就是矩阵的行列式。让我们来反思一下,矩阵可逆意味着什么呢?之前已经提到过,矩阵是从一个点到另外一个点的变换,那么逆矩阵很显然就是为了把它变换回来。我们还说过,“ 运动是相对的 ” ,点的变换又可以用坐标系的变换来实现。但是,按照我们的直觉,不同的
20、坐标系除了有那些运算上的复杂度不同(比如一般的仿射坐标系计算点积比直角坐标系复杂)之外,不应该有其他的不同了,用物理的语言说,就是一切坐标系都是平权的。那么给出一个坐标系,可以自然地变换到另外一个坐标系,也可以自然地将它变换回来。既然矩阵是这种坐标系的一个描述,那么矩阵不可逆的唯一可能性就是:这个 n 阶矩阵的 n 个列向量根本就构不成一个n 维空间的坐标系。也就是说,它没有资格成为一个坐标系!(用专业术语说,这n 个向量是线性相关的。)那么我们就想办法为某个n 阶矩阵 A 构造一个函数 |A| , 当|A| 为 0 时,就意味着这个矩阵没有资格成为一个坐标系,也就是说它不可逆。先设 A=ve
21、cc_1,vecc_2,.,vecc_n,其中 vecv_i是各个列向量。我们想想,哪些情况下矩阵A 显然没有资格成为一个坐标系?1、显然,能否构成一个坐标系,与每一个向量vecv_i都息息相关,那么|A| 应该是每一个向量 vecv_i的函数才能满足要求。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 13 页 - - - - - - - - - 2、简单起见,我们函数最好是线性的,也就是说A=vecc_1,.,vecv_i,.,vecc_n,AMath Process
22、ingError ,那么 Math ProcessingError3、 构成 n 维坐标系需要 n 个独立的向量, 如果矩阵 A 的 n 个向量中有两个相同的,那么它自然无法构成坐标系,也就是说此时|A|=0 ;4、为了确定适当的缩放因子,也为了满足我们的直观感受,我们规定|I|=1 。让人意外的是, 就凭以上三个性质, 就可以确定 唯一一个 函数|A| 了,那个函数就是我们课本给出的行列式计算公式!当然,推导过程有点复杂,在这里不给出了,有兴趣的朋友可以用二阶和三阶矩阵演算一下,然后类比就行了。让我们再回想一下课本是怎么介绍行列式的:首先是线性方程组给出行列式的计算公式,然后再证明行列式有各
23、种各样的性质,比如“ 把其中一行乘上 5,行列式的值也乘上 5” 等等。这与上面的说法(这其实也是标准的线性代数讲述方式)相比,未免有点本末倒置的味道。因为行列式本身就是由那些性质来定义的,我们又何必要用行列式的计算公式来反推那些什么性质呢?除了锻炼计算能力,我真的看不出有什么作用。上面的内容还有一个 非常直观的几何理解方式:三维空间中三个向量能够构成一个仿射坐标系的充要条件是什么?很简单,这三个向量必须不共面!因此,推广到n 维空间,很显然有:n 个向量可以构成一个坐标系就意味着这些向量不共面!当然,n 维空间中的面不是指二维平面, 而是 n-1 维的东西,它与 n 维体积相对。还可以换一种
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年新理解矩阵定义 2022 理解 矩阵 定义
限制150内