最小二乘法的实现精品文稿.ppt
最小二乘法的实现第1页,本讲稿共33页实例讲解某种合成纤维的强度与其拉伸倍数有直接关系,下表是实际测定的24个纤维样品的强度与相应拉伸倍数的记录。提示:将拉伸倍数作为x,强度作为y,在座标纸上标出各点,可以发现什么?第2页,本讲稿共33页数据表格第3页,本讲稿共33页第4页,本讲稿共33页从上图中可以看出强度与拉伸倍数大致成线形关系,可用一条直线来表示两者之间的关系。解:设 y*=a+bxi i ,令=yi-y*i=yi-a-bxi,根据最小二乘原理,即使误差的平方和达到最小,也就是令 n Q=i2 i=1为最小,即求使 (a,b)=有最小值的有最小值的a a和和b b的值。的值。第5页,本讲稿共33页 计算出它的正规方程得计算出它的正规方程得解得:a=0.15 ,b=0.859 直线方程为:y*=0.15+0.859x第6页,本讲稿共33页一 问题的提出 插值法是使用插值多项式来逼近未知或复杂函数的,它 要求插值函数与被插函数在插值节点上函数值相同,而在其他点上没有要求。在非插值节点上有时函数值会相差很大。若要求在被插函数的定义区间上,所选近似函数都能与被插函数有较好的近似,就是最佳逼近问题。最佳逼近是在函数空间 M中选 P(x)满足 但由于绝对值函数不宜进行分析运算,常将上式化为来讨论,于是最佳逼近问题变为最佳平方逼近问题,而离散的最佳平方逼进问题就是常说的曲线拟合它们都可用最小二乘法求解。主页第7页,本讲稿共33页曲线拟合的最小二乘法曲线拟合的最小二乘法最小二乘原理 当由实验提供了大量数据时,不能要求拟合函数 在数据点 处的偏差,即 (i=1,2,m)严格为零,但为了使近似曲线尽量反映所给数据点的变化趋势,需对偏差有所要求.通常要求偏差平方和 最小,此即称为最小二乘原理第8页,本讲稿共33页 最小二乘法的求法最小二乘法的求法第9页,本讲稿共33页第10页,本讲稿共33页最小二乘法的几种特例最小二乘法的几种特例第11页,本讲稿共33页第12页,本讲稿共33页例例 题题第13页,本讲稿共33页第14页,本讲稿共33页二 线性最小问题的存在与唯一在科学实验中,很多情况数据间存在线性或可转化为线性的关系。线性最小二乘是最基本也是最重要的一种。1 线性最小二乘问题与线性最小二乘求解 设Ax=b 其中 AR mn,bR m,x R n当mn 时,上方程超定方程组 令 r=b-Ax,一般,超定方程无通常意义下解,既无x使 t=0。对这类方程求解意义是求x,使 r 22=b-Ax 22为最小,称x为Ax=b的最小二乘解。主页第15页,本讲稿共33页2 最小二乘解的存在性与唯一性 定理:x*为Ax=b 的最小二乘解充要条件 AT A X*=AT b 证明:充分性:若存在X*,使 AT A X*=AT b 则对任意向量 令 x=x*+y 有 b Ax 22=b AX*222(y,AT(b AX*)+A y 22 =b AX*22+A y 22 b AX*22 X*为Ax=b的最小二乘解。必要性:令 b AX 22=(x1,x2,x n)=(x)则由多元函数极值的必要条件知,若X*为极值点,则 (x)|=0 x i|x=x*第16页,本讲稿共33页而(x1,x2,x n)=b T b 2Ax+(Ax)TAx (x)由 =0 (i=1,2,n)ATAx=ATb。x i 若x*为Ax=b最小二乘解,则AT A x*=ATb。证毕 AT A x=AT b 称为最小二乘问题的 Ax=b法方程组。当A=(aIj)mn 的秩为n,既A的列线性无关时,AT A x=AT b有唯一解。第17页,本讲稿共33页三 线形模型的正规方程关于拟和模型必须能反映离散点分布基本特征。常选取是线性拟和模型,既所属函数类为M =Span 0,1,n,其中 0,1,n 是线性无关的基函数 m于是 (x)=c j j(x)j=0通常选取每个j是次数j的简单多项式,即M 是次数 n 的n次多项式空间。取 j(x)=x j ,j=0,1,n M=Span1,x,x2,x n,从而(x)=C0 +C1 x1+C n x n=Pn(x)主页第18页,本讲稿共33页 n 设离散数据模型 (x)=c j j(x)j=0则求解归结为 n+1元函数S的 极值问题:m n S(c0,c1,c n)=i y i c j j(xi)2 i=0 j=0显然S达最小值必要条件是 S m n =2 i y i c j j(xi)k(x i)=0 C k i=0 j=0 (k=0,1,n)这是关于 c0,c1,c n 的方程组,n改写成 (j,k)c j=(y,k)(k=0,1,2,n)称为正规方程组 j=0其中 m n(j,k)=i j(xi)k(x i)i=0 j=0第19页,本讲稿共33页一般,n m,函数 0,1,n,线性无关能保证正规方程组的系数矩阵 (0,0)(1,0),(n ,0 )G=,(*)(0,n )(1,n ),(n ,n )的行列式不为零。因此正规方程组有唯一解。设其解为 c j=c j*,j=0,1,n则所要求的离散点的拟合函数(最佳平方逼近)为 n *(x)=c j*j(x)。J=0对已知连续函数f(x)的最佳平方逼近问题与离散点的最佳平方逼近有相同形式的正规方程组和结论,只不过内积公式变为 第20页,本讲稿共33页表中提供离散数据(x i ,y i),(0i4)试用二次多项式进行拟合.i xi yi *(xi)yi-*(xi)0 0 1.0000 1.0052 -0.0052 1 0.25 1.2840 1.2740 0.0100 2 0.50 1.6487 1.6482 0.0005 3 0.75 2.1170 2.1279 -0.0109 4 1.00 2.7183 2.7130 0.0053四线形模型举例主页第21页,本讲稿共33页解:取 M=Span(1,x,x2 )其三个基函数为 j(x)=x j j=0,1,2 拟和函数 是基函数的线性组合:(x)=c0+c1x+c2x2 取0=1=4=1,由公式 5 5(j,k)=xi j+k,(y,k)=y i x i k,i=1 i=1 j,k=0,1,2 可以算出(0 ,0)=5,(1,1)=1.875,(2 ,2)=1.3828(0 ,1)=(1 ,0)=2.5,(0 ,2)=(2,0)=1.875(1 ,2)=(2,1)=1.5625(y ,0)=8.7680,(y,1)=5.4514,(y,2)=4.4215 第22页,本讲稿共33页正规方程为5C0+2.5C1+1.875C2 =8.76802.5C0+1.875C1+1.5625C2 =5.45141.875C0+1.5625C1+1.3828C2=4.415解得 C0=1.0052,C1=0.8641,C2=0.8427所求连续模型*为,*(x)=1.0052+0.8641x+0.8437x2最小平方残差 5|y*|22=(yi *(x i)2=2.7610-4 i=1第23页,本讲稿共33页由上述我 们已经知到上述线性模型实际上是最小二乘法的推广,实际上也就是多项式逼近函数的问题。它不仅可以解决一元问题还可用于多元问题。除此外还可求解某些非线性问题。求解方法是将其通过一定的代数变换转换为可用线性模型求解的问题。比如对方程 y=a e b x 取对数,得l n y=l n a+b x,令 Y=lny,A=l n a,B=b 则问题转化为解 Y=A+Bx的线性问题。类似的再如,对y=a+b/x拟和可对此方程取倒数,则新变量1/y于x成线性关系。五线性模型引深及推广主页第24页,本讲稿共33页六最小二乘法方法评注最小二乘法方曲线拟和是实验数据处理的常用方法。最佳平方逼近可以在一个区间上比较均匀的逼近函数且具有方法简单易行,实效性大,应用广泛等特点。但当正规方程阶数较高时,往往出现病态。因此必须谨慎对待和加以巧妙处理。有效方法之一是引入正交多项式以改善其病态性。主页第25页,本讲稿共33页正交多项式正交多项式 在高等数学中介绍付立叶级数时,曾提到函数系 1,cosx,sinx,cos2x,sin2x,cosnx,sinnx,中,由于任意两个函数乘积在区间-,+上的积分都等于零,则说这个函数系在-,+上是正交的,并称这个函数系为正交函数系。下面给出正交函数系定义:设函数f(x),g(x)a,b,且则称f(x)与g(x)在a,b上带权(x)正交,第26页,本讲稿共33页在a,b上连续的函数0(x),1(x),2(x),.k(x).,满足 则称该函数系是在区间a,b上带权(x)正交函数系.下面介绍与上述定义有关的几个概念,然后引出正交多项的概念,最后再介绍正交多项式的性质以及几种常见的正交多项式。1.权函数:(1)设a,b是有限或无限区间,(x)是定义在a,b上的非零可积函数,若其满足则称(x)是a,b上的一个权函数。第27页,本讲稿共33页2 2 内积与范数内积与范数设f(x),g(x)a,b,(x)是a,b上的一个权函数,称为f(x)与g(x)在为 a,b上以权函数(x)的内积。显然,对于任意实数a,b,有称为f(x)的带权(x)的2范数。第28页,本讲稿共33页正交多项式的性质正交多项式的性质定理1 a,b上带权(x)的正交多项式系gn(x)一定是 a,b上线相关的函数系。定理2 设是gn(x)a,b上带权(x)的正交多项式系,则对于任何次数不高于n-1的多项式q(x),总有 (q(x),gn(x)=0 (n=1,2,)定理3 n次正交多项式gn(x)有n个互异定根,且全部若在(a,b)内。定理4:任何相邻的三个正交多项式,都具有下列递推关系式 gn+1(x)=(nx-n)gn(x)-n-1gn-1(x)第29页,本讲稿共33页常见的正交多项式常见的正交多项式勒让德多项式(Legendre)切比雪夫多项式(Chebyshev)拉盖尔多项式(Laguerre)埃尔米特多项式 (Hermite)第30页,本讲稿共33页勒让德多项式(Legendre)-1,1,(x)=1递推关系:P0(x)=1,P1(x)=x,第31页,本讲稿共33页Tn(x)=cos(narccosx)切比雪夫多项式(Chebyshev)递推关系:T0(x)=1 ,T1(x)=x ,T2(x)=2x2-1 ,T3(x)=4x3-3x,第32页,本讲稿共33页拉盖尔多项式(Laguerre)0,+),(x)=e-x埃尔米特多项式 (Hermite)(-,+),(x)=e-x2第33页,本讲稿共33页