MATLAB的数值分析.ppt
《MATLAB的数值分析.ppt》由会员分享,可在线阅读,更多相关《MATLAB的数值分析.ppt(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章MATLAB的数值分析制作:陈学明数据拟合在第53页幻灯片集中趋势的测定在统计研究中,需要搜集大量数据并对其进行加工整理,对这些数据进行整理之后发现:大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,是现象规律性的数量表现。集中趋势的描述一均值函数算术平均数 mean(x)调和平均数harmmean(x)几何平均数 geomean(x)切尾均值trimmean(x,percent)集中趋势的描述二中位数(中位次数)函数中位数是指全体数值按大小排
2、列后,位于中间的数值。如果参数集合中包含有偶数个数字,中位数函数将返回位于中间的两个数的平均值。Median(x)集中趋势的描述三众数函数众数是一组数列中出现次数最多的数值,众数函数返回某一数组或数据区域中出现频率最多的数值。最大(小)值函数最大(小)值函数可以返回数据集中的最大(小)数值。range(X)Max(x)-min(x)三种平均数的特点众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不惟一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。中位数是一组数据按大小顺序排序后处于中间
3、位置上的变量,它主要用于对顺序数据的概括性度量。均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。离中趋势的测定在研究现象总体标志的一般水平时,不仅要研究总体标志的集中趋势,还要研究总体标志的离中趋势,如研究价格背离价值的平均程度。研究离中趋势可以通过计算标志变异指标来进行。标志变异指标是同统计平均数相联系的一种综合指标,用于度量随机变量在取值区间内的分布情况,主要有平均差、标准差、方差、四分位数、百分位数等。样本标准差样本标准差函数用来估算样本的标准偏差,反映相对于平均值(mean)的离散程度,计算样本标准差采用不偏估计式(亦即自由度n-1),其计算公式为:std
4、(X)总体标准差总体标准差函数返回以参数形式给出的整个样本总体的标准偏差,反映相对于平均值(mean)的离散程度。计算总体标准差使用整个总体的变量,通常采用偏性估计式(亦即自由度为n),其计算公式为四分位数四分位数是将中值的前后两部分数值再等分为二,以数值小的一端算起,前半部的分区点称为第1四分位数,后半部的分区点称为第3四分位数,而中值即为第2四分位数。四分位数通常用于在销售额和测量值数据集中对总体进行分组。w为数据序列,Q1为上四分位值,Q3为下四分位值,计算如下:Q1=prctile(w,25);Q3=prctile(w,75);prctile()函数实现计算样本的百分位数功能分布形态的
5、测定只用集中趋势和离中趋势来表示所有数据,难免不够准确。分析总体次数的分布形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。峰度是掌握分布形态的另一指标,它能描述分布的平缓或陡峭程度。如果峰度数值等于零,说明分布为正态;若峰度数值大于零,说明分布呈陡峭状态;若峰度数值小于零,说明分布形态趋于平缓。偏度函数偏度函数返回分布的偏斜度。偏斜度反映以平均值为中心的分布的不对称程度。正偏斜度表示不对称边的分布更趋向正值(偏右),负偏斜度表示不对称边的分布更趋向负值(偏左)。其计算公式为ske
6、wness(X)峰度函数峰度函数返回数据集的峰值,表示次数分布高峰的起伏状态。峰值反映与正态分布相比某一分布的尖锐度或平坦度。正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布。其计算公式为:kurtosis(X)插值与拟合插值与拟合属数值分析中函数逼近内容。在数学建模中,插值与拟合是一种常用的数据分析手段,被公认为建模中的十大算法之一。插值问题与拟合问题矿井中某处的瓦斯浓度y与该处距地面的距离x有关,现用仪器测得从地面到井下500米每隔50米的瓦斯浓度数据(xi,yi)(i=0,1,10),根据这些数据完成下列工作:(1)寻找一个函数,要求由此函数可近似求得从地面到井下500米之间任意点处的
7、瓦斯浓度;(2)估计井下600米处的瓦斯浓度。第一个问题可归结为“已知函数在x0,x1,xn处的值,求函数在区间x0,xn内其它点处的值”,这种问题适宜用插值方法解决。插值问题可描述为:已知函数在x0,x1,xn处的值y0,y1,yn,求函数p(x),使p(xi)=yi。但对第二个问题不宜用插值方法,因为600米已超出所给数据范围,用插值函数外推插值区间外的数据会产生较大的误差。第一个问题可归结为第一个问题可归结为“已知函数在已知函数在x0,x1,xn处的值,求函数在区间处的值,求函数在区间x0,xn内其它点处的值内其它点处的值”,这种问题适宜用插值方法解决。这种问题适宜用插值方法解决。插值问
8、题可描述为:已知函数在插值问题可描述为:已知函数在x0,x1,xn处的值处的值y0,y1,yn,求函数,求函数p(x),使,使p(xi)=yi。但对第二个问题不宜用插值方法但对第二个问题不宜用插值方法,因为因为600米已超出米已超出所给数据范围,用插值函数外推插值区间外的数据所给数据范围,用插值函数外推插值区间外的数据会产生较大的误差。会产生较大的误差。解决第二个问题的常用方法是,根据地面到井下解决第二个问题的常用方法是,根据地面到井下 500 处的处的数据求出瓦斯浓度与地面到井下距离数据求出瓦斯浓度与地面到井下距离x之间的近似函数关之间的近似函数关系系f(x),由由f(x)求井下求井下600
9、米处的瓦斯浓度。米处的瓦斯浓度。插值函数过已知点,拟合函数不一定过已知点。通插值函数过已知点,拟合函数不一定过已知点。通常常,插值主要用于求函数值,而拟合的主要目的是求插值主要用于求函数值,而拟合的主要目的是求函数关系。当然,某些问题既可以用插值也可以用函数关系。当然,某些问题既可以用插值也可以用拟合。拟合。插值方法-概述为什么需要插值?(1)函数关系y=f(x)没有明确的表达式(2)y=f(x)表达式复杂,不便于研究和使用 一般地称g(x)为逼近函数,f(x)为被逼近函数。如果要求构造的函数g(x)取给定的离散数据,则称g(x)为f(x)的插值函数。当g(x)为代数多项式时,与之相应的插值逼
10、近称为代数多项式插值。插值多项式存在且唯一插值多项式存在且唯一一维插值若已知的数据集是平面上的一组离散点集(x,y),则其相应的插值就是一维插值。常用插值方法:拉格朗日插值(lagrange插值)分段线性插值三次样条插值拉格朗日插值在数值分析中,拉格朗日插值法是以法国十八世纪数学家约瑟夫路易斯拉格朗日命名的一种多项式插值方法。许多实际问题中都用函数来表示某种内在联系或规律,而不少函数都只能通过实验和观测来了解。如对实践中的某个物理量进行观测,在若干个不同的地方得到相应的观测值,拉格朗日插值法可以找到一个多项式,其恰好在各个观测的点取到观测到的值。这样的多项式称为拉格朗日(插值)多项式。数学上来
11、说,拉格朗日插值法可以给出一个恰好穿过二维平面上若干个已知点的多项式函数。拉格朗日插值法最早被英国数学家爱德华华林于1779年发现1,不久后(1783年)由莱昂哈德欧拉再次发现。1795年,拉格朗日在其著作师范学校数学基础教程中发表了这个插值方法,从此他的名字就和这个方法联系在一起拉格朗日(Lagrange)插值已知函数f(x)在n+1个点x0,x1,xn处的函数值为y0,y1,yn。求一n次多项式函数Pn(x),使其满足:Pn(xi)=yi,i=0,1,n.解决此问题的拉格朗日插值多项式公式如下其中Li(x)为n次多项式:拉格朗日(Lagrange)插值特别地:两点一次(线性)插值多项式三点
12、二次(抛物)插值多项式线性插值线性插值的几何意义线性插值的几何意义:用通过用通过A、B两点的直线近似地代替两点的直线近似地代替曲线曲线 y=f(x)。由解析几何知道由解析几何知道,这条直线用这条直线用点斜式表示为点斜式表示为例:例:已知已知y=f(x)的函数表的函数表 求线性插值多项式求线性插值多项式,并计算并计算x=1.5 的值的值X 1 3 y 1 2解解:由线性插值多项式公式得由线性插值多项式公式得抛物插值抛物插值又称二次插值,它也是常用的代数插值之一。设已知f(x)在三个互异点x0,x1,x2的函数值y0,y1,y2,要构造次数不超过二次的多项式使满足二次插值条件:使满足二次插值条件:
13、例:已知x=1,4,9的平方根值,用抛物插值公式,求(x0 x1)(x0 x2)(xx1)(xx2)y0+(x1x0)(x1x2)(xx0)(xx2)y1+(x2x0)(x2x1)(xx0)(xx1)y2p2(7)=x0=1,x1=4,x2=9y0=1,y1=2,y2=3(14)(19)(74)(79)1+(41)(49)(71)(79)2+(91)(94)(71)(74)3=2.7p2(x)=2.6458拉格朗日插值多项式两个插值点可求出一次插值多项式两个插值点可求出一次插值多项式,而三个插值点可而三个插值点可求出二次插值多项式。插值点增加到求出二次插值多项式。插值点增加到n+1个时个时,也
14、就是也就是通过通过n+1个不同的已知点来构造一个次数为个不同的已知点来构造一个次数为n的代数的代数多项式多项式P(x)。拉格朗日插值多项式结构对称,使用方便。但由于是拉格朗日插值多项式结构对称,使用方便。但由于是用基函数构成的插值,这样要增加一个节点时,所有用基函数构成的插值,这样要增加一个节点时,所有的基函数必须全部重新计算,不具备承袭性,还造成的基函数必须全部重新计算,不具备承袭性,还造成计算量的浪费。计算量的浪费。多数情况下,Lagrange插值法效果是不错的,但随着节点数n的增大,Lagrange多项式的次数也会升高,可能造成插值函数的收敛性和稳定性变差。如龙格(Runge)现象。高次
15、插值中的Runge现象通常选用多项式作为插值函数。在研究插值问题的初期,所有人都认为插值多项式的次数越高,插值精度越高。Runge通过对一个例子的研究发现,上述结论仅仅在插值多项式的次数不超过七时成立;插值多项式的次数超过七时,插值多项式会出现严重的振荡现象,称之为Runge现象。避免Runge现象的常用方法是:将插值区间分成若干小区间,在小区间内用低次(二次,三次)插值,即分段低次插值,如样条函数插值。考察函数考察函数 右图给出了右图给出了和和 的图像的图像,当当n增大时增大时,在两端在两端会发出激烈的振荡会发出激烈的振荡,这就是所谓龙格现这就是所谓龙格现象。该现象表明象。该现象表明,在在大
16、范围内使用高次大范围内使用高次插值插值,逼近的效果往逼近的效果往往是不理想的往是不理想的 高次多项式插值产生的不收敛现象高次多项式插值产生的不收敛现象-Runge 现象现象插值多项式的误差在插值区间a,b上用插值多项式p(x)近似代替f(x),除了在插值节点xi上没有误差外,在其它点上一般是存在误差的。若记若记 R(x)=f(x)-p(x)则则 R(x)就是用就是用 p(x)近似代替近似代替 f(x)时时的截断误差的截断误差,或称插值余项。或称插值余项。x0 x1 xixi+1 xn-1 xny=f(x)y=p(x)ab分段线性插值法从舍入误差来看,高次插值误差的传播也较为严重,在一个节点上产
17、生的舍入误差会在计算中不断扩大,并传播到其它节点上。因此,次数太高的高次插值多项式并不实用,因为节点数增加时,计算量增大了,但插值函数的精度并未提高。为克服在区间上进行高次插值所造成的龙格现象,采用分段插值的方法,将插值区间分成若干个小的区间,在每个小区间进行线性插值,然后相互连接,用连接相邻节点的折线逼近被插函数,这种把插值区间分段的方法就是分段线性插值法。分段线性插值法分段线性插值法在几何上就是用折线替代曲线例例:已知已知f(x)f(x)在四个节点上的函数值如下表所示在四个节点上的函数值如下表所示 30 45 60 901求求f(x)f(x)在区间在区间 30,9030,90 上的分段连续
18、线性插值函数上的分段连续线性插值函数S(x)S(x)解解:将插值区间将插值区间 30,9030,90 分成连续的三个小区间分成连续的三个小区间 30,4530,45,45,6045,60,60,9060,90 则则S(x)在区间在区间 30,4530,45 上的线性插值为上的线性插值为 S(x)在区间在区间 45,6045,60 上的上的线性插值为线性插值为 S(x)S(x)在区间在区间 60,9060,90 上的线性插值上的线性插值为为 将各小区间的将各小区间的线性插值函数连接在一起,得线性插值函数连接在一起,得 样条函数插值法给定n+1个节点上的函数值可以作n次插值多项式,但当n较大时,高
19、次插值不仅计算复杂,而且可能出现Runge现象,采用分段插值虽然计算简单、也有一致收敛性,但不能保证整条曲线在连接点处的光滑性如分段线性插值,其图形是锯齿形的折线,虽然连续,但处都是“尖点”,因而一阶导数都不存在,这在实用上,往往不能满足某些工程技术的高精度要求。如在船体、飞机等外形曲线的设计中,不仅要求曲线连续,而且要有二阶光滑度,即有连续的二阶导数这就要求分段插值函数在整个区间上具有连续的二阶导数。因此有必要寻求一种新的插值方法这就是样条函数插值法三次样条函数设函数定义在区间a,b上,给定n+1个节点和一组与之对应的函数值,若函数满足:在每个节点上满足S(xi)=f(xi)(i=0,1,n
20、)在a,b上有连续的二阶导数在每个小区间xi,xi+1(i=0,1,n-1)上是一个三次多项式。则称S(x)为三次样条插值函数。三次样条插值函数S(x)是一个分段三次多项式。另一方面,要求分段三次多项式S(x)及其导数S(x)和S(x)在整个插值区间a,b上连续,则要求它们在各个子区间的连接点上连续。三次样条函数用三次样条绘制的曲线不仅有很好的光滑度,而且当节点逐渐加密时,其函数值在整体上能很好地逼近被插函数,相应的导数值也收敛于被插函数的导数,不会发生龙格现象。因此三次样条在计算机辅助设计中有广泛的应用。几种插值方法的比较插值法中的拉格朗日插值多项式是研究数值微积分与微分方程数值解的重要工具
21、。牛顿插值多项式是拉格朗日插值多项式的变形,具有承袭性,比拉格朗日插值多项式节省计算量。分段低次多项式插值由于具有良好的稳定性与收敛性,且算法简单,便于应用。特别是应用广泛的三次样条插值,不但有较好的稳定性和收敛性,而且具有较好的光滑性,从而满足了许多实际问题的要求。一维插值函数yi=interp1(x,y,xi,method)xi处的插处的插值结果值结果插值节点插值节点被插值点被插值点插值方法插值方法nearest 最邻近插值;最邻近插值;linear 线性插值;线性插值;spline 三次样条插值;三次样条插值;cubic 立方插值;立方插值;缺省时缺省时 分段线性插值分段线性插值 注意:
22、所有的插值注意:所有的插值方法都要求方法都要求x是单调的,是单调的,并且并且xi不能够超过不能够超过x的的范围范围nearest 最邻近插值;最邻近插值;linear 线性插值;线性插值;spline 三次样条插值;三次样条插值;cubic 立方插值;立方插值;缺省时缺省时 分段线性插值分段线性插值nearest 最邻近插值;最邻近插值;linear 线性插值;线性插值;spline 三次样条插值;三次样条插值;cubic 立方插值;立方插值;缺省时缺省时 分段线性插值分段线性插值例:从例:从1 1点点1212点点的的1111小时内,每隔小时内,每隔1 1小时测量一次温小时测量一次温度,测得的
23、温度的数值依次为:度,测得的温度的数值依次为:5 5,8 8,9 9,1515,2525,2929,3131,3030,2222,2525,2727,2424试估计每隔试估计每隔1/101/10小小时的温度值时的温度值hours=1:12;temps=5 8 9 15 25 29 31 30 22 25 27 24;h=1:0.1:12;t=interp1(hours,temps,h,spline);plot(hours,temps,+,h,t,hours,temps,r:)%作图作图xlabel(Hour),ylabel(Degrees Celsius)xy机翼下机翼下轮廓线轮廓线例例 已知
24、飞机下轮廓线上数据如下,求已知飞机下轮廓线上数据如下,求x每改变每改变0.1时的时的y值值x0=0 3 5 7 9 11 12 13 14 15;y0=0 1.2 1.7 2.0 2.1 2.0 1.8 1.2 1.0 1.6;x=0:0.1:15;%插值及作图在下页插值及作图在下页plot(x0,y0,kp,x,y1,r)plot(x0,y0,kp,x,y2,r)plot(x0,y0,kp,x,y3,r)y1=interp1(x0,y0,x,nearest);y2=interp1(x0,y0,x);y3=interp1(x0,y0,x,spline);二维插值函数(网格点)z=interp2
25、(x0,y0,z0,x,y,method)被插值点的函数值被插值点的函数值插值节点插值方法nearest 最邻近插值;最邻近插值;linear 双线性插值;双线性插值;cubic 双三次插值;双三次插值;缺省时缺省时 双线性插值双线性插值.要求要求x0,y0单调;单调;x,y可取可取为矩阵,或为矩阵,或x取行取行向量,向量,y取为列向量,取为列向量,x,y的值分别不能超出的值分别不能超出x0,y0的范围的范围例:测得平板表面例:测得平板表面3 35 5网格点处的温度分别为:网格点处的温度分别为:82 81 80 82 84 82 81 80 82 84 79 63 61 65 81 79 63
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 数值 分析
限制150内