第11讲 回归分析.ppt
《第11讲 回归分析.ppt》由会员分享,可在线阅读,更多相关《第11讲 回归分析.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学建模讲座数学建模讲座回归分析方法回归分析方法1/4/20231一元线性回归一元线性回归多元线性回归多元线性回归回归分析方法回归分析方法数数学学模模型型及及定定义义*模模型型参参数数估估计计*检检验验、预预测测与与控控制制可可线线性性化化的的一一元元非非线线性性回回归归(曲曲线线回回归归)数数学学模模型型及及定定义义*模模型型参参数数估估计计*多多元元线线性性回回归归中中的的检检验验与与预预测测逐逐步步回回归归分分析析1/4/20232一、数学模型一、数学模型例例1 测16名成年女子的身高与腿长所得数据如下:以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi)在平面直角坐标系上标出.
2、散点图解答1/4/20233一元线性回归分析的主要任务主要任务是:返回返回、1、用试验值(样本值)对0b1b和s作点估计;、2、对回归系数0b1b作假设检验;3、在x=0 x处对y作预测,对y作区间估计.1/4/20234二、模型参数估计二、模型参数估计1、回归系数的最小二乘估计、回归系数的最小二乘估计1/4/20235其中其中,1/4/20236返回返回1/4/20237三、检验、预测与控制三、检验、预测与控制1、回归方程的显著性检验、回归方程的显著性检验1/4/202381/4/20239()F检验法检验法()t检验法检验法以下介绍三种不同的检验方法,它们的本质是相同的1/4/202310
3、()r检验法检验法1/4/2023112、回归系数的置信区间、回归系数的置信区间1/4/2023123、预测与控制、预测与控制(1)预测)预测:对固定的对固定的x值预测相应的值预测相应的y值值1/4/202313(2)控制)控制返回返回1/4/202314四、可线性化的一元非线性回归四、可线性化的一元非线性回归(曲线回归)(曲线回归)例例2出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表:解答1/4/202315散点图此即非线性回归非线性回归或曲线回归曲线回归问题(需要配曲线)配曲线的一般方法是:
4、配曲线的一般方法是:1/4/202316通常选择的六类曲线如下:返回返回1/4/2023172 多元线性回归多元线性回归在工程上更为有用。一、数学模型及定义一、数学模型及定义1/4/2023181/4/202319返回返回1/4/202320二、模型参数估计二、模型参数估计解得估计值 1/4/202321返回返回1/4/202322三、多元线性回归中的检验与预测三、多元线性回归中的检验与预测()F检验法检验法()r检验法检验法(残差平方和)残差平方和)1/4/2023232、预测、预测(1)点预测)点预测(2)区间预测)区间预测返回返回1/4/202324四、逐步回归分析四、逐步回归分析 实际
5、问题中影响因变量的因素可能很多,我们希望从中挑选出影响显著的自变量来建立回归模型,这就涉及到变量选择的问题。逐步回归是一种从众多变量中有效地选择重要变量的方法。,它是在多元线性回归的基础上派生出来的一种算法技巧。“最最优优”的的回回归归方方程程就是包含所有对Y有影响的变量,而不包含对Y影响不显著的变量回归方程。1/4/202325(4)“有进有出”的逐步回归分析。(1)从所有可能的因子(变量)组合的回归方程中选择最优者;(2)从包含全部变量的回归方程中逐次剔除不显著因子;(3)从一个变量开始,把变量逐个引入方程;选择“最优”的回归方程有以下几种方法:以第四种方法,即逐步回归分析法逐步回归分析法
6、在筛选变量方面较为理想.1/4/202326 这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。逐步回归分析法逐步回归分析法的思想:从一个自变量开始,视自变量Y作用的显著程度,从大到地依次逐个引入回归方程。当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。返回返回1/4/202327统计工具箱中的回归分析命令统计工具箱中的回归分析命令1、多元线性回归、多元线性回归2、多项式回归、多项式回归
7、3、非线性回归、非线性回归4、逐步回归、逐步回归返回返回1/4/2023281.多元线性回归多元线性回归 b=regress(Y,X)1)确定回归系数的点估计值:确定回归系数的点估计值:1/4/2023293、画出残差及其置信区间:画出残差及其置信区间:rcoplot(r,rint)2)求回归系数的点估计和区间估计、并检验回归模型:求回归系数的点估计和区间估计、并检验回归模型:b,bint,r,rint,stats=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F对应的概率p置信区间 显著性水平(缺省时为0.05)1/4/
8、202330例例1 解:解:1、输入数据:输入数据:x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164;X=ones(16,1)x;Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;2、回归分析及检验:回归分析及检验:b,bint,r,rint,stats=regress(Y,X)b,bint,statsTo MATLAB(liti11)题目1/4/2023313、残差分析,作残差图:、残差分析,作残差图:rcoplot(r,rint)从残差图可以看出,除第二个
9、数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点.4、预测及作图:、预测及作图:z=b(1)+b(2)*x plot(x,Y,k+,x,z,r)返回返回To MATLAB(liti12)1/4/202332多多项项式式回回归归(一)一元多项式回归一)一元多项式回归(1)确定多项式系数的命令:p,S=polyfit(x,y,m)(2)一元多项式回归命令:polytool(x,y,m)1、回归:、回归:y=a1xm+a2xm-1+amx+am+1 此命令产生一个交互式的画面,画面中有拟合
10、曲线和y的置信区间。通过左下方的Export菜单,可以输出回归系数等。1/4/2023332、预测和预测误差估计:、预测和预测误差估计:(1)Y=polyval(p,x)求polyfit所得的回归多项式在x处的预 测值Y;(2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得 的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y DELTA;alpha缺省时为0.5.一元多项式回归也可以化为多元线性回归来解。1/4/202334法一法一 直接作二次多项式回归:直接作二次多项式回归:t=1/30:1/30:14/30;s=11.86 15.67
11、20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;p,S=polyfit(t,s,2)To MATLAB(liti21)得回归模型为:1/4/202335法二法二化为多元线性回归:化为多元线性回归:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1)t(t.2);b,bint,r,rint,stats=regre
12、ss(s,T);b,statsTo MATLAB(liti22)得回归模型为:Y=polyconf(p,t,S)plot(t,s,k+,t,Y,r)预测及作图预测及作图To MATLAB(liti23)1/4/202336(二)多元二项式回归(二)多元二项式回归命令:rstool(x,y,model,alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量1/4/202337 命令rstool产生一个交互式画面,画面中有m个图形,这m个图形分别给出了一个独立变量xi(另m-1个变量取固定值)与y的拟合曲线,以及y的置信区间。可以通过键入不同的xi值来获得相应的y值。1/4/202338例例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第11讲 回归分析 11 回归 分析
限制150内