数学建模公选课第六讲.ppt
《数学建模公选课第六讲.ppt》由会员分享,可在线阅读,更多相关《数学建模公选课第六讲.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学建模公选课第六讲数学建模公选课第六讲现在学习的是第1页,共44页一、数学模型一、数学模型如:如:测16名成年女子的身高与腿长所得数据如下:以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi)在平面直角坐标系上标出.散点图第一节。回归分析第一节。回归分析现在学习的是第2页,共44页 一般地,称由一般地,称由 确定的模型为一元线性回确定的模型为一元线性回归模型。其中,未知参数归模型。其中,未知参数a、b称为回归系数,自变量称称为回归系数,自变量称为回归变量。为回归变量。称为称为y对对x的回归直线方程。的回归直线方程。一元线性回归分析的一元线性回归分析的主要任务主要任务是:是:1.用试验
2、值(样本值)对用试验值(样本值)对a、b和方差作矩估计;和方差作矩估计;2.对回归系数对回归系数a、b作假设检验;作假设检验;3.对对y作预测和区间估计。作预测和区间估计。现在学习的是第3页,共44页二、模型参数估计二、模型参数估计1、回归系数的最小二乘估计、回归系数的最小二乘估计有有n组独立观测值:组独立观测值:记最小二乘法就是选择最小二乘法就是选择a、b的估计值,使得的估计值,使得Q最小。根据极值存在最小。根据极值存在第二必要条件,得知此时第二必要条件,得知此时Q对对a和和b的二阶偏导数同时为零。的二阶偏导数同时为零。现在学习的是第4页,共44页得:检验检验(1)相关系数的检验;)相关系数
3、的检验;(2)判定系数;)判定系数;(3)线性回归方程的显著性检验;)线性回归方程的显著性检验;现在学习的是第5页,共44页现在学习的是第6页,共44页三、检验、预测与控制三、检验、预测与控制1、回归方程的显著性检验、回归方程的显著性检验现在学习的是第7页,共44页(1)相关系数的显著性检验()相关系数的显著性检验(t检验法)检验法)提出假设:现在学习的是第8页,共44页(2)判定系数)判定系数用来衡量是否存在依存关系的指标,究竟有多大的随机影响可能性。现在学习的是第9页,共44页(3)线性回归方程的显著性检验)线性回归方程的显著性检验假设:选回归系数b的检验统计量:是回归系数b的标准差。现在
4、学习的是第10页,共44页选显著性水平,结合自由度查表得t临界值确定拒绝域现在学习的是第11页,共44页2、预测与控制、预测与控制(1)预测)预测现在学习的是第12页,共44页例:一位心理学家获得了例:一位心理学家获得了10个工人的智商值和劳个工人的智商值和劳动生产率的数据,其结果如下表所示。试拟合一动生产率的数据,其结果如下表所示。试拟合一条曲线,建立一个数学模型,并根据模型和某一条曲线,建立一个数学模型,并根据模型和某一个人的智商值个人的智商值120,预测其劳动生产率。,预测其劳动生产率。现在学习的是第13页,共44页序号序号智商智商x生生产率率yx2y2xy11105.21210027.
5、04572.0021206.01440036.00720.0031306.31690039.69819.0041265.71587632.49718.251224.81488423.04585.661214.21464117.64508.271033.0106099.00309.008982.996048.41284.209802.764007.29216.0010973.2940910.24310.40合合计110744.0124823210.845042.60现在学习的是第14页,共44页r=0.867现在学习的是第15页,共44页四、逐步回归分析四、逐步回归分析(4)“有进有出”的逐步回
6、归分析。(1)从所有可能的因子(变量)组合的回归方程中选择最优者;(2)从包含全部变量的回归方程中逐次剔除不显著因子;(3)从一个变量开始,把变量逐个引入方程;选择“最优”的回归方程有以下几种方法:“最最优优”的的回回归归方方程程就是包含所有对Y有影响的变量,而不包含对Y影响不显著的变量回归方程。以第四种方法,即逐步回归分析法逐步回归分析法在筛选变量方面较为理想.现在学习的是第16页,共44页 这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。逐步回归分析法逐步回归分析法的思想:从一个自变量开始,视自变量Y作用的显著程度,从大到地依次逐个引入回归方程。当
7、引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。返回返回现在学习的是第17页,共44页第二节。统计工具箱中的回归分析命令第二节。统计工具箱中的回归分析命令1、多元线性回归、多元线性回归2、多项式回归、多项式回归3、非线性回归、非线性回归4、逐步回归、逐步回归返回返回现在学习的是第18页,共44页多元线性回归多元线性回归 b=regress(Y,X)1、确定回归系数的点估计值:确定回归系数的点估计值:现在学习的是第19页,共44页
8、3、画出残差及其置信区间:画出残差及其置信区间:rcoplot(r,rint)2、求回归系数的点估计和区间估计、并检验回归模型:求回归系数的点估计和区间估计、并检验回归模型:b,bint,r,rint,stats=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F对应的概率p置信区间 显著性水平(缺省时为0.05)现在学习的是第20页,共44页1、输入数据:输入数据:x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164;X=ones(16,1)x;
9、Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;解:解:例例1 测16名成年女子的身高与腿长所得数据如下:现在学习的是第21页,共44页2、回归分析及检验:回归分析及检验:b,bint,r,rint,stats=regress(Y,X)b,bint,statsTo MATLAB(liti11)题目现在学习的是第22页,共44页3、残差分析,作残差图:、残差分析,作残差图:rcoplot(r,rint)从残差图可以看出,除第二个数据外,其余数据的残差离零点从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零
10、点,这说明回归模型均较近,且残差的置信区间均包含零点,这说明回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第二个能较好的符合原始数据,而第二个数据可视为异常数据可视为异常点点.4、预测及作图:、预测及作图:z=b(1)+b(2)*xplot(x,Y,k+,x,z,r)To MATLAB(liti12)现在学习的是第23页,共44页多多项项式式回回归归(一)一元多项式回归(一)一元多项式回归(1)确定多项式系数的命令:p,S=polyfit(x,y,m)(2)一元多项式回归命令:polytool(x,y,m)1、回归:、回归:y=a1xm+a2xm-1+amx+am+12、
11、预测和预测误差估计:、预测和预测误差估计:(1)Y=polyval(p,x)求polyfit所得的回归多项式在x处 的预 测值Y;(2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得 的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y DELTA;alpha缺省时为0.5.现在学习的是第24页,共44页法一法一 直接作二次多项式回归:直接作二次多项式回归:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 1
12、29.54 146.48;p,S=polyfit(t,s,2)To MATLAB(liti21)得回归模型为:现在学习的是第25页,共44页法二法二化为多元线性回归:化为多元线性回归:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1)t(t.2);b,bint,r,rint,stats=regress(s,T);b,statsTo MATLAB(liti22)得回归模型为:Y=polyconf(p,t,S)p
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 选课 第六
限制150内