数学建模基础知识问答与标准答案(有标准答案).doc
牡丹江师范学院期末考试试题库科目:数学模型与数学实验 年级:2006学期:2008-2009-2考核方式:开卷命题教师:数学模型与数学实验课程组一、解答题:(每小题30分)1 、已知如下点列,求其回归直线方程,并计算最小误差平方和x0.10.110.120.130.140.150.160.170.180.20.210.23y4243.54545.54547.5495350555560参考程序(t1.m):x=0.1 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.2 0.21 0.23;n=length(x)X=ones(n,1) x;Y=42 43.5 45 45.5 45 47.5 49 53 50 55 55 60;b,bint,r,rint,stats=regress(Y,X);b,bint,stats% 预测y=b(1)+b(2)*x%E误差平方和E=sum(Y-y).2)参考结果:回归直线:误差平方和:17.4096是否重点:重点难易程度:中知识点所在章节:第十六章第一节2、合金强度y与其中含碳量x有密切关系,如下表x0.100.110.120.130.140.150.160.170.180.200.210.23y42.041.545.045.545.047.549.055.050.055.055.560.5根据此表建立y(x)。并对结果作可信度进行检验、判断x对y影响是否显著、检查数据中有无异常点、由x的取值对y作出预测。解:参考程序(t2.m):x=0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.2 0.21 0.23;Y=42.0 41.5 45.0 45.0 45 47.5 49.0 55.0 50.0 55.0 55.5 60.5;scatter(x,Y);n=length(x)X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%残差图rcoplot(r,rint)% 预测y=b(1)+b(2)*x%剔除异常点重新建模X(8,:)=;Y(8)=;b,bint,r,rint,stats=regress(Y,X);b,bint,stats,rcoplot(r,rint)结果和图:b = 27.0269 140.6194bint = 22.3226 31.7313111.7842 169.4546 stats =0.9219 118.0670 0.0000结果分析:由知,接近1,故对的影响显著,回归模型可用。观察所得残差分布图,看到第8个数据的残差置信区间不含零点,此点视为异常点,剔除后重新计算。此时键入:X(8,:)=;Y(8)=;b,bint,r,rint,stats=regress(Y,X);b,bint,stats,rcoplot(r,rint)得:b = 27.0992 137.8085bint = 23.8563 30.3421 117.8534 157.7636stats =0.9644 244.0571 0.0000可以看到:置信区间缩小;R2、F变大,所以应采用修改后的结果。所以,建立的回归预测方程为:是否重点:重点难易程度:中知识点所在章节:第十六章第一节3、将17至29岁的运动员每两岁一组分为7组,每组两人测量其旋转定向能力,以考察年龄(x)对这种运动能力(y)的影响。现得到一组数据如下表年龄17192123252729第一人2048251326153002612031935第二人243528112633142692257213试建立关系y(x),并作必要的统计分析。解:方法1程序(见t3_1.m):x=17:2:29;x=x,x;y=20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3;scatter(x,y);figure(2)%确定一元多项式回归系数polytool(x,y,2)点击图3-2中的export,全部选中点击ok,之后在命令窗口输入: beta,y1,residuals% beta回归系数,y1预测值,residuals残差结果与图:在x-y平面上画散点图(图2-1),直观地知道y与x大致为二次函数关系。设模型为图3-1 散点图图3-2 交互图窗口中绿线为拟合曲线、红线为y的置信区间、可通过移动鼠标的十字线或通过在窗口下方输入来设定x值,窗口左边则输出与x对应的y值及y的置信区间。通过左下方的Export下拉菜单可输出回归系数等。beta = -0.2003 8.9782 -72.2150模型为: 方法2参考程序 (t3_2.m):x=17:2:29;x=x,x;y=20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3;scatter(x,y);p,S=polyfit(x,y,2)方法2结果:p = -0.2003 8.9782 -72.2150S = R: 3x3 double df: 11 normr: 7.2162模型为:方法3程序(t3_3.m)x=17:2:29;x=x,x;y=20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3;scatter(x,y);X=ones(14,1),x,(x.2)b,bint,r,rint,stats=regress(y,X);b,stats方法3结果:b = -72.2150 8.9782 -0.2003stats =0.6980 12.7113 0.0014 4.7340与方法1,2的结果一样是否重点:重点难易程度:中知识点所在章节:第十六章第三节4、某厂生产的某产品的销售量与竞争对手的价格x1和本厂的价格x2有关。下表是该产品在10个城市的销售记录。x1120140190130155175125145180150x210011090150210150250270300250y(个)10210012077469326696585试建立关系y(x1,x2),对结果进行检验。若某城市本厂产品售价160(元),对手售价170(元),预测此产品在该城市的销售量。解:参考程序(t4.m):%建立二元线性回归x1=120,140,190,130,155,175,125,145,180,150;x2=100,110,90,150,210,150,250,270,300,250;y=102,100,120,77,46,93,26,69,65,85;x=ones(10,1),x1,x2;b,bint,r,rint,stats=regress(y,x);b,bint,stats,%改进,建立二元多项式x(:,1)=;rstool(x,y)结果 这是一个多元回归问题。若设回归模型是线性的,即设用regress(y,x,alpha)求回归系数。得b = 66.5176 0.4139 -0.2698bint = -32.5060 165.5411 -0.2018 1.0296 -0.4611 -0.0785stats =0.6527 6.5786 0.0247p=0.0247,若显著水平取0,01,则模型不能用;=0.6527较小;的置信区间包含零点。因此结果不理想。于是设模型为二次函数。此题设模型为纯二次函数:对此例,在命令窗中键入x(:,1)=;rstool(x,y,purequadratic)得到交互式对话窗(图4-1):图4-1 交互式对话窗对于“本厂售价160,对手售价170,预测该市销售量”的问题,在下方窗口中分别输入160和170,就可在左方窗口中读到答案及其置信区间。下拉菜单Export向工作窗输出数据具体操作为:弹出菜单,选all,点击确定。此时可到工作窗中读取数据。可读数据包括:beta(回归系数) rmse(剩余标准差) residuals (残差)。本题只要键入beta,rmse,residuals注:可在图左下方的下拉菜单中选择其它模型:interaction, full quadratic交叉二次回归模型 剩余标准差19.1626完全二次回归模型 剩余标准差18.6064 纯二次回归模型 剩余标准差为16.6436由于纯二次回归模型的剩余标准差最小,采用其建模并预测。纯二次回归模型为:剩余标准差为16.6436。当,得销售量,置信区间79.371-53.6392, 79.371+53.6392,即25.7318,133.0102是否重点:重点难易程度:中知识点所在章节:第十六章第三节5、以家庭为单位,某种商品的月需求量与该商品价格之间的一组调查数据为价格(元)2444.655.25.666.67需求量(千克)53.532.72.42.521.51.21.2求回归直线,并进行残差分析解:参考程序(t5.m)x=2 4 4 4.6 5 5.2 5.6 6 6.6 7;n=length(x);X=ones(n,1) x;Y=5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2;b,bint,r,rint,stats=regress(Y,X);b, r, statsrcoplot(r,rint)figure(2)z=b(1)+b(2)*xplot(x,Y,k+,x,z,r)结果与图:b = 6.4383 -0.7877stats = 0.9739 298.5240 0.0000结果分析:由知,接近1,故对的影响显著,回归模型可用。回归直线为: 残差分析:图5-1残差图由残差分析图5-1看出,残差置信区间均包含零点,无异常点。故,模型较好的符合原始数据。由图5-2也可以看出回归直线较好的拟合原始数据。图5-2 拟合比较图是否重点:重点难易程度:中知识点所在章节:第十六章第三节6、给出国家文教科学卫生事业费支出额ED(亿元)和国家财政收入额FI(亿元),作一元线性模型回归分析,并对所有结果作出分析评估。若2003年预期的国家财政收入为12050亿元,试求文教卫支出2003年的点预测值和区间预测值(部分数据为模拟数据)。年份EDFI年份EDFI199170831491998198793201992793348319992021987619939584349200022131035619941278521820012536115891995146762422002296013010199617047408200314268199719048651解:参考程序(t6.m):x=3149 3483 4349 5218 6242 7408 8651 9320 9876 10356 11589 13010 14268 ;Y=708 793 958 1278 1467 1704 1904 1904 1987 2021 2213 2536 2960;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%残差图rcoplot(r,rint)%预测y=b(1)+b(2)*x;%点预测x1=14268;y1=b(1)+b(2)*x1%区间预测deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta, y1+1.96*deta结果:b = 212.8152 0.1839bint = 54.6098 371.0206 0.1662 0.2017stats = 1.0e+004 *0.0001 0.0522 0.0000 1.0136y1 = 2.8372e+003由统计检验量知,回归模型显著。一元线性回归模型为:2003年的点预测值为2837.2,预测区间.是否重点:重点难易程度:中知识点所在章节:第十六章第三节7、为了研究某一化学反应过程中温度对产品得率的影响. 测得数据如下: 求y与x的线性回归方程,检验回归效果是否显著,并预测x=155度时产品得率的估值及预测区间(置信度95%).解:参考程序(t7.m):x=100:10:190;Y=45 51 54 61 66 70 74 78 85 89;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%预测y=b(1)+b(2)*x;%点预测x1=155;y1=b(1)+b(2)*x1%区间预测deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta, y1+1.96*deta结果:b = -2.7394 0.4830bint = -6.3056 0.8268 0.4589 0.5072stats = 1.0e+003 * 0.0010 2.1316 0.0000 0.0009y1 = 72.1303ans = 70.2678ans = 73.9928由统计检验量知,回归模型显著。一元线性回归模型为:时,产品得率为72.1303,置信度为的预测区间.是否重点:重点难易程度:中知识点所在章节:第十六章第三节8、对某地区生产同一产品的8个不同规模的乡镇企业进行生产费用调查, 得产量x(万件)和生产费用Y (万元)的数据如下:试据此建立Y关于x的回归方程,检验回归效果是否显著,并预测x=3.5时生产费用的估值及预测区间(置信度95%).解:参考程序(t8.m):x=1.5 2 3 4.5 7.5 9.1 10.5 12;Y=5.6 6.6 7.2 7.8 10.1 10.8 13.5 16.5;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%预测y=b(1)+b(2)*x;%点预测x1=3.5;y1=b(1)+b(2)*x1%区间预测deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta, y1+1.96*deta结果:b = 4.1575 0.8950stats =0.9376 90.1871 0.0001 y1 = 7.2900ans = 5.3086ans = 9.2714由统计检验量知,回归效果显著。一元线性回归模型为:时,产品得率为7.2900,置信度为的预测区间.是否重点:重点难易程度:中知识点所在章节:第十六章第一节9、以家庭为单位, 某种商品年需求量与该商品价格之间的一组调查数据如下表:(1) 求经验回归方程;(2) 检验线性关系的显著性().解:参考程序:x=5 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5;Y=1 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,stats%残差图rcoplot(r,rint)结果:b = 4.4951 -0.8259stats = 0.7443 23.2890 0.0013 0.2103(1) 经验回归方程为:(2) 由统计检验量知,线性关系不显著,模型不可用。由残差图(图9-1)可以看出,第一数据的残差离零点的距离较远,且残差置信区间不包含零点,故第一个数据为异常点,应该剔除,重新建立线性回归模型。图9-1 残差图在命令窗口键入:X(1,:)=;Y(1)=;b,bint,r,rint,stats=regress(Y,X);b, statsb = 6.1559 -1.4751stats = 0.9476 126.6833 0.0000 0.0392(1)经验回归方程为:(2)由统计检验量知,回归模型显著,模型可用。是否重点:重点难易程度:中知识点所在章节:第十六章第三节10、某建材实验室做陶粒混凝土实验室中, 考察每混凝土的水泥用量(kg)对混凝土抗压强度(kg/)的影响, 测得下列数据.(1) 求经验回归方程;(2) 检验一元线性回归的显著性();(3) 设 求的预测值及置信度为0.95的预测区间.解:参考程序(t10.m):x=150:10:260;Y=56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%预测y=b(1)+b(2)*x;%点预测x1=225;y1=b(1)+b(2)*x1%区间预测deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta, y1+1.96*deta结果:b = 10.28290.3040stats = 1.0e+003 * 0.0010 5.5225 0.0000 0.0002y1 = 78.6797ans = 77.7210ans = 79.6385(1),经验回归方程:(2)由统计检验量知,回归模型显著。(3)时,预测值为78.6797,置信度为的预测区间.是否重点:重点难易程度:中知识点所在章节:第十六章第一节11、电容器充电达某电压值时为时间的计算原点, 此后电容器串联一电阻放电, 测定各时刻的电压u, 测量结果如下:若u与t的关系为 其中未知, 求u对t的回归方程.解:对原关系式取对数,得,令,得程序(t11.m):t=0:1:10;u=100 75 55 40 30 20 15 10 10 5 5;n=length(t);Y=log(u);x=t;X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,statsu0=exp(b(1);c=-b(2);%预测u=u0*exp(-c*t);结果:b = 4.6130 -0.3126stats =0.9900 891.4418 0.0000 u0 = 100.7890c =0.3126由统计检验量知,回归模型显著。对t的回归方程:是否重点:重点难易程度:中知识点所在章节:第十六章第三节12、考察温度对产量的影响,测得下列10组数据:(1) 求经验回归方程;(2) 检验回归的显著性();(3) 求时产量y的预测值及置信度为0.95的预测区间.解 参考程序(t12.m):x=20:5:65;Y=13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats%预测y=b(1)+b(2)*x;%点预测x1=52;y1=b(1)+b(2)*x1%预测区间deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta, y1+1.96*deta结果:b = 9.12120.2230stats = 0.9821 439.8311 0.0000 0.2333y1 = 20.7188ans = 19.7722ans = 21.6654(1)经验回归方程:(2)当时,由知,回归显著。(3)时,产量的预测值为20.7188,置信度为0.95的预测区间为19.7722, 21.6654是否重点:重点难易程度:中知识点所在章节:第十六章第一节13、在某化工生产过程中,进入反应塔内某气体的百分比y与该气体的温度及气态压力有关,试验数据如下:气温 78.0113.5154.0169.0187.0206.0214.0气压 1.03.28.412.018.527.532.0百分比y1.56.020.030.050.080.0100.0求y关于及的二元线性回归方程.解 参考程序(t13.m):x1=78 113.5 154 169 187 206 214;x2=1 3.2 8.4 12.0 18.5 27.5 32.0;Y=1.5 6.0 20.0 30 50 80 100;n=length(x1);X=ones(n,1) x1,x2;b,bint,r,rint,stats=regress(Y,X);b,bint,stats结果:b = 9.5617 -0.1423 3.7052bint = -3.4968 22.6203 -0.2648 -0.0198 3.1929 4.2176stats = 1.0e+003 *0.0010 1.1433 0.0000 由运行结果可以看出,回归系数均不包含零点,且检验统计量为知,回归模型显著。因此,二元线性回归方程为:是否重点:重点难易程度:中知识点所在章节:第二章第五节14、某厂的产品15个地区销售,各地区人口数平均每户总收入等于有关资料如下表。试求销售量关于人数及每户总收入的回归方程。销售量y(箱)16212022313167人口数 (千人)27418037520586每户总收入 (元)24503254380228382347销售量y(箱)11655252232144人口数 (千人)19553430372236每户总收入 (元)21372560402044272660销售量y(箱)16981192103212人口数 (千人)26598330157370每户总收入 (元)37823008245020882605解 参考程序(t14.m):x1=274 180 375 205 86 195 53 430 372 236 265 98 330 157 370;x2=2450 3254 3802 2838 2347 2137 2560 4020 4427 2660 3782 3008 2450 2088 2605;Y=162 120 223 131 67 116 55 252 232 144 169 81 192 103 212;n=length(x1);X=ones(n,1) x1,x2;b,bint,r,rint,stats=regress(Y,X);b,bint,stats结果:b = 3.4526 0.4960 0.0092bint = -1.8433 8.7485 0.4828 0.5092 0.0071 0.0113stats = 1.0e+003 *0.0010 5.6795 0 由运行结果可以看出,回归系数均不包含零点,且检验统计量为知,回归模型显著。因此,销售量关于人数及每户总收入的回归方程:是否重点:重点难易程度:中知识点所在章节:第十六章第二节15、炼纲过程中用来盛钢水的钢包,由于受钢水的浸蚀作用,容积会不断扩大。下表给出了使用次数和容积增大量的15对试验数据:使用次数(xi)增大容积(yi)使用次数(xi)增大容积(yi)23456786.428.209.589.509.7010.009.939101112131415169.9910.4910.5910.6010.8010.6010.9010.76试求型回归方程。解 参考程序(t15.m):x=2:16;y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76;n=length(x);u=1./x;v=1./y;X=ones(n,1) u;b,bint,r,rint,stats=regress(v,X);b,bint,stats%残差图rcoplot(r,rint)%预测及作图yy=x./(b(1)*x+b(2);plot(x,y,k+,x,yy,r)结果:b = 0.0823 0.1312stats =0.9379 196.2270 0.0000 0.0000由知,回归方程显著,可用。回归方程为:图15-1 散点图和拟合曲线图是否重点:重点难易程度:中知识点所在章节:第十六章第三节16、某种合成纤维的强度与其拉伸倍数有关。下表是24个纤维样品的强度与相应的拉伸倍数的实测记录。试求这两个变量间的经验公式。编 号123456789101112拉伸倍数x1.92.02.12.52.72.73.53.54.04.04.54.6强度y (Mpa)1.41.31.82.52.82.53.02.74.03.54.23.5编 号131415161718192021222324拉伸倍数x5.05.26.06.36.57.18.08.08.99.09.510.0强度y (Mpa)5.55.05.56.46.05.36.57.08.58.08.18.1(1) 求经验回归方程;(2) 检验回归的显著性();(3) 求时强度y的预测值及置信度为0.95的预测区间.解 参考程序(t16.m)x=1.9 2.0 2.1 2.5 2.7 2.7 3.5 3.5 4.0 4.0 4.5 4.6. 5 5.2 6 6.3 6.5 7.1 8 8 8.9 9 9.5 10;Y=1.4 1.3 1.8 2.5 2.8 2.5 3.0 2.7 4 3.5 4.2 3.5 5,. 5.2 6 6.3 6.5 7.1 8 8 8.9 9 9.5 10;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,stats%预测y=b(1)+b(2)*x;%点预测x1=7.5;y1=b(1)+b(2)*x1%区间预测deta=sqrt(sum(Y-y).2)/(n-2);y1-1.96*deta,y1+1.96deta结果:b = -0.5241 1.0610stats = 1.0e+003 * 0.0010 2.1030 0 0.0001y1 = 7.4335ans = 6.8739ans =7.9930(1)经验回归方程:(2)当时,由知,回归方程显著。(3)时,强度=7.4335,置信度为0.95的预测区间为6.8739,7.9930是否重点:重点难易程度:中知识点所在章节:第十六章第一节17、给10只大鼠注射内霉素(30mg/kg)后,测得每只大鼠红细胞含量x与血红蛋白含量y如下所示,是对x和y进行回归分析。x: 654 786 667 605 761 642 652 706 602 539y: 130 168 143 130 158 129 151 153 151 109解 参考程序(t17.m)直接建立线性回归模型程序:x=654 768 667 605 761 642 652 706 602 539;Y=130 168 143 130 158 129 151 153 151 109;scatter(x,Y)n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,statsrcopolt(r,rint)得:stats =0.6890 17.7240 0.0030 107.3550图17-1 残差图由统计检验量stats知,所建立的线性回归模型可用,但是效果并不理想。由残差图(图17-1)看出有异常点,所以应该剔除,重新建立模型。剔除异常点建立模型程序(t17.m):X(9,:)=;Y(9)=;X(7,:)=;Y(7)=;b,bint,r,rint,stats=regress(Y,X);b,statsrcoplot(r,rint)运行得:b = -15.9879 0.2361stats =0.8704 47.0246 0.0002 49.5248两次比较,剔除异常点后的值有所增加,=0.8704也较接近1。故回归方程为: 是否重点:重点难易程度:中知识点所在章节:第十六章第三节18、下表给出我国从1949至1999年人口数据资料,试根据表中数据估计我国2004年的人口数。年份4954596469747984899499人口数/百万5426036727058079099751035110711771246对题中的数据进行检验解 参考程序(t18.m)x=49:5:99;Y=542 603 672 705 807 909 975 1035 1107 1177 1246;n=length(x);X=ones(n,1) x;b,bint,r,rint,stats=regress(Y,X);b,stats,rrcoplot(r,rint)%预测y=b(1)+b(2)*x;figure(2)plot(x,Y,r*,x,y,k)x0=104;y0= b(1)+b(2)*x0;结果:b = -180.5927 14.4527stats = 1.0e+003 * 0.0010
收藏
- 资源描述:
-
^`
‘牡丹江师范学院期末考试试题库
科目:数学模型与数学实验 年级:2006 学期:2008-2009-2 考核方式:开卷
命题教师:数学模型与数学实验课程组
一、解答题:(每小题30分)
1 、已知如下点列,求其回归直线方程,并计算最小误差平方和
x
0.1
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.2
0.21
0.23
y
42
43.5
45
45.5
45
47.5
49
53
50
55
55
60
参考程序(t1.m):
x=[0.1 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.2 0.21 0.23];
n=length(x)
X=[ones(n,1) x];
Y=[42 43.5 45 45.5 45 47.5 49 53 50 55 55 60];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
% 预测
y=b(1)+b(2)*x
%E误差平方和
E=sum((Y-y).^2)
参考结果:
回归直线:
误差平方和:17.4096
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
2、合金强度y与其中含碳量x有密切关系,如下表
x
0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.20
0.21
0.23
y
42.0
41.5
45.0
45.5
45.0
47.5
49.0
55.0
50.0
55.0
55.5
60.5
根据此表建立y(x)。并对结果作可信度进行检验、判断x对y影响是否显著、检查数据中有无异常点、由x的取值对y作出预测。
解:参考程序(t2.m):
x=[0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.2 0.21 0.23];
Y=[42.0 41.5 45.0 45.0 45 47.5 49.0 55.0 50.0 55.0 55.5 60.5];
scatter(x,Y);
n=length(x)
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%残差图
rcoplot(r,rint)
% 预测
y=b(1)+b(2)*x
%剔除异常点重新建模
X(8,:)=[];
Y(8)=[];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats,rcoplot(r,rint)
结果和图:
b =
27.0269
140.6194
bint =
22.3226 31.7313
111.7842 169.4546
stats =
0.9219 118.0670 0.0000
结果分析:由知,接近1,,,故对的影响显著,回归模型可用。
观察所得残差分布图,看到第8个数据的残差置信区间不含零点,此点视为异常点,剔除后重新计算。
此时键入:
X(8,:)=[];
Y(8)=[];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats,rcoplot(r,rint)
得:
b =
27.0992
137.8085
bint =
23.8563 30.3421
117.8534 157.7636
stats =
0.9644 244.0571 0.0000
可以看到:置信区间缩小;R2、F变大,所以应采用修改后的结果。所以,
建立的回归预测方程为:
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
3、将17至29岁的运动员每两岁一组分为7组,每组两人测量其旋转定向能力,以考察年龄(x)对这种运动能力(y)的影响。现得到一组数据如下表
年龄
17
19
21
23
25
27
29
第一人
20.48
25.13
26.15
30.0
26.1
20.3
19.35
第二人
24.35
28.11
26.3
31.4
26.92
25.7
21.3
试建立关系y(x),并作必要的统计分析。
解:方法1程序(见t3_1.m):
x=17:2:29;x=[x,x];
y=[20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3];
scatter(x,y);
figure(2)
%确定一元多项式回归系数
polytool(x,y,2)
点击图3-2中的export,全部选中点击ok,之后在命令窗口输入:
beta,y1,residuals
% beta回归系数,y1预测值,residuals残差
结果与图:
在x-y平面上画散点图(图2-1),直观地知道y与x大致为二次函数关系。
设模型为
图3-1 散点图
图3-2 交互图
窗口中绿线为拟合曲线、红线为y的置信区间、可通过移动鼠标的十字线或通过在窗口下方输入来设定x值,窗口左边则输出与x对应的y值及y的置信区间。通过左下方的Export下拉菜单可输出回归系数等。
beta =
-0.2003 8.9782 -72.2150
模型为:
方法2参考程序 (t3_2.m):
x=17:2:29;x=[x,x];
y=[20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3];
scatter(x,y);
[p,S]=polyfit(x,y,2)
方法2结果:
p =
-0.2003 8.9782 -72.2150
S =
R: [3x3 double]
df: 11
normr: 7.2162
模型为:
方法3程序(t3_3.m)
x=17:2:29;x=[x,x];
y=[20.48,25.13,26.15 30,26.1,20.3,19.35,24.35,28.11,26.3,31.4,26.92,25.7,21.3];
scatter(x,y);
X=[ones(14,1),x,(x.^2)]
[b,bint,r,rint,stats]=regress(y,X);
b,stats
方法3结果:
b =
-72.2150
8.9782
-0.2003
stats =
0.6980 12.7113 0.0014 4.7340
与方法1,2的结果一样
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
4、某厂生产的某产品的销售量与竞争对手的价格x1和本厂的价格x2有关。下表是该产品在10个城市的销售记录。
x1
120
140
190
130
155
175
125
145
180
150
x2
100
110
90
150
210
150
250
270
300
250
y(个)
102
100
120
77
46
93
26
69
65
85
试建立关系y(x1,x2),对结果进行检验。若某城市本厂产品售价160(元),对手售价170(元),预测此产品在该城市的销售量。
解:参考程序(t4.m):
%建立二元线性回归
x1=[120,140,190,130,155,175,125,145,180,150];
x2=[100,110,90,150,210,150,250,270,300,250];
y=[102,100,120,77,46,93,26,69,65,85];
x=[ones(10,1),x1,x2];
[b,bint,r,rint,stats]=regress(y,x);
b,bint,stats,
%%%%改进,建立二元多项式
x(:,1)=[];
rstool(x,y)
结果
这是一个多元回归问题。若设回归模型是线性的,即设用regress(y,x,alpha)求回归系数。得
b =
66.5176
0.4139
-0.2698
bint =
-32.5060 165.5411
-0.2018 1.0296
-0.4611 -0.0785
stats =
0.6527 6.5786 0.0247
p=0.0247,若显著水平取0,01,则模型不能用;=0.6527较小;的置信区间包含零点。因此结果不理想。于是设模型为二次函数。
此题设模型为纯二次函数:
对此例,在命令窗中键入
x(:,1)=[];
rstool(x,y,purequadratic)
得到交互式对话窗(图4-1):
图4-1 交互式对话窗
对于“本厂售价160,对手售价170,预测该市销售量”的问题,在下方窗口中分别输入160和170,就可在左方窗口中读到答案及其置信区间。
下拉菜单Export向工作窗输出数据具体操作为:
弹出菜单,选all,点击确定。此时可到工作窗中读取数据。可读数据包括:beta(回归系数) rmse(剩余标准差) residuals (残差)。本题只要键入
beta,rmse,residuals
注:可在图左下方的下拉菜单中选择其它模型:interaction, full quadratic
交叉二次回归模型 剩余标准差19.1626
完全二次回归模型 剩余标准差18.6064
纯二次回归模型 剩余标准差为16.6436
由于纯二次回归模型的剩余标准差最小,采用其建模并预测。
纯二次回归模型为:
剩余标准差为16.6436。
当,得销售量,置信区间[79.371-53.6392, 79.371+53.6392],即[25.7318,133.0102]
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
5、以家庭为单位,某种商品的月需求量与该商品价格之间的一组调查数据为
价格(元)
2
4
4
4.6
5
5.2
5.6
6
6.6
7
需求量(千克)
5
3.5
3
2.7
2.4
2.5
2
1.5
1.2
1.2
求回归直线,并进行残差分析
解:参考程序(t5.m)
x=[2 4 4 4.6 5 5.2 5.6 6 6.6 7];
n=length(x);
X=[ones(n,1) x];
Y=[5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2];
[b,bint,r,rint,stats]=regress(Y,X);
b, r, stats
rcoplot(r,rint)
figure(2)
z=b(1)+b(2)*x
plot(x,Y,k+,x,z,r)
结果与图:
b =
6.4383
-0.7877
stats =
0.9739 298.5240 0.0000
结果分析:由知,接近1,,,故对的影响显著,回归模型可用。
回归直线为:
残差分析:
图5-1残差图
由残差分析图5-1看出,残差置信区间均包含零点,无异常点。故,模型较好的符合原始数据。由图5-2也可以看出回归直线较好的拟合原始数据。
图5-2 拟合比较图
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
6、给出国家文教科学卫生事业费支出额ED(亿元)和国家财政收入额FI(亿元),作一元线性模型回归分析,并对所有结果作出分析评估。若2003年预期的国家财政收入为12050亿元,试求文教卫支出2003年的点预测值和区间预测值(部分数据为模拟数据)。
年份
ED
FI
年份
ED
FI
1991
708
3149
1998
1987
9320
1992
793
3483
1999
2021
9876
1993
958
4349
2000
2213
10356
1994
1278
5218
2001
2536
11589
1995
1467
6242
2002
2960
13010
1996
1704
7408
2003
14268
1997
1904
8651
解:参考程序(t6.m):
x=[3149 3483 4349 5218 6242 7408 8651 9320 9876 10356 11589 13010 14268 ];
Y=[708 793 958 1278 1467 1704 1904 1904 1987 2021 2213 2536 2960];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%残差图
rcoplot(r,rint)
%预测
y=b(1)+b(2)*x;
%点预测
x1=14268;
y1=b(1)+b(2)*x1
%区间预测
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta, y1+1.96*deta
结果:
b =
212.8152
0.1839
bint =
54.6098 371.0206
0.1662 0.2017
stats =
1.0e+004 *
0.0001 0.0522 0.0000 1.0136
y1 =
2.8372e+003
由统计检验量知,回归模型显著。
一元线性回归模型为:
2003年的点预测值为2837.2,预测区间.
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
7、为了研究某一化学反应过程中温度对产品得率的影响. 测得数据如下:
求y与x的线性回归方程,检验回归效果是否显著,并预测x=155度时产品得率的估值及预测区间(置信度95%).
解:参考程序(t7.m):
x=[100:10:190];
Y=[45 51 54 61 66 70 74 78 85 89];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%预测
y=b(1)+b(2)*x;
%点预测
x1=155;
y1=b(1)+b(2)*x1
%区间预测
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta, y1+1.96*deta
结果:
b =
-2.7394
0.4830
bint =
-6.3056 0.8268
0.4589 0.5072
stats =
1.0e+003 *
0.0010 2.1316 0.0000 0.0009
y1 =
72.1303
ans =
70.2678
ans =
73.9928
由统计检验量知,回归模型显著。
一元线性回归模型为:
时,产品得率为72.1303,置信度为的预测区间.
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
8、对某地区生产同一产品的8个不同规模的乡镇企业进行生产费用调查, 得产量x(万件)和生产费用Y (万元)的数据如下:
试据此建立Y关于x的回归方程,检验回归效果是否显著,并预测x=3.5时生产费用的估值及预测区间(置信度95%).
解:参考程序(t8.m):
x=[1.5 2 3 4.5 7.5 9.1 10.5 12];
Y=[5.6 6.6 7.2 7.8 10.1 10.8 13.5 16.5];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%预测
y=b(1)+b(2)*x;
%点预测
x1=3.5;
y1=b(1)+b(2)*x1
%区间预测
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta, y1+1.96*deta
结果:
b =
4.1575
0.8950
stats =
0.9376 90.1871 0.0001
y1 =
7.2900
ans =
5.3086
ans =
9.2714
由统计检验量知,回归效果显著。
一元线性回归模型为:
时,产品得率为7.2900,置信度为的预测区间.
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
9、以家庭为单位, 某种商品年需求量与该商品价格之间的一组调查数据如下表:
(1) 求经验回归方程;
(2) 检验线性关系的显著性().
解:参考程序:
x=[5 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5];
Y=[1 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,stats
%残差图
rcoplot(r,rint)
结果:
b =
4.4951
-0.8259
stats =
0.7443 23.2890 0.0013 0.2103
(1) 经验回归方程为:
(2) 由统计检验量知,线性关系不显著,模型不可用。
由残差图(图9-1)可以看出,第一数据的残差离零点的距离较远,且残差置信区间不包含零点,故第一个数据为异常点,应该剔除,重新建立线性回归模型。
图9-1 残差图
在命令窗口键入:
X(1,:)=[];
Y(1)=[];
[b,bint,r,rint,stats]=regress(Y,X);
b, stats
b =
6.1559
-1.4751
stats =
0.9476 126.6833 0.0000 0.0392
(1)经验回归方程为:
(2)由统计检验量知,回归模型显著,模型可用。
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
10、某建材实验室做陶粒混凝土实验室中, 考察每混凝土的水泥用量(kg)对混凝土抗压强度(kg/)的影响, 测得下列数据.
(1) 求经验回归方程;
(2) 检验一元线性回归的显著性();
(3) 设 求的预测值及置信度为0.95的预测区间.
解:参考程序(t10.m):
x=[150:10:260];
Y=[56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%预测
y=b(1)+b(2)*x;
%点预测
x1=225;
y1=b(1)+b(2)*x1
%区间预测
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta, y1+1.96*deta
结果:
b =
10.2829
0.3040
stats =
1.0e+003 *
0.0010 5.5225 0.0000 0.0002
y1 =
78.6797
ans =
77.7210
ans =
79.6385
(1),经验回归方程:
(2)由统计检验量知,回归模型显著。
(3)时,预测值为78.6797,置信度为的预测区间.
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
11、电容器充电达某电压值时为时间的计算原点, 此后电容器串联一电阻放电, 测定各时刻的电压u, 测量结果如下:
若u与t的关系为 其中未知, 求u对t的回归方程.
解:对原关系式取对数,得,令,得
程序(t11.m):
t=[0:1:10];
u=[100 75 55 40 30 20 15 10 10 5 5];
n=length(t);
Y=log(u);
x=t;
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
u0=exp(b(1));
c=-b(2);
%预测
u=u0*exp(-c*t);
结果:
b =
4.6130
-0.3126
stats =
0.9900 891.4418 0.0000
u0 =
100.7890
c =
0.3126
由统计检验量知,回归模型显著。
对t的回归方程:
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
12、考察温度对产量的影响,测得下列10组数据:
(1) 求经验回归方程;
(2) 检验回归的显著性();
(3) 求时产量y的预测值及置信度为0.95的预测区间.
解 参考程序(t12.m):
x=[20:5:65];
Y=[13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
%预测
y=b(1)+b(2)*x;
%点预测
x1=52;
y1=b(1)+b(2)*x1
%预测区间
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta, y1+1.96*deta
结果:
b =
9.1212
0.2230
stats =
0.9821 439.8311 0.0000 0.2333
y1 =
20.7188
ans =
19.7722
ans =
21.6654
(1)经验回归方程:
(2)当时,由知,回归显著。
(3)时,产量的预测值为20.7188,置信度为0.95的预测区间为[19.7722, 21.6654]
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
13、在某化工生产过程中,进入反应塔内某气体的百分比y与该气体的温度及气态压力有关,试验数据如下:
气温
78.0
113.5
154.0
169.0
187.0
206.0
214.0
气压
1.0
3.2
8.4
12.0
18.5
27.5
32.0
百分比y
1.5
6.0
20.0
30.0
50.0
80.0
100.0
求y关于及的二元线性回归方程.
解 参考程序(t13.m):
x1=[78 113.5 154 169 187 206 214];
x2=[1 3.2 8.4 12.0 18.5 27.5 32.0];
Y=[1.5 6.0 20.0 30 50 80 100];
n=length(x1);
X=[ones(n,1) x1,x2];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
结果:
b =
9.5617
-0.1423
3.7052
bint =
-3.4968 22.6203
-0.2648 -0.0198
3.1929 4.2176
stats =
1.0e+003 *
0.0010 1.1433 0.0000
由运行结果可以看出,回归系数均不包含零点,且检验统计量为知,回归模型显著。
因此,二元线性回归方程为:
是否重点:重点
难易程度:中
知识点所在章节:第二章第五节
14、某厂的产品15个地区销售,各地区人口数平均每户总收入等于有关资料如下表。试求销售量关于人数及每户总收入的回归方程。
销售量y(箱)
162
120
223
131
67
人口数 (千人)
274
180
375
205
86
每户总收入 (元)
2450
3254
3802
2838
2347
销售量y(箱)
116
55
252
232
144
人口数 (千人)
195
53
430
372
236
每户总收入 (元)
2137
2560
4020
4427
2660
销售量y(箱)
169
81
192
103
212
人口数 (千人)
265
98
330
157
370
每户总收入 (元)
3782
3008
2450
2088
2605
解 参考程序(t14.m):
x1=[274 180 375 205 86 195 53 430 372 236 265 98 330 157 370];
x2=[2450 3254 3802 2838 2347 2137 2560 4020 4427 2660 3782 3008 2450 2088 2605];
Y=[162 120 223 131 67 116 55 252 232 144 169 81 192 103 212];
n=length(x1);
X=[ones(n,1) x1,x2];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
结果:
b =
3.4526
0.4960
0.0092
bint =
-1.8433 8.7485
0.4828 0.5092
0.0071 0.0113
stats =
1.0e+003 *
0.0010 5.6795 0
由运行结果可以看出,回归系数均不包含零点,且检验统计量为知,回归模型显著。
因此,销售量关于人数及每户总收入的回归方程:
是否重点:重点
难易程度:中
知识点所在章节:第十六章第二节
15、炼纲过程中用来盛钢水的钢包,由于受钢水的浸蚀作用,容积会不断扩大。下表给出了使用次数和容积增大量的15对试验数据:
使用次数(xi)
增大容积(yi)
使用次数(xi)
增大容积(yi)
2
3
4
5
6
7
8
6.42
8.20
9.58
9.50
9.70
10.00
9.93
9
10
11
12
13
14
15
16
9.99
10.49
10.59
10.60
10.80
10.60
10.90
10.76
试求型回归方程。
解 参考程序(t15.m):
x=2:16;
y=[6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76];n=length(x);
u=1./x;
v=1./y;
X=[ones(n,1) u];
[b,bint,r,rint,stats]=regress(v,X);
b,bint,stats
%残差图
rcoplot(r,rint)
%预测及作图
yy=x./(b(1)*x+b(2));
plot(x,y,k+,x,yy,r)
结果:
b =
0.0823
0.1312
stats =
0.9379 196.2270 0.0000 0.0000
由知,回归方程显著,可用。
回归方程为:
图15-1 散点图和拟合曲线图
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
16、某种合成纤维的强度与其拉伸倍数有关。下表是24个纤维样品的强度与相应的拉伸倍数的实测记录。试求这两个变量间的经验公式。
编 号
1
2
3
4
5
6
7
8
9
10
11
12
拉伸倍数x
1.9
2.0
2.1
2.5
2.7
2.7
3.5
3.5
4.0
4.0
4.5
4.6
强度y (Mpa)
1.4
1.3
1.8
2.5
2.8
2.5
3.0
2.7
4.0
3.5
4.2
3.5
编 号
13
14
15
16
17
18
19
20
21
22
23
24
拉伸倍数x
5.0
5.2
6.0
6.3
6.5
7.1
8.0
8.0
8.9
9.0
9.5
10.0
强度y (Mpa)
5.5
5.0
5.5
6.4
6.0
5.3
6.5
7.0
8.5
8.0
8.1
8.1
(1) 求经验回归方程;
(2) 检验回归的显著性();
(3) 求时强度y的预测值及置信度为0.95的预测区间.
解 参考程序(t16.m)
x=[1.9 2.0 2.1 2.5 2.7 2.7 3.5 3.5 4.0 4.0 4.5 4.6...
5 5.2 6 6.3 6.5 7.1 8 8 8.9 9 9.5 10];
Y=[1.4 1.3 1.8 2.5 2.8 2.5 3.0 2.7 4 3.5 4.2 3.5 5,...
5.2 6 6.3 6.5 7.1 8 8 8.9 9 9.5 10];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,stats
%预测
y=b(1)+b(2)*x;
%点预测
x1=7.5;
y1=b(1)+b(2)*x1
%区间预测
deta=sqrt(sum((Y-y).^2)/(n-2));
y1-1.96*deta,y1+1.96deta
结果:
b =
-0.5241
1.0610
stats =
1.0e+003 *
0.0010 2.1030 0 0.0001
y1 =
7.4335
ans =
6.8739
ans =
7.9930
(1)经验回归方程:
(2)当时,由知,回归方程显著。
(3)时,强度=7.4335,置信度为0.95的预测区间为[6.8739,7.9930]
是否重点:重点
难易程度:中
知识点所在章节:第十六章第一节
17、给10只大鼠注射内霉素(30mg/kg)后,测得每只大鼠红细胞含量x与血红蛋白含量y如下所示,是对x和y进行回归分析。
x: 654 786 667 605 761 642 652 706 602 539
y: 130 168 143 130 158 129 151 153 151 109
解 参考程序(t17.m)
直接建立线性回归模型程序:
x=[654 768 667 605 761 642 652 706 602 539];
Y=[130 168 143 130 158 129 151 153 151 109];
scatter(x,Y)
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,stats
rcopolt(r,rint)
得:
stats =
0.6890 17.7240 0.0030 107.3550
图17-1 残差图
由统计检验量stats知,所建立的线性回归模型可用,但是效果并不理想。
由残差图(图17-1)看出有异常点,所以应该剔除,重新建立模型。
剔除异常点建立模型程序(t17.m):
X(9,:)=[];
Y(9)=[];
X(7,:)=[];
Y(7)=[];
[b,bint,r,rint,stats]=regress(Y,X);
b,stats
rcoplot(r,rint)
运行得:
b =
-15.9879
0.2361
stats =
0.8704 47.0246 0.0002 49.5248
两次比较,剔除异常点后的值有所增加,=0.8704也较接近1。
故回归方程为:
是否重点:重点
难易程度:中
知识点所在章节:第十六章第三节
18、下表给出我国从1949至1999年人口数据资料,试根据表中数据估计我国2004年的人口数。
年份
49
54
59
64
69
74
79
84
89
94
99
人口数/百万
542
603
672
705
807
909
975
1035
1107
1177
1246
对题中的数据进行检验
解 参考程序(t18.m)
x=[49:5:99];
Y=[542 603 672 705 807 909 975 1035 1107 1177 1246];
n=length(x);
X=[ones(n,1) x];
[b,bint,r,rint,stats]=regress(Y,X);
b,stats,r
rcoplot(r,rint)
%预测
y=b(1)+b(2)*x;
figure(2)
plot(x,Y,’r*’,x,y,’k’)
x0=104;
y0= b(1)+b(2)*x0;
结果:
b =
-180.5927
14.4527
stats =
1.0e+003 *
0.0010
展开阅读全文