实验13_回归分析.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《实验13_回归分析.pdf》由会员分享,可在线阅读,更多相关《实验13_回归分析.pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学实验 回归分析 化工系 分 0 毕啸天 2010011811 1 实验 13 回归分析 化工系 分 0 毕啸天 2010011811【实验目的】1.了解回归分析的基本原理,掌握 MATLAB 实现的方法;2.练习用回归分析解决实际问题。【实验内容】题目一 用切削机床加工时,为实时地调整机床需测定刀具的磨损程度,每隔一小时测量刀具的厚度得到以下的数据(见下表),建立刀具厚度对于切削时间的回归模型,对模型和回归系数进行检验,并预测 7.5h 和 15h 后刀具的厚度,用(30)和(31)式两种办法计算预测区间,解释计算结果。时间/h 0 1 2 3 4 5 6 7 8 9 10 刀具厚度/cm
2、 30.6 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 1.1 模型分析 此题是一个给出数据,确定回归并预测结果的基础题目。可以首先作图观察二者的走势。x1=0:10;y=30.6 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5;plot(x1,y,*)xlabel(时间/h)ylabel(刀具厚度/cm)title(时间与刀具厚度的关系)01234567891026.52727.52828.52929.53030.531时 间/h刀具厚度/cm时 间 与 刀 具 厚 度 散 点 图数学
3、实验 回归分析 化工系 分 0 毕啸天 2010011811 2 由上图可以看出,除了最初几个点偏离较大,刀具厚度 y 与时间 x 大致为线性关系。因此确定回归模型为:xy10 1.2 程序代码 n=11;X=ones(n,1),x1;b,bint,r,rint,s=regress(y,X);rcoplot(r,rint)输出结果如下:b=29.545 -0.32909 bint=28.977 30.114 -0.4252 -0.23298 r=1.0545 -0.11636 -0.48727 -0.45818 -0.22909 -0.2 -0.070909 -0.041818 0.08727
4、3 0.21636 0.24545 rint=0.79381 1.3153 -1.046 0.81326 -1.3782 0.40364 -1.3873 0.47094 -1.2267 0.76848 -1.2067 0.80674 -1.0836 0.94177 -1.04 0.9564 -0.88264 1.0572 -0.70174 1.1345 -0.61524 1.1062 s=0.86957 60.002 2.8614e-005 0.19855 数学实验 回归分析 化工系 分 0 毕啸天 2010011811 3 回归结果整理成表格如下:回归系数 回归系数估计值 回归系数置信区间
5、0 29.545 28.977,30.114 1-0.32909-0.4252,-0.23298 2=0.86957,F=60.002,p=2.8614e-005,2=0.19855 从这个拟合结果看,p 值十分接近 0;finv(0.95,1,9)=5.1174,小于 F=60.002;置信区间不包含零点。故而回归模型完全成立。但是2=0.86957,实际上拟合精度一般。从残差及其置信区间图上可以明显看出问题所在。在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为 0 的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度
6、带来不利影响,应予以剔除。1.3 剔除后计算 x1=1:10;y=29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5;n=10 X=ones(n,1),x1;b,bint,r,rint,s=regress(y,X);rcoplot(r,rint)输出结果表示如下:回归系数 回归系数估计值 回归系数置信区间 0 29.053 28.833,29.273 1-0.25879-0.29423,-0.22335 2=0.97256,F=283.56,p=1.5672e-007,2=0.019485 1234567891011-1-0.500.51Resi
7、dual Case Order PlotResidualsCase Number数学实验 回归分析 化工系 分 0 毕啸天 2010011811 4 此回归结果已经明显优于上者,但是作出残差图则会发现又有了新的问题。剔除后计算,仍然发现了第二个残差的置信区间也不包括零点,仍该视为异常点。应剔除再次计算。1.4 再次剔除计算 直接输出计算结果如下:回归系数 回归系数估计值 回归系数置信区间 0 28.867 28.78,28.954 1-0.23333-0.24666,-0.22001 2=0.99593,F=1715,p=1.2484e-009,2=0.0019048 12345678910-
8、0.4-0.3-0.2-0.100.10.20.3Residual Case Order PlotResidualsCase Number123456789-0.1-0.0500.050.1Residual Case Order PlotResidualsCase Number数学实验 回归分析 化工系 分 0 毕啸天 2010011811 5 当再次剔除异常数据后,残差置信区间全部覆盖了零点。而且相比之前,置信度进一步提高,F 检验值变大,置信区间缩小,精度提高。显然,异常点的剔除有利于更好的建立合理的模型。此时可以说,效果比较好的回归模型是 xy23333.0867.28 1.5 作图观察
9、 x1=0:10;y=30.6 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5;t=0:0.1:10;y1=b(1)+b(2).*t;plot(x1,y,*,t,y1)已经得到了回归公式,则预测 7.5h 与 15h 后的刀具厚度可直接代入回归直线计算:y3=b(1)+b(2)*7.5;y4=b(1)+b(2)*15;得到结果如下:y3=27.117 y4=25.367 即 7.5h 后,预测刀具磨损后的厚度 27.117cm,15h 后为 25.367cm。01234567891026.52727.52828.52929.53030.531
10、数学实验 回归分析 化工系 分 0 毕啸天 2010011811 6 【本题小结】本题虽然比较简单,但是其中体现了许多基本的原理。首先是模型的建立,作出散点图后可以大致观察数据的走向。可以看出,后期的点的走势呈现明显的线性递减,但是最初的几个点厚度偏大,不在直线上。因此可以预计,剔除前面几个点,此后的刀具厚度走向可以用线性函数来拟合,即磨损速度是一个定值。其次是模型有效性的检验。检验一个模型主要有如下几个指标:拟合变量的置信区间应当不含零点,否则此时没有显著证据证明真实的不为0,应修改模型;p值应小于,此时可以拒绝原假设,认为的回归是合理的;F检验临界值大于F分布的理论值。这三条决定了是否应该
11、拒绝原假设,即回归模型是否成立。从以上可以得到一个结论,即异常点的存在并不能从根本上动摇和改变合理的模型,而不合理的模型也不会通过几个异常点的剔除就变得合理。R2应当接近1,这说明拟合的精度高,它表明回归结果有多少把握预测实际情况。残差置信区间的显著性水平和模型检验的显著性水平并没有关系,它们是相互独立的。这也表明不能剔除不合理点来使不合理模型变合理。本题中先发现一个异常点,剔除后计算又发现了一个异常点,再剔除后计算则得到满意的结果。最初的散点图上可以明显看出前两个点都不在后面点所确定的直线上。在第一次回归计算时,拟合效果不好,置信区间较大,勉强将第二个点包括在了里面。而剔除了第一个点后,第二
12、个点的异常性就暴露出来,因为此时的置信区间变小了。而剔除第二个点后,置信区间变得更小,模型有效性大大提高。从实际生产中看,可能是最初刀具还没有稳定工作,导致开始大幅度磨损,稳定后,磨损速度恒定,变成一个线性模型。题目二 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入 96 90 95 92 95 95 94 94 电视广告费用 1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5 报纸广告费用 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0 2.1 模型分析 本题研究电视广告
13、费用与报纸广告费用对电影收入的影响。首先显然这二者均对电影收入有促进作用,否则没必要做广告;其次,二者对收入的影响程度不同,通常来说电视的广告效果会更明显。我们首先尝试线性回归,由 R2值判断回归模型是否合理。如果不合理,再采取其他方法进行回归分析。设电视广告费用为 x1,报纸广告费用为 x2,每周电影院收入为 y。建立如下模型:22110 xxy 2.2 程序代码 y=96,90,95,92,95,95,94,94;x1=1.5,2,1.5,2.5,3.3,2.3,4.2,2.5;x2=5,2,4,2.5,3,3.5,2.5,3;n=8;数学实验 回归分析 化工系 分 0 毕啸天 20100
14、11811 7 m=2;X=ones(8,1),x1,x2;b,bint,r,rint,s=regress(y,X)输出结果如下:b=83.212 1.2985 2.3372 bint=78.806 87.617 0.4007 2.1962 1.486 3.1883 r=-0.8451 -0.48285 0.49206 -0.30066 0.49199 0.62187 -0.50805 0.53076 rint=-1.3972 -0.29297 -1.5076 0.54186 -1.0654 2.0495 -2.0268 1.4254 -1.1162 2.1002 -1.0631 2.3068
15、 -1.4814 0.46533 -1.2146 2.2761 s=0.90889 24.941 0.0025053 0.48969 整理成表格如下:回归系数 回归系数估计值 回归系数置信区间 0 83.2116 78.8058,87.6174 1 1.2985 0.4007,2.1962 2 2.3372 1.486,3.1883 2=0.9089,F=24.9408,p=0.0025,2=0.4897 数学实验 回归分析 化工系 分 0 毕啸天 2010011811 8 在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为 0 的正态分布,可以认为这个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 13 回归 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内