《数据分析方法》课程设计报告.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《数据分析方法》课程设计报告.docx》由会员分享,可在线阅读,更多相关《《数据分析方法》课程设计报告.docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析方法课程设计报告 数据分析方法课程设计报告 数据分析方法课程实验报告 1.实验内容 (1)掌握回归分析的思想和计算步骤; (2) 编写程序完成回归分析的计算,包括后续的显著性检验、残差分析、Box-Cox 变换等内容。 2. 模型建立与求解(数据结构与算法描述) 3.实验数据与实验结果 解:根据所建立的模型在MATLAB 中输入程序(程序见附录)得到以下结果: (1)回归方程为:123.45260.49600.0092Y X X =+ 说明该化妆品的消量和该城市人群收入情况关系不大,轻微影响,与使用该化妆品的人数有关。 2的无偏估计:2 4.7403= (2)方差分析表如下表: 方差来
2、源 自由度 平方和 均方 F 值 p 回归(R ) 2 53845 26922 56795 2.28 误差(E ) 12 56.883 4.703 总和(T ) 14 53902 从分析表中可以看出:F 值远大于p 的值。所以回归关系显著。 复相关20.9989R =,所以回归效果显著。 解:根据所建立的模型,在MATLAB 中输入程序(程序见附录)得到如下结果: (1)回归方程为:1257.9877 4.70820.3393Y X X =-+ 在MTLAB 中计算学生化残差(见程序清单二),所得到的学生化残差r 的值由残差可知得到的r 的值在(-1,1)的概率为0.645,在(-1.5,1.
3、5)的概率为0.871,在(-2,2)之间的概率为0.968. 而服从正态分布的随机变量取值在(-1,1)之间的概率为0.68,在(-1.5,1.5)之间的概率为0.87,在(-2.2)之间的概率为0.95,所以相差较大,所以残差分析不合理,需要对数据变换。 取=0.6进行Box-Cox 变换() ln ,01 ,0Y Y Y =? =?-? ? 在MATLAB 中输入程序(见程序代码清单二) 取0.6=,所以得到r 的值(r 的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为: 0-11.7736=1 1.1478=20.0969= 拟合函
4、数为:12-11.7736 1.14780.0969Y X X =+ 通过F 值,R 值可以检验到,回归效果显著 (3)某医院为了了解病人对医院工作的满意程度Y 和病人的年龄1X ,病情的严重程度2X 和病人的忧虑程度3X 之间的关系,随机调查了该医院的23位病人,得数据如下表: (1) 拟合线性回归模型0112233Y X X X =+,通过残差分析与考察 模型及有关误差分布正态性假定的合理性; (2) 若(1)中模型合理,分别在2 ()()i R p ,()p ii C ,()p iii PRESS 准则下选择最优回归方程,各准则下的选择结果是否一致? (3) 对0.10E D =,用逐步
5、回归法选择最优回归方程,其结果和(2)中的 数否一致? (4) 对选择的最优回归方程作残差分析,与(1)中的相应结果比较,有何变 化? 习题2.6 解:(1)回归参数的的最小二乘估计为:1()T T X X X Y -=。 在MATLAB 中输入程序(见程序代码清单二)可得: 0-57.9877=,1 4.7082=,2 0.3393= 所以回归方程为: 1257.9877 4.70820.3393Y X X =-+ 对数据做Box-Cox 变换,(由于的取值在能力范围不好确定,所以经测试,取=0.6进行Box-Cox 变换() ln ,01 ,0Y Y Y =? =?-? ? 在MATLAB
6、 中输入程序(见程序代码清单二) 取0.6=,所以得到r 的值(r 的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为: 0-11.7736=1 1.1478=20.0969= 拟合函数为:12-11.7736 1.14780.0969Y X X =+ 通过F 值,R 值可以检验到,回归效果显著 习题2.9 解:根据所建立的模型,在MATLAB 中输入程序,得到以下结果: (1) 所得到的回归方程为:123162.8759 1.21030.66598.610Y X X X =- (2) 所得到的学生化残差见附录,通过对残差的分析,很明显不符合
7、正态分布所以(1)中所建立的模型不合理。 4程序代码清单: 习题2.4 x=1 274 2450 1 180 3254 1 375 3802 1 205 2838 1 86 2347 1 265 3782 1 98 3008 1 330 2450 1 195 2137 1 53 2560 1 430 4020 1 372 4427 1 236 2660 1 157 2088 1 370 2605; y=162 120 223 131 67 169 81 192 116 55 252 232 144 103 212; n=15;p=3 b=inv(x*x)*x*y h=x*inv(x*x)*x;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据分析方法 数据 分析 方法 课程设计 报告
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内