2022年数据分析试题 .pdf
《2022年数据分析试题 .pdf》由会员分享,可在线阅读,更多相关《2022年数据分析试题 .pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、上海第二工业大学(试卷编号:)20112012 学年第二学期数据分析期末考试卷A 卷姓名: 王赞学号: 094860117 班级: 09 计算 A1 题 号一二三得 分一、某医院管理工作者希望了解病人对医院工作的满意程度Y和病人的年龄1X 、病情的严重程度2X 和忧虑程度3X 之间的关系,他们随机选取了23 位病人,得到下表所列数据:(本题 40 分,每小题 5 分)i1 2 3 4 5 6 7 8 9 10 11 12 1ix50 36 40 41 28 49 42 45 52 29 29 43 2ix51 46 48 44 43 54 50 48 62 50 48 53 3ix2.3 2.
2、3 2.2 1.8 1.8 2.9 2.2 2.4 2.9 2.1 2.4 2.4 iy48 57 66 89 89 36 46 54 26 77 89 67 i13 14 15 16 17 18 19 20 21 22 23 1ix38 34 53 36 33 29 33 55 29 44 43 2ix55 51 54 49 56 46 49 51 52 58 50 3ix2.2 2.3 2.2 2.0 2.5 1.9 2.1 2.4 2.3 2.9 2.3 iy47 51 57 66 79 88 60 49 77 52 60 (1) 拟合Y关于123,XXX 的线性回归模型,写出回归方程;
3、根据所得的回归模型中回归系数给出初步的分析结果;Anovab模型平方和df 均方F Sig. 1 回归4472.725 3 1490.908 12.072 .000a残差2346.579 19 123.504 总计6819.304 22 a. 预测变量 : (常量 ), Xi3, Xi1, XI2。b. 因变量 : Yi 表一精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 17 页系数a模型非标准化系数标准系数t Sig. B 标准 误差试用版1 ( 常量 ) 177.445 27.839 6.374 .000 Xi1 -1.069 .
4、326 -.514 -3.284 .004 XI2 -.839 .887 -.212 -.947 .356 Xi3 -13.193 13.221 -.228 -.998 .331 a. 因变量 : Yi 表二由方差分析看出: F 统计量的值为 12.072,根据 p 值检验法知 F 检验的 p值显然小于 0.0001,因此拒绝原假设, 接受对立假设, 即因变量与 3 个自变量之间具有高度显著的线性回归关系。由表二可以看出, 如果显著水平为 0.05,而t 检验的 3 个 p 值分别为 0.004、0356、0.331 显然小于显著水平,因此拒绝原假设,接受对立假设,则说明因变量和XI1 存在着
5、高度显著的线性回归关系,与XI2、XI3 没有显著的线性关系。并且得到回归方程为:Yi=177.455-1.069Xi1。其意义是在 Xi1 每增加一个单位,则Y减少 1.069 个单位。(2) 、设误差项(1,2,16)ii独立同分布于2(0,)N,在=0.01 水平上检验回归关系的显著性; ( 写出原假设、对立假设和检验统计量) 解:由表 1 可以看出 SSR为 4472.725,SSE为 2346.579,SST为 6619.304;设 y 与 X1, X2, X3的观测值之间满足关系iiiixxy22110( i=1, 218)其中i( i=1,218)相互独立,均服从正态分布 N(0
6、,2) ,利用 SPSS可得到下列分析结果。由此表可知,2的估计值2=MSE=123.504,MSR=1490.908 检验假设:H0:0321H1:321,至少有一个非零的, 统计量 F=MSEMSR=12.072 检验值 P从表看几乎接近于零 0.6)和从变量的相关系数矩阵可以看出,各变量间的相关性很高, 因此变量间所表示的信息量有交叉部分,因此可以进行因子分析。(5) 取公共因子数为 1 时,对123,x x x 进行因子分析, 并进行解释;对公共因子1F得分从小到大进行排序,并进行分析解释。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1
7、0 页,共 17 页公因子方差初始提取qtjm 1.000 .989 ncjm 1.000 .979 czjm 1.000 .977 提取方法:主成份分析。选取一个因子,从上表可以看出因子可以解释qtim,ncjm,czjm,因此本因子的提取效果是理想的(6) 取公共因子数为 2 时,采用方差最大正交旋转进行因子分析,对公共因子1F得分从小到大进行排序。再对公共因子12,F F 进行解释。旋转成份矩阵a成份1 2 qtjm .715 .692 ncjm .798 .600 czjm .604 .796 提取方法 : 主成份。旋转法 : 具有 Kaiser 标准化的正交旋转法。a. 旋转在 3
8、次迭代后收敛。因子一只要解释 qtjm,ncjm,因子二主要解释 czjm。(7) 根据第 (5)(6) 小题的结果分析哪种取法更加合理?为什么?解: (5)的方法更合理,因为一个因子就可以解释所有变量了。(8) 简单说明因子分析中采用正交旋转的目的是什么?解: 为了使一部分变量仅与第一个因子相关,另一部分变量与第二个因子相关。三、各地区历年电力消费量见附件中数据文件dlxf.sav(单位:亿千瓦小时 );变量16XX 分别代表 2000 年、20XX 年、20XX 年、20XX 年、20XX 年、20XX年的电力消费: (本大题共 20分,每小题 4 分) (1) 选择三种不同的谱系聚类法聚
9、类,并给出这三种方法分3 类的结果;1、采用最长距离:群集成员精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 17 页案例3 群集1: 北京1 2: 天津1 3: 河北2 4: 山西1 5: 内蒙古1 6: 辽宁2 7: 吉林1 8: 黑龙江1 9: 上海1 10: 江苏3 11: 浙江2 12: 安徽1 13: 福建1 14: 江西1 15: 山东3 16: 河南2 17: 湖北1 18: 湖南1 19: 广东3 20: 广西1 21: 海南1 22: 重庆1 23: 四川1 24: 贵州1 25: 云南1 26: 陕西1 27:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年数据分析试题 2022 数据 分析 试题
限制150内