多元统计分析上机作业 .doc





《多元统计分析上机作业 .doc》由会员分享,可在线阅读,更多相关《多元统计分析上机作业 .doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、指标的原始数据取自中国统计年鉴,1995和中国教育统计年鉴,1995除以各地区相应的人口数得到十项指标值见表1。其中::为每百万人口高等院校数;:为每十万人口高等院校毕业生数;:为每十万人口高等院校招生数;:为每十万人口高等院校在校生数; :为每十万人口高等院校教职工数;:为每十万人口高等院校专职教师数;:为高级职称占专职教师的比例; :为平均每所高等院校的在校生数;:为国家财政预算内普通高教经费占国内生产总值的比重;:为生均教育经费。表1 我国各地区普通高等教育发展状况数据地区 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 北京 5.96 310 461 1557 931 3
2、19 44.36 2615 2.20 13631 上海 3.39 234 308 1035 498 161 35.02 3052 .90 12665 天津 2.35 157 229 713 295 109 38.40 3031 .86 9385 陕西 1.35 81 111 364 150 58 30.45 2699 1.22 7881 辽宁 1.50 88 128 421 144 58 34.30 2808 .54 7733 吉林 1.67 86 120 370 153 58 33.53 2215 .76 7480 黑龙江 1.17 63 93 296 117 44 35.22 2528 .
3、58 8570 湖北 1.05 67 92 297 115 43 32.89 2835 .66 7262 江苏 .95 64 94 287 102 39 31.54 3008 .39 7786 广东 .69 39 71 205 61 24 34.50 2988 .37 11355 四川 .56 40 57 177 61 23 32.62 3149 .55 7693 山东 .57 58 64 181 57 22 32.95 3202 .28 6805 甘肃 .71 42 62 190 66 26 28.13 2657 .73 7282 湖南 .74 42 61 194 61 24 33.06 2
4、618 .47 6477 浙江 .86 42 71 204 66 26 29.94 2363 .25 7704 新疆 1.29 47 73 265 114 46 25.93 2060 .37 5719 福建 1.04 53 71 218 63 26 29.01 2099 .29 7106 山西 .85 53 65 218 76 30 25.63 2555 .43 5580 河北 .81 43 66 188 61 23 29.82 2313 .31 5704 安徽 .59 35 47 146 46 20 32.83 2488 .33 5628 云南 .66 36 40 130 44 19 28.
5、55 1974 .48 9106 江西 .77 43 63 194 67 23 28.81 2515 .34 4085 海南 .70 33 51 165 47 18 27.34 2344 .28 7928 内蒙古 .84 43 48 171 65 29 27.65 2032 .32 5581 西藏 1.69 26 45 137 75 33 12.10 810 1.00 14199 河南 .55 32 46 130 44 17 28.41 2341 .30 5714 广西 .60 28 43 129 39 17 31.93 2146 .24 5139 宁夏 1.39 48 62 208 77 3
6、4 22.70 1500 .42 5377 贵州 .64 23 32 93 37 16 28.12 1469 .34 5415 青海 1.48 38 46 151 63 30 17.87 1024 .38 7368根据上面数据回答以下问题: (一) 计算10个变量的相关系数矩阵,并找出相关性最强的5组变量;1. 利用SPSS软件,依次选中Analysis-correlate-bivariable,得结果整理得2.其中:变量最强的5组变量:和,和 ,和,和及和。 注:SPSS运行结果见附件(一)(二) 对上面数据进行主成分分析,要求写出:a)方差分解表(特征值,累积贡献率);解答:b)要求累积贡
7、献率大于等于85%,选取主成分个数,并用原始的10个变量表示每个主成分;解答:n=2时,贡献率达到90.791%;原始的10个变量表示每个主成分和:c)计算每个省份相应的主成分值,并对主成分值进行标准化。【注:SPSS运行结果见附录二】 北京上海 天津 陕西 辽宁 吉林 黑龙江 湖北 江苏 广东 11.70 5.94 3.50 1.01 0.83 0.80 0.24 0.12 -0.16 -0.31 -0.89 0.10 1.03 0.03 0.88 -0.02 0.58 0.85 1.02 0.93 四川 山东 甘肃 湖南 浙江 新疆 福建 山西 河北 安徽 -0.70 -0.86 -0.7
8、4 -0.86 -0.98 -0.82 -0.96 -1.07 -1.22 -1.35 1.29 1.64 0.20 0.85 0.19 -0.51 -0.190.150.330.87云南江西海南内蒙古西藏河南广西宁夏贵州青海-1.18-1.36-1.35-1.40-0.67-1.64-1.68-1.27-1.97-1.60-0.650.65-0.10-0.23 -4.72 0.27 0.47 -1.48 -0.80 -2.75 (三) 利用2)中的标准化后主成分值对30个省市进行聚类分析,要求,a)分别用系统聚类和快速聚类把30个省市分成3类,并比较这两种聚类结果异同(系统聚类给出你选择的聚
9、类方法及谱系图)RescaledDistanceClusterCombineCASE0510152025LabelNum+-+-+-+-+-+151819132324161721262720221411129107846528293025231聚类情况:第一类:北京 第二类:上海、天津 第三类:其他Cluster MembershipCluster MembershipCase NumberCase NumberClusterDistanceCase NumberCluster11.000163.498221.307173.255321.307183.324431.795193.551531.
10、8432031.046631.585213.757731.181223.871831.247233.574931.199243.6541031.0552534.7091131.305263.9021231.6472731.020133.2092831.546143.8672931.428153.2763032.860快速聚类法:Initial Cluster CentersCluster123VAR0001211.705.94-.67VAR00013-.89.10-4.72Iteration HistoryaIterationChange in Cluster Centers1231.0003
11、.1474.6772.000.674.0763.0001.249.0694.000.000.000a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is .000. The current iteration is 4. The minimum distance between initial centers is 5.843.(四) 利用3)中快速聚类的结果及2)标准化后主成分值进行判别分析,要求
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析上机作业 多元 统计分析 上机 作业

限制150内