统计专业实验-实验7-因子分析和综合评价(共8页).doc
-
资源ID:11331986
资源大小:235KB
全文页数:8页
- 资源格式: DOC
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
统计专业实验-实验7-因子分析和综合评价(共8页).doc
精选优质文档-倾情为你奉上重庆工商大学数学与统计学院统计专业实验课程实验报告 实验课程: 统计专业实验 指导教师: _叶勇 专业班级: 09级统计二班 学生姓名: _陈文慧 学生学号: _ 实 验 报 告实验项目实验七 因子分析和综合评价实验日期2012.04.24实验地点80608实验目的了解因子分析的原理,并掌握因子分析和综合评价过程。实验内容对2008年重庆市40个区县经济发展基本情况进行分析,选择合适的分析变量,找出影响地区社会经济发展水平的主要因子,并对各地区发展水平进行综合评价或者对各地区经济发展状况进行分类。实验思考题解答:1分析因子分析和主成分分析的异同,并写出各自的数学表达式。答:因子分析和主成分分析有许多相似之处,但这两种模型又存在明显的不同。两者均是降维、简化数据的分析方法。主成分分析:它的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的角度,突出数据的变异方向,归纳重要信息。数学表达式:因子分析:从本质上看是从显在变量去“提炼”潜在因子的过程。通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。数学表达式:2变量共同度和公因子的方差贡献率的数学形式?变量共同度:,即第行因子载荷的平方和,它描述的是全部公共因子对变量的总方差所做的贡献,反映了公共因子对变量的影响程度。公因子的方差贡献率:,即第列的因子载荷的平方和,表示同一公共因子对各个变量所提供的方差贡献之和,它是衡量每一个公共因子相对重要性的一个尺度。实验运行程序、基本步骤及运行结果:1. 选择合适的分析变量本实验是对2008年重庆市40个区县经济发展基本情况进行分析,分别从经济实力、工业化水平、经济潜在活力和效益三个层面对经济发展水平进行分析。选取了10个指标:X1X2X3X4X5X6X7X8X9X10地区生产总值(万元)一 般预算收入(万元)农林牧渔业总产值(万元)工业总产值(万元)建筑业总产值(万元)全社会固定资产投资(万元)社会消费品零售总额(万元)城乡居民储蓄公路货运量(万吨)城镇就业人员(万人)2.进行因子分析(1)选择AnalyzeData ReductionFactor,打开Factor Analysis主界面,并将变量X1X8,移入Variables框中;(2)点击Descriptives按钮,选Coefficients复选框,输出相关系数;选中KMO and Bartletts test of sphericity复选框,检验因子分析的适用条件;按Continue按钮返回主界面。(3)点Extraction按钮,设置因子提取的选项。选Scree Plot复选框,输出碎石图,按Continue按钮返回主界面。(4)点Rotation按钮,设置因子旋转方法。选Varimax复选框,选择方差最大化旋转方法,按Continue按钮返回主界面。(5)单击Scores按钮,设置因子得分的选项。选Display factor score coefficient matrix 显示因子得分函数系数矩阵,选Save as variable,保存因子得分,按Continue按钮返回主界面。(6)点OK按钮开始因子分析过程。得到的数据结果如下:相关系数矩阵:由相关系数矩阵看出各个变量之间存在较强的相关性,所以可以采用因子分析方法进行降维。Correlation MatrixX1X2X3X4X5X6X7X8X9X10CorrelationX11.000.815.090.805.929.809.896.940.535.932X2.8151.000-.128.715.779.836.862.840.508.804X3.090-.1281.000-.097.047.085-.149-.016.049-.030X4.805.715-.0971.000.804.831.612.659.531.721X5.929.779.047.8041.000.835.838.874.461.911X6.809.836.085.831.8351.000.699.744.605.764X7.896.862-.149.612.838.6991.000.970.416.913X8.940.840-.016.659.874.744.9701.000.448.939X9.535.508.049.531.461.605.416.4481.000.484X10.932.804-.030.721.911.764.913.939.4841.000KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.821Bartlett's Test of SphericityApprox. Chi-Square568.556df45Sig.000变量共同度:可以看到变量共同度都很高,表面因子对变量的影响程度高。CommunalitiesInitialExtractionX11.000.945X21.000.832X31.000.937X41.000.699X51.000.889X61.000.819X71.000.879X81.000.889X91.000.410X101.000.897特征根与方差贡献率:有两个因子的特征值超过1,且前两个的累积方差贡献率已经超过了百分之八十,因此应该提取两个因子。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %17.10771.07471.0747.10771.07471.0747.10771.07171.07121.08810.88581.9591.08810.88581.9591.08910.88881.9593.7927.92089.8794.4664.65794.5365.2792.79297.3286.1161.15898.4867.060.60299.0888.060.59899.6869.017.16899.85410.015.146100.000因子载荷矩阵本实验中旋转前后得到的因子载荷阵中个系数都有明显的两极分化。第一个公共因子在指标上有较大载荷,说明这个9个指标有较强的相关性,可归为一类,他们都属于衡量经济发展水平的正向指标。第二个公共因子在上有较大载荷,单独一类。农业产值随经济发展水平的提高,会减少,它属于逆向指标。Component MatrixaComponent12X1.968.092X2.902-.133X3-.023.968X4.836-.010X5.941.060X6.891.159X7.916-.199X8.941-.056X9.598.229X10.946-.041Rotated Component MatrixaComponent12X1.968.086X2.901-.139X3-.016.968X4.836-.015X5.941.053X6.892.153X7.915-.205X8.941-.063X9.599.225X10.946-.048因子转换矩阵:若用表示旋转前的因子载荷阵,用表示因子转换矩阵,用表示旋转后的因子载荷阵,则有:Component Transformation MatrixComponent1211.000-.0072.0071.000因子得分系数矩阵:根据每个观测值的各因子的的分数,可以将旋转后的因子得分表达式写成:Component Score Coefficient MatrixComponent12X1.137.084X2.126-.123X3.003.889X4.118-.010X5.133.054X6.126.146X7.128-.183X8.132-.053X9.086.210X10.133-.039(7)分析各公因子的含义,并进行命名。:非农业因子(反映的是除农业以外的正向经济指标):农业因子(反映的是农业总产值经指标)(8)使用Compute命令计算综合因子得分,以特征值为各公因子的权数。刚刚已经将因子得分作为新变量保存在数据文件中,变量名分别为fact_1、fact_2,现在可以直接使用。Transform->Compute Variables,调出计算界面,目标变量命名为“综合因子得分”,将上面的公式带入,计算得到各个区县的综合得分。对分数进行排序,得到最终结果如下:区县因子1得分因子2得分综合得分排序区县因子1得分因子2得分综合得分排序渝北区2.294 0.619 2.071 1大足县-0.446 0.577 -0.310 21九龙坡区2.428 -0.942 1.980 2潼南县-0.509 0.608 -0.360 22渝中区1.986 -2.345 1.410 3南川区-0.541 0.306 -0.428 23沙坪坝区1.808 -1.450 1.375 4垫江县-0.560 0.357 -0.438 24万州区1.139 1.639 1.206 5梁平县-0.579 0.163 -0.481 25江北区1.580 -1.354 1.190 6忠 县-0.627 0.264 -0.508 26南岸区1.366 -0.759 1.083 7奉节县-0.647 0.272 -0.524 27巴南区0.882 1.010 0.899 8云阳县-0.658 0.345 -0.525 28永川区0.720 1.499 0.824 9丰都县-0.767 -0.144 -0.684 29江津区0.589 2.340 0.821 10万盛区-0.714 -0.633 -0.703 30涪陵区0.783 1.036 0.817 11黔江区-0.722 -0.655 -0.713 31合川区0.356 1.797 0.547 12彭水县-0.799 -0.335 -0.737 32北碚区0.371 -0.545 0.249 13石柱县-0.843 -0.370 -0.780 33长寿区0.147 0.636 0.212 14武隆县-0.824 -0.583 -0.792 34綦江县-0.138 1.188 0.038 15巫山县-0.885 -0.511 -0.835 35大渡口区0.075 -0.818 -0.044 16酉阳县-0.920 -0.325 -0.841 36开 县-0.313 1.055 -0.131 17秀山县-0.877 -0.639 -0.845 37铜梁县-0.345 0.143 -0.281 18巫溪县-1.008 -0.772 -0.977 38荣昌县-0.399 0.445 -0.287 19双桥区-1.022 -1.498 -1.086 39璧山县-0.287 -0.425 -0.306 20城口县-1.092 -1.196 -1.105 40(9)比较各地区综合因子得分,结合实际情况进行分析。从表上可以看出,综合得分最高的是渝北区、九龙坡区、渝中区,排名靠前的主要是主城各区,排名靠后的则是以城口、双桥、巫溪、秀山、石柱为代表的区县,基本上代表了重庆市的社会经济现状。由结果得知,一小时经济圈内的综合得分排位都比较靠前,这与中心区域经济效益相符合。其中渝北区、九龙坡区、沙坪坝区、南岸区和江北区拥有较好的工业园区,在工业、建筑业等基础性产业上其产值有明显的优势,而这些优势又会带动其整体经济发展,所以排在前面。渝中区的解放碑区域是重庆的金融中心,也是消费中心,所以也排在前面。万州区、巴南区、永川区、江津区、江津区、涪陵区、合川区整体水平较好,农业发展较好。综上,三峡库区边远区市县表现较为一致,作为第一类,其主要特征是综合实力、非农业实力因子和农业实力因子的得分均较低,整体经济基础薄弱,社会生产力水平低下;而以荣昌、大足、璧山、綦江为代表的成渝和渝黔线区市县为第二类,其特征是非农业实力因子得分低,农业实力因子得分较高,综合实力得分得分较低;其他以渝北区、沙坪坝区、渝中区为代表的主城各区及少数经济发展较好的区市县为第三类,其主要特征是综合实力得分和非农业实力因子均较高。由各区市县的综合得分比较结果可以很好地解释重庆市政府制定的整体经济发展战略,将整个重庆划分为都市经济发达圈、渝西经济走廊和三峡库区生态经济带的发展思路,三个经济区域针对各自特点确定经济发展方向和重点。专心-专注-专业