《因子分析主成分分析复习进程.doc》由会员分享,可在线阅读,更多相关《因子分析主成分分析复习进程.doc(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。因子分析主成分分析-公共管理定量分析实验报告实验完成者谭希荣班级2010公共事业管理2班学号20100710030231实验时间2013年5月8日一、实验名称因子分析、主成分分析二、实验目的学习利用SPSS进行因子分析、主成分分析三、实验内容1、(因子分析)对2008年重庆市40个区县经济发展基本情况进行分析,选择合适的分析变量,找出影响地区社会经济发展水平的主要因子,并对各地区发展水平进行综合评价或者对各地区经济发展状况进行分类。2、(主成分分析)调查美国50个州7种犯罪率,这七种犯罪是:murder
2、(杀人罪),rape(强奸罪),robbery(抢劫罪),assault(斗殴罪),burglary(夜盗罪),larceny(偷盗罪),auto(汽车犯罪),很难直接从这七个变量出发来评价各州的治安和犯罪情况,试作主成份分析说明选几个主成分合适,找出几个主成分,并按照第一、第二主成分分别对50个周进行排名,并解释之。四、实验结果及分析一、因子分析基本操作:1、选择AnalyzeDataReductionFactor,打开FactorAnalysis主对话框;选择变量X1X8,单击向右箭头,将其选入到Variable框中;2、分别点Descriptives按钮,选Coefficients复选框
3、,输出相关系数;选中KMOandBartlettstestofsphericity复选框,检验因子分析的适用条件;点Rotation按钮,选Varimax复选框,选择方差最大化旋转方法;单击Scores按钮选Displayfactorscorecoefficientmatrix,显示因子得分函数系数矩阵;选Saveasvariable;结果如下:分析:由上图可知,KMO值为0.684,说明对数据做因子分析的效果一般。分析:由旋转后的因子载荷矩阵可知,公共因子F1在X1工业总产值(万元),X3建筑业总产值(万元),X4地方财政预算内收入(亿元),X5非农业人口(万人),X6公路货运量(万吨),X
4、7城镇化率(%)上的载荷值比较大。其中X1,X6反映区县工业发展规模,X3反映区县建筑业发展情况,X5,X7是反映各区县规模的指标。因此F1为城镇规模及经济发展水平的公共因子。公共因子F2在X8农村居民人均住房面积(平方米)的载荷值很大,是反映农村居民的住房条件,因此F2为城镇居民住房条件的公共因子。公共因子F3在X2农业总产值(万元)的载荷值很大,而X2是反映各区县在农产业上的发展水平,因此F3为城镇农村经济水平的公共因子。(三)计算因子得分根据上面的特征根及累计贡献率表里的数据,计算因子得分。公式即:F=(52.806*F1+17.014*F2+15.731*F3)/85.551得到下表:
5、区县F1F2F3F渝中区2.0085824-4.611722-1.4877590.0490635大渡口区0.14987011.8816663-1.8923610.1187593江北区1.64237-0.476049-1.2783660.6840075沙坪坝区1.72541440.8831068-1.1284611.0331334九龙坡区2.02358610.4443321-1.1374451.1282651南岸区1.24057911.6162233-1.3544650.8381123北碚区0.28110070.6698013-0.8621250.1481889渝北区2.1083020.8531
6、1740.39840271.5442626巴南区0.79594910.46186410.58326780.6904002万盛区-0.5912141.5481062-1.321607-0.30006双桥区-0.759264-0.223325-2.172893-0.912615涪陵区1.1886477-0.3056871.20661980.8947657长寿区0.33834150.25948860.55528380.3625506江津区0.95860460.16564062.25707541.0396645合川区0.46815940.16158861.67085950.6283408永川区0.78
7、143710.51089071.06329620.7794599南川区-0.527120.024890.2587358-0.272837綦江县0.06085550.62629830.8195110.3128088潼南县-0.451446-0.822830.7436058-0.30556铜梁县-0.4022810.10211080.4183634-0.151071大足县-0.323261-0.0522690.586983-0.101993荣昌县-0.242523-0.5531140.6284929-0.14413璧山县-0.3077230.5929145-0.242537-0.116622万州区
8、1.208766-0.0820821.58072931.0204439梁平县-0.8206210.66993390.2797077-0.321859城口县-1.174512-0.746189-0.914086-1.041442丰都县-0.782163-0.3977650.0674657-0.549487垫江县-0.5188580.06212620.3842529-0.237251忠县-0.665059-0.1940220.4639878-0.363774开县-0.4134750.29395361.16507030.017476云阳县-0.701102-0.4062460.508942-0.41
9、9961奉节县-0.640789-1.0718160.4220999-0.531067巫山县-0.849576-0.808783-0.32624-0.745233巫溪县-1.150366-0.229259-0.489298-0.845624黔江区-0.724426-0.430677-0.410488-0.60828武隆县-0.996814-0.185344-0.432608-0.731687石柱县-1.0760660.6079976-0.162321-0.573129秀山县-0.9952270.0091372-0.319696-0.671268酉阳县-0.98501-0.258252-0.05
10、3654-0.669219彭水县-0.881669-0.589757-0.076341-0.675533分析:结合40个区县在三个公共因子上的得分和综合得分,对重庆市这40个区县的社会经济发展水平进行评价。在城镇规模及经济发展水平因子F1得分最高的依次是渝北区,九龙坡区,渝中区,沙坪坝区,江北区,其分数分别为2.11,2.02,2.01,1.73,1.64。说明就城镇规模和经济发展水平而言,渝北区在重庆市这40各区县里是最好的,规模较大,经济发展也最好。渝北区,九龙坡区,渝中区,沙坪坝区,江北区这几个个区县本来就属于重庆市1小时经济圈里,可想而知,经济发展各方面都应该是最好的。在城镇居民住房条
11、件因子F2得分最高的是大渡口区,南岸区,万盛区,沙坪坝区,渝北区,这些区县的农村居民人均住房条件比较好,其余的区县更应该加强住房方面建设。而在城镇农村经济水平因子F3上得分最高的是江津区,合川区,万州区,涪陵区,开县,说明这些区县在农产业上发展较好,大力发展农业经济。根据综合得分,分析各区县社会经济发展水平。综合得分的前五名依次是渝北区,九龙坡区,江津区,沙坪坝区,万州区,得分最低的是武隆县,巫山县,巫溪县,双桥区,城口县。结合前面的分析,可知渝北区,九龙坡区在整体的城镇规模和经济发展水平上较好,而那些周边区县的社会经济较差,在规模,农村经济发展水平以及居住方面的建设特别需要加强。在本文中,渝
12、中区由于农业产值指标值缺失,因此将它单独分析。渝中区作为重庆市的经济实力最好的区县,是有目共睹的,只是在本文所选取的这几类指标未能更好体现出它的经济实力。总的来说,要发展社会经济,要从各方面加强建设,不仅仅是经济反面,还有规模,基础设施,人民福利等等,做到协调可惜续发展才是最快最有效地措施。二、主成分分析按第一主成份排序的美国50个州(给出前5条和后5条):按第二主成份排序的美国50个州(给出前5条和后5条):结果分析。从解释总方差表的输出结果可以看出,在最后一列累计贡献率中,前两个主成分的累计贡献率已达76.5,前三个主成分的累计贡献率达86.9,最终为100%。因此可以考虑只取前面两个或三
13、个主成分,它们能够很好地概括这组数据。其中第一主成份分量的特征值为4.11496,其方差为2.87624,贡献率为4.11496/7=58.7851%,请注意七个主成份分量的特征值之和为7。根据7个特征值和特征向量,我们可以写出由标准化变量所表达的第一主成分为:PRIN1=0.300279murder+0.431759rape+0.396875robbery+0.396652assault+0.440157burglary+0.357360arceny+0.295177auto其中,murder等为标准化变量,即murder=(MURDER7.444000000)/3.866768941。各标
14、准化指标murder等前的系数,与该主成分所对应的特征值之平方根的乘积是该主成分与该指标之间的相关系数,如PRIN1与MURDER相关系数为0.30027911496.4=0.609127。第一主成分单独地说明整个原始数据标准变异的58.78。同样我们可以写出第二主成份为:PRIN2=0.629174muder0.169435rape+0.042247robbery0.343528asault+0.203341burglary+0.402319larceny+0.502421auto第二主成份为抢、盗罪(robbery,burglary,larceny和auto系数为正)与杀、淫罪(muder
15、,rape和assault系数为负)的对比。第一、第二主成份结合,可说明标准总变异的76.48。第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。可以认为这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。第三主成分很难给出明显的解释。在依PRIN1排序的结果表35.4中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTHDAKOTA(PRIN1=-3.96408)州犯罪率最低,
16、PRIN1值较大的州,犯罪率较高,即内华达NEVADA(PRIN1=5.26699)州犯罪率最高。在依PRIN2排序的结果表35.5中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大,即密西比比MISSISSIPPI(PRIN2=-2.54671)州的暴力犯罪性质比重最大,PRIN2值较大州的暴力犯罪性质比重较小,即麻萨诸塞MASSACHUSETTS(PRIN2=2.63105)州的暴力犯罪性质比重最小。结果分析。可以看出,在最后一列累计贡献率中,前两个主成分的累计贡献率已达76.5,前三个主成分的累计贡献率达86.9,最终为100%。因此可以考虑只取前面两个或三个主成分,它们能够很好地概
17、括这组数据。其中第一主成份分量的特征值为4.11496,其方差为2.87624,贡献率为4.11496/7=58.7851%,请注意七个主成份分量的特征值之和为7。从表35.3中输出结果(d)中的7个特征值和特征向量,我们可以写出由标准化变量所表达的第一主成分为:PRIN1=0.300279murder+0.431759rape+0.396875robbery+0.396652assault+0.440157burglary+0.357360arceny+0.295177auto其中,murder等为标准化变量,即murder=(MURDER7.444000000)/3.866768941。各
18、标准化指标murder等前的系数,与该主成分所对应的特征值之平方根的乘积是该主成分与该指标之间的相关系数,如PRIN1与MURDER相关系数为0.30027911496.4=0.609127。第一主成分单独地说明整个原始数据标准变异的58.78。同样我们可以写出第二主成份为:PRIN2=0.629174muder0.169435rape+0.042247robbery0.343528asault+0.203341burglary+0.402319larceny+0.502421auto第二主成份为抢、盗罪(robbery,burglary,larceny和auto系数为正)与杀、淫罪(mude
19、r,rape和assault系数为负)的对比。第一、第二主成份结合,可说明标准总变异的76.48。由于第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。可以认为这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。第三主成分很难给出明显的解释。在依PRIN1排序的结果表35.4中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTHDAKOTA(PRIN1=-3.96408)州犯罪率最低,PRIN1值较大的州,犯罪率较高,即内华达NEVADA(PRIN1=5.26699)州犯罪率最高。在依PRIN2排序的结果表35.5中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大,即密西比比MISSISSIPPI(PRIN2=-2.54671)州的暴力犯罪性质比重最大,PRIN2值较大州的暴力犯罪性质比重较小,即麻萨诸塞MASSACHUSETTS(PRIN2=2.63105)州的暴力犯罪性质比重最小。-
限制150内