《主成分分析和因子分析实验报告(共16页).docx》由会员分享,可在线阅读,更多相关《主成分分析和因子分析实验报告(共16页).docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上主成分分析实验报告一、实验数据2013年,在国内外形势错综复杂的情况下,我国经济实现了平稳较快发展。全年国内生产总值亿元,比上年增长7.7%。其中第三产业增加值亿元,增长8.3%,其在国内生产总值中的占比达到了46.1%,首次超过第二产业。经济的快速发展也带来了就业的持续增加,年末全国就业人员76977万人,其中城镇就业人员38240万人,全年城镇新增就业1310万人。随着我国城镇化进程的不断加快,加之农业用地量的不断衰减,工业不断的转型升级,使得劳动力就业压力的缓解需要更多的依靠服务业的发展。(一) 指标选择根据指标选择的可行性、针对性、科学性等原则,选择13个指标
2、来衡量服务业的发展水平,指标体系如表1所示:表1 服务业发展水平指标体系指标单位计算方法代码服务业增加值亿元服务业各企事业单位增加值X1服务业就业人数万人服务业吸纳劳动力数量X2服务业产值比重%服务业增加值/GDPX3服务业就业比重%服务业就业人数/总就业人数X4人均服务产品占有量元/人服务业增加值/地区总人口数X5服务密度元/万平方公里服务业增加值/地区面积X6服务综合生产率亿元/万人服务业增加值/服务业就业人数X7服务业贡献率%服务增加值/总人口X8人均GDP元国内生产总值/总人口X9服务业增长速度%(报告期不变价服务业增加值/基期不变价服务业增加值-1)*100%X10工业化水平%工业增
3、加值/国内生产总值X11城市化水平%城镇人口/总人口X12服务业全社会固定资产投资额亿元服务业各行业固定资产投资额X13(二)指标数据本次实验采用的数据是我国31个省(市、自治区)2012年的数据,原数据均来自2013中国统计年鉴以及2013年各省(市、自治区)统计年鉴,不能直接获得的指标数据是通过对相关原始数据的换算求得。原始数据如表2所示:表2 2012年各地区服务业发展水平统计数据表地区X1X2X3X4X5X6X7北 京13669.93837.400.760.766.618329.9716.32天 津6058.46401.000.470.504.295071.1715.11河 北9384
4、.781258.000.350.311.29497.087.46山 西4682.95653.100.390.361.30298.857.17内蒙古5630.50485.400.350.372.2647.6011.60辽 宁9460.121078.000.380.442.16639.208.78吉 林4150.36515.800.350.381.51221.478.05黑龙江5540.31662.590.400.331.45117.138.36上 海12199.15629.840.600.565.1219240.0419.37江 苏23517.981737.230.440.372.972292.
5、2013.54浙 江15681.131288.310.450.352.861540.3912.17安 徽5628.481568.300.330.370.94402.033.59福 建7737.13929.950.390.362.06623.968.32江 西4486.06922.710.350.361.00268.794.86山 东19995.812141.100.400.332.061272.819.34河 南9157.571740.180.310.280.97548.365.26湖 北8208.581266.500.370.341.42441.566.48湖 南8643.601401.54
6、0.390.351.30408.106.17广 东26519.692037.880.460.342.501474.9513.01广 西4615.30809.000.350.280.99194.995.70海 南1339.53193.910.470.401.51378.406.91重 庆4494.41617.820.390.381.53545.427.27四 川8242.311573.830.350.331.02169.945.24贵 州3282.75398.680.480.220.94186.348.23云 南4235.72856.680.410.300.91108.614.94西 藏377.
7、8081.360.540.401.233.084.64陕 西5009.65457.600.350.221.33243.4210.95甘 肃2269.61356.640.400.240.8850.026.36青 海624.29121.300.330.391.098.675.15宁 夏982.52120.500.420.351.52148.878.15新 疆2703.18360.370.360.361.2116.287.50表2(续)地区X8X9X10X11X12X13北 京0.8087475.005.060.180.865341.70天 津0.5393173.004.440.470.824884
8、.60河 北0.4436584.002.950.350.479469.90山 西0.8233628.004.500.390.514335.20内蒙古0.4063886.006.440.350.585215.20辽 宁0.5056649.002.800.380.6611812.60吉 林0.3443415.003.650.350.543970.50黑龙江0.8935711.002.970.400.574619.00上 海1.0785373.003.030.600.893861.10江 苏0.5468347.004.150.440.6314804.90浙 江0.6463374.003.210.45
9、0.6311326.70安 徽0.3428792.002.860.330.478090.90福 建0.4052763.002.780.390.607597.20江 西0.4528800.003.300.350.484401.40山 东0.5651768.003.650.400.5215875.70河 南0.4431499.003.060.310.429582.30湖 北0.3738572.003.060.370.548069.90湖 南0.4433480.003.410.390.477931.40广 东0.6354095.004.080.460.6712348.00广 西0.4727952.0
10、03.290.350.445386.70海 南0.5732377.003.930.470.521710.20重 庆0.6238914.003.800.390.575503.00四 川0.4329608.003.000.350.4410489.00贵 州0.4419710.005.860.480.364074.60云 南0.3822195.003.740.410.395082.60西 藏0.5822936.002.940.540.23429.00陕 西0.3438564.004.300.350.507215.70甘 肃0.4921978.003.930.400.392236.10青 海0.383
11、3181.002.910.330.47921.70宁 夏0.5036394.007.130.420.51987.90新 疆0.5133796.004.050.360.442685.90二、 实验步骤本次实验是在SPSS中实现主成分分析,具体步骤如下:(一)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、X13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。选中Save
12、standardized values as variables(对变量进行标准化)复选框,点击OK按(二)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。(三)选择分析变量。将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。(四)因子分析过程选项,主对话框选择项中共有5个功能按钮:1.单击【Descriptives】(描述统计量)按钮,展开“De
13、scriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),KMO and Bartletts test of sphericity,点击Continue按钮。2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为
14、系统默认,点击Continue按钮。3.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,单击Continue按钮。(五)在主对话框中,单击【OK】按钮执行运算。三、实验结果(一)利用SPSS进行因子分析输出结果表3至表4所示。表3 Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% o
15、f VarianceCumulative %16.31248.55548.5556.31248.55548.55522.85121.93370.4882.85121.93370.48831.2899.91880.4061.2899.91880.40641.0327.93688.3411.0327.93688.3415.5924.55592.8976.3712.85395.7507.2321.78297.5318.1551.19498.7269.072.55099.27610.058.44499.72011.029.22399.94312.007.05499.99713.000.003100.0
16、00表4 Component MatrixaComponent1234Zscore: 服务业增加值.553.765.091.190Zscore: 服务业就业人数.108.952.043-.043Zscore: 服务业产值比重.775-.326.053-.025Zscore: 服务业就业比重.799-.233-.266-.382Zscore: 人均服务产品占有量.974-.057-.171-.046Zscore: 服务密度.846-.168.247-.155Zscore: 服务综合生产率.927.001-.006.280Zscore: 服务业贡献率.692-.209.410-.118Zscore
17、: 人均GDP.916.105-.181.074Zscore: 服务业增长速度.130-.390-.417.768Zscore: 工业化水平.188-.204.846.345Zscore: 城市化水平.908.078-.159-.033Zscore: 服务业社会固定资产额投资.185.955.004.114表3中Total列为各因子对应的特征根,本实验中共提取4各公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子累积方差贡献率,由表中可以看出,前四个因子已经可以解释88.341%的方差。(二)利用因子分析结果进行主成分分析1.将表4中因子载荷阵中的数据
18、输入SPSS数据编辑窗口,分别命名为a1、a2、a3和a4。2.为了计算第一个特征向量,点击菜单项中的Transform-Compute,调出Compute variable对话框,在对话框中输入等式:z1=a1/SQRT(6.312)点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。然后以同样的方式,分别在对话框中输入等式:z2=a2/SQRT(2.851)z3=a3/SQRT(1.289)z4=a4/SQRT(1.032)得到以z2、z3、z4为变量名的第二、三、四特征向量。这样,可得到如表6所示的特征向量矩阵。表5 特征向量矩阵Z1Z2Z3Z4X10.2200.4530
19、.0800.187X20.0430.5640.038-0.042X30.308-0.1930.047-0.025X40.318-0.138-0.234-0.376X50.388-0.034-0.151-0.045X60.337-0.0990.218-0.153X70.3690.001-0.0050.276X80.275-0.1240.361-0.116X90.3650.062-0.1590.073X100.052-0.231-0.3670.756X110.075-0.1210.7450.340X120.3610.046-0.140-0.032X130.0740.5660.0040.112根据表
20、5可以得到主成分的表达式:Y=0.220X+0.043X+0.308X+0.318X+0.388X+0.337X+0.369X+0.275X +0.365X+0.052X+0.075X+0.361X+0.074XY=0.453X+0.564X-0.193X-0.138X-0.034X-0.099X+0.001X-0.124X +0.062X-0.231X-0.121X+0.046X+0.566XY=0.080X+0.038X+0.047X-0.234X-0.151X+0.218X-0.005X+0.361X -0.159X-0.367X+0.745X-0.140X+0.004XY=0.187X
21、-0.042X-0.025X-0.376X-0.045X-0.153X+0.276X-0.116X +0.073X+0.756X+0.340X-0.032X+0.112X再以特征根为权,对4个主成分进行加权综合,得出各地区的综合得分,具体数据见表6。综合得分的计算公式是Y=Y+Y+Y+Y根据上式可以计算出各地区的综合得分,并可据此排序。表6 各地区主成分得分及排序地区YYYY综合得分排序北 京7.30-1.24-3.45-1.483.192天 津3.93-1.28-0.540.581.845河 北-1.131.43-0.04-0.45-0.3112山 西-0.41-1.030.390.10-0
22、.4316内蒙古0.33-0.88-2.032.00-0.0810辽 宁0.781.39-0.31-0.780.678吉 林-0.97-0.56-0.94-0.35-0.8121黑龙江-0.05-0.611.14-0.76-0.1211上 海7.68-1.833.11-0.674.061江 苏2.542.960.261.412.283浙 江1.941.610.820.421.596安 徽-1.961.34-0.50-1.22-0.9122福 建-0.040.65-0.15-0.570.079江 西-1.71-0.12-0.27-0.86-1.0824山 东0.813.520.420.651.4
23、27河 南-1.892.04-0.27-0.63-0.6218湖 北-0.971.10-0.21-0.51-0.3313湖 南-1.040.990.14-0.28-0.3414广 东2.323.040.891.442.264广 西-1.960.010.00-0.47-1.1226海 南-0.52-2.140.71-0.12-0.7520重 庆-0.34-0.620.05-0.31-0.3615四 川-1.611.75-0.02-0.67-0.5117贵 州-1.73-1.660.652.26-1.0825云 南-2.11-0.330.330.00-1.2128西 藏-1.56-2.662.15
24、-0.69-1.3429陕 西-1.32-0.05-0.691.03-0.7219甘 肃-2.19-1.360.470.25-1.4730青 海-2.00-1.48-0.72-1.39-1.6731宁 夏-0.73-2.71-0.982.25-0.9823新 疆-1.38-1.27-0.40-0.16-1.1327从表6可以看出,上海市的综合评价排在第一,原始数据也反映出其存在明显的规模优势,另外从第一个主成分看,上海市也排在第一位,同样存在效益优势;而排在最后三位的分别是西藏、甘肃、青海。因子分析实验报告本次实验采用的是2012年反映我国31个省(直辖市、自治区)服务业发展水平的14个指标(
25、数据见主成分分析报告表2)。14个指标分别为:服务业增加值(X1)、服务业就业人数(X2)、服务业产值比重(X3)、服务业就业比重(X4)、人均服务产品占有量(X5)、服务密度(X6)、服务综合生产率(X7)、服务业贡献率(X8)、人均GDP(X9)、服务业增长速度(X10)、工业化水平(X11)、城市化水平(X12)、服务业全社会固定资产投资(X13).这些指标之间有很强的相关性,如果利用所有14个指标对31个省(直辖市、自治区)进行服务业发展水平分析,难免会出现信息的重叠,而利用因子分析可以解决这个问题。一、实验步骤本次实验是在SPSS中实现主成分分析,具体步骤如下:(一)定义变量及标签
26、。(二)输入数据,建立数据文件。(三)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、X13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。选中Save standardized values as variables(对变量进行标准化)复选框,点击OK按钮。(四)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜
27、单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。(五)选择分析变量。将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。(六)因子分析过程选项,主对话框选择项中共有5个功能按钮:1.单击【Descriptives】(描述统计量)按钮,展开“Descriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matri
28、x中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),点击Continue按钮。2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为系统默认,点击Continue按钮。3.在主对话框中,单击【Rotation】(旋转)按钮,展开“Rotation”对话框,在Method(旋转方法)栏中选择Varimax(最大方差旋转项);在Display栏中选择要求的输出项,这里选择Rotated solution(输出旋转后的结果
29、);在Maximum Iterations for Convergence(参数框中指定旋转收敛的最大迭代次数),这里选择系统默认值为25,点击Continue按钮。4.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,在Method(方法)框中,选择计算因子得分的方法,这里选用Regression(回归法);选中Display factor score coefficient matrix(输出因子得分系数矩阵)复选框,单击Continue按钮。5在主对话框中单击【Option
30、s】输出的选择按钮,展开Options对话框,在Missing Value(缺失值)栏中,选择Exclude cases Listwise(有缺失值的观测量一律剔除),在Coefficent display format(选择因子载荷系数的输出方式)中选择Sorted by size(按绝对值大小排列),单击Continue按钮。(七)在主对话框中,单击【OK】按钮执行运算。二、实验结果(一)实验结果输出输出结果如表1至表7所示:表1 KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.821Bartlet
31、ts Test of SphericityApprox. Chi-Square581.552df78Sig.000表2 CommunalitiesInitialExtractionZscore: 服务业增加值1.000.935Zscore: 服务业就业人数1.000.923Zscore: 服务业产值比重1.000.711Zscore: 服务业就业比重1.000.910Zscore: 人均服务产品占有量1.000.984Zscore: 服务密度1.000.829Zscore: 服务综合生产率1.000.938Zscore: 服务业贡献率1.000.705Zscore: 人均GDP1.000.88
32、9Zscore: 服务业增长速度1.000.932Zscore: 工业化水平1.000.912Zscore: 城市化水平1.000.858Zscore: 服务业全社会固定资产投资额1.000.960表3 Correlation MatrixX1X2 X3X4 X5X6X7X8X9X10X11X12X13CorrelationX11.000.797.254.185.471.297.551.273.537-.102.067.495.833X2.7971.000-.160-.102.044-.021.039-.064.129-.347-.171.123.911X3.254-.1601.000.739
33、.802.666.649.637.548.231.224.518-.151X4.185-.102.7391.000.855.666.581.520.724.040-.111.727-.110X5.471.044.802.8551.000.793.892.585.922.171.046.884.124X6.297-.021.666.666.7931.000.762.673.686-.031.329.723-.036X7.551.039.649.581.892.7621.000.576.905.290.255.864.200X8.273-.064.637.520.585.673.5761.000.
34、445-.004.358.539-.080X9.537.129.548.724.922.686.905.4451.000.147.088.925.283X10-.102-.347.231.040.171-.031.290-.004.1471.000-.019.091-.264X11.067-.171.224-.111.046.329.255.358.088-.0191.000.037-.110X12.495.123.518.727.884.723.864.539.925.091.0371.000.227X13.833.911-.151-.110.124-.036.200-.080.283-.2
35、64-.110.2271.000表4 Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %16.31248.55548.5556.31248.55548.5555.97545.96445.96422.85121.93370.4882
36、.85121.93370.4882.93322.56368.52631.2899.91880.4061.2899.91880.4061.40010.76779.29441.0327.93688.3411.0327.93688.3411.1769.04888.3415.5924.55592.8976.3712.85395.7507.2321.78297.5318.1551.19498.7269.072.55099.27610.058.44499.72011.029.22399.94312.007.05499.99713.000.003100.000表5 Component MatrixaComp
37、onent1234Zscore: X5.974-.057-.171-.046Zscore: X7.927.001-.006.280Zscore: X9.916.105-.181.074Zscore: X12.908.078-.159-.033Zscore: X6.846-.168.247-.155Zscore: X4.799-.233-.266-.382Zscore: X3.775-.326.053-.025Zscore: X8.692-.209.410-.118Zscore: X12.185.955.004.114Zscore: X2.108.952.043-.043Zscore: X1.553.765.091.190Zscore: X11.188-.204.846.345Zscore: X10.130-.390-.417.768表6 Rotated Component MatrixaComponent1234Zscore: X5.975.136-.019.123Zscore: X2.908-.140-.228-.120Zscore: X12.884.254-.034
限制150内