《最新spss分析报告.doc》由会员分享,可在线阅读,更多相关《最新spss分析报告.doc(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-datespss分析报告基于省会城市和计划单列市主要经济指标数据的spss分析基于全国36个省市主要经济指标数据的spss分析一 数据来源与描述1 数据来源中国劳动统计年鉴2008(2 数据描述 本数据集记录了2007年全国36个省市(港、澳、台除外)的主要经济指标,其中包括各省市的年底总人口、地区生产总值、在岗职工平均工资、固定资产投资总额等。二 问题:1 对36个省市的主
2、要经济指标数据进行分布特征检验。 方法:K-S检验2 通过全国36各省市的主要经济指标,分析各省市生活水平的差异与共性。 方法:系统聚类3 提取公共因子,分析衡量各省市生活水平的指标。 方法:因子分析三 具体分析步骤1 数据基本处理:修改小数点、修改度量标准。2 描述统计分析(1)“分析”“描述统计”“描述” (2)“变量”选择: 年底总人口(万人)、地区生产总值(当年价格)(万元)、客运量(万人)、货运量(万吨)、地方财政预算内收入(万元)、地方财政预算内支出(万元)、固定资产投资总额(万元)、城乡居民储蓄年末余额(万元)、在岗职工平均工资(元)、年末邮政局(所)数(处)、年末固定电话用户数
3、(万户)、社会商品零售总额(万元)、货物进出口总额(万美元)、年末实有公共(汽)电车营运车辆数(辆)、剧场、影剧院数(个)、普通高等学校在校学生数(人)、医院、卫生院(个)、执业(助理)医师(人) 。 (3) 单击“选项”按钮选择:“均值”、“标准差”、“最大值”、“最小值”。(4) 单击“确定”按钮,输出描述统计分析结果。(5) 得出数据显示:描述统计量N极小值极大值均值标准差年底总人口(万人)36623235668.04542.780地区生产总值(当年价格)(万元)36121910012188850028436054.362.581E7客运量(万人)3628717772716043.201
4、5179.289货运量(万吨)36327810818817.8816370.869地方财政预算内收入(万元)3653800207447922860950.834066301.588地方财政预算内支出(万元)36246227218167803418107.004358639.585固定资产投资总额(万元)368762004458609813906993.171.004E7城乡居民储蓄年末余额(万元)369047009326450019915236.922.110E7在岗职工平均工资(元)36199924931128881.227564.142年末邮政局(所)数(处)36363468447.566
5、28.198年末固定电话用户数(万户)36311022318.13221.550社会商品零售总额(万元)365580003847791810498059.398835480.712货物进出口总额(万美元)3621908287533453585618.537106722.766年末实有公共(汽)电车营运车辆数(辆)36782193954835.004069.483剧场、影剧院数(个)36415335.0038.783普通高等学校在校学生数(人)3612163778368327042.22203594.694医院、卫生院(个)36531447351.11280.486执业(助理)医师(人)3610
6、505498916725.4711697.066有效的 N (列表状态)36 分析:由上表可以看出,各类主要经济指标的最大值和最小值相差很大,说 明不同省市之间的生活水平有明显差异。3. 正态分布检验 (1)“分析”“非参数检验”“旧对话框”“1样本K-S” (2)“检验变量列表”选择:年底总人口(万人)、地区生产总值(当年价格)(万元)、客运量(万人)、货运量(万吨)、地方财政预算内收入(万元)、地方财政预算内支出(万元)、固定资产投资总额(万元)、城乡居民储蓄年末余额(万元)、在岗职工平均工资(元)、年末邮政局(所)数(处)、年末固定电话用户数(万户)、社会商品零售总额(万元)、货物进出口
7、总额(万美元)、年末实有公共(汽)电车营运车辆数(辆)、剧场、影剧院数(个)、普通高等学校在校学生数(人)、医院、卫生院(个)、执业(助理)医师(人) 。 (3)单击“确定”按钮,输出结果。 (4) 得出数据显示:单样本 Kolmogorov-Smirnov 检验N正态参数a,b最极端差别Kolmogorov-Smirnov Z渐近显著性(双侧)均值标准差绝对值正负年底总人口(万人)36668.04542.780.201.201-.1421.205.110地区生产总值(当年价格)(万元)3628436054.362.581E7.187.187-.1461.123.160客运量(万人)36160
8、43.2015179.289.213.213-.1931.280.076货运量(万吨)3618817.8816370.869.206.206-.1311.238.093地方财政预算内收入(万元)362860950.834066301.588.262.262-.2451.574.014地方财政预算内支出(万元)363418107.004358639.585.307.307-.2331.840.002固定资产投资总额(万元)3613906993.171.004E7.129.129-.097.772.590城乡居民储蓄年末余额(万元)3619915236.922.110E7.277.277-.184
9、1.660.008在岗职工平均工资(元)3628881.227564.142.238.238-.1301.428.034年末邮政局(所)数(处)36447.56628.198.293.293-.2561.761.004年末固定电话用户数(万户)36318.13221.550.186.186-.0981.115.167社会商品零售总额(万元)3610498059.398835480.712.160.160-.130.958.318货物进出口总额(万美元)363585618.537106722.766.309.309-.3081.853.002年末实有公共(汽)电车营运车辆数(辆)364835.0
10、04069.483.191.191-.1601.148.143剧场、影剧院数(个)3635.0038.783.252.252-.2121.512.021普通高等学校在校学生数(人)36327042.22203594.694.085.085-.061.510.957医院、卫生院(个)36351.11280.486.233.233-.1441.398.040执业(助理)医师(人)3616725.4711697.066.191.191-.1001.145.145a. 检验分布为正态分布。b. 根据数据计算得到。分析:在0.001的显著性水平下,各省市主要经济指标的P值均大于0.001,因此上述数据均
11、服从正态分布。 4.系统聚类分析 (1)“分析”“分类”“系统聚类” (2)“变量”选择:年底总人口(万人)、地区生产总值(当年价格)(万元)、客运量(万人)、货运量(万吨)、地方财政预算内收入(万元)、地方财政预算内支出(万元)、固定资产投资总额(万元)、城乡居民储蓄年末余额(万元)、在岗职工平均工资(元)、年末邮政局(所)数(处)、年末固定电话用户数(万户)、社会商品零售总额(万元)、货物进出口总额(万美元)、年末实有公共(汽)电车营运车辆数(辆)、剧场、影剧院数(个)、普通高等学校在校学生数(人)、医院、卫生院(个)、执业(助理)医师(人) 。 (3)“标注个案”选择:城市名称。 (4)
12、“分群”选择:“个案”。 (5)单击“绘制”按钮选择:“树状图”。 (6)单击“方法”按钮:在“聚类方法”下拉列表中选择“质心聚类法”。 (7)单击“确定”按钮,输出系统聚类分析结果。 (8)得出数据显示:聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 2133361.646E12004234351.842E12003326342.121E120211429334.630E12011355255.259E12001363206.454E12001574309.475E12002288229.563E12001799181.151E1300151011211.394E130
13、0201126311.630E1330271216171.676E130016135291.814E1354231413191.911E13002115391.920E1369181614162.283E1301222178152.409E13801818382.347E13151725196282.810E130024207112.814E1301021217133.366E13201424224144.223E137162323455.256E1322132724676.201E13192126253326.644E1318029266121.069E1424029274261.238E1
14、4231130282271.895E14003329362.318E1425263030346.772E142927343123249.697E140033321109.762E140035332231.202E1528313434232.646E1533303535121.565E1632340 分析:上表显示的是聚类表,该表反映的是每一阶段聚类的结果,系 数表示的是“聚合系数”,第2列和第3列表示的是聚合的类。 分析:上图为系统聚类分析的冰柱图,它反映了各类之间的距离,从最后一 行向前我们可以依次看出不同的聚类数量下的分类方式。 分析:上图为使用“质心联接”聚类法生成的树状聚类图,它反映了
15、 聚类每一次合并的情况。-5.因子分析: (1)“分析”“降维”“因子分析” (2)“变量”选择: 年底总人口(万人)、地区生产总值(当年价格)(万元)、客运量(万人)、货运量(万吨)、地方财政预算内收入(万元)、地方财政预算内支出(万元)、固定资产投资总额(万元)、城乡居民储蓄年末余额(万元)、在岗职工平均工资(元)、年末邮政局(所)数(处)、年末固定电话用户数(万户)、社会商品零售总额(万元)、货物进出口总额(万美元)、年末实有公共(汽)电车营运车辆数(辆)、剧场、影剧院数(个)、普通高等学校在校学生数(人)、医院、卫生院(个)、执业(助理)医师(人) 。 (3)单击“描述”按钮选择:“原
16、始分析结果”和“KMO和Bartlett的球形度检验”。(4)单击“抽选”按钮选择:“碎石图”,其他为系统默认选择。 (5) 单击“旋转”按钮选择:“最大方差法”,其他为系统默认选择。(6) 单击“得分”按钮选择:“保存为变量”和“因子得分系数”。(7) 单击“确定”按钮,输出因子分析结果。(8) 得出数据显示:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.828Bartlett 的球形度检验近似卡方1152.184df153Sig.000 分析:上表给出了KMO和Bartlett的检验结果,其中KMO值越接近1表示越适合做因子分析,从该表可以
17、得到KMO的值为0.828,表示非常适合做因子分。Bartlett球形度检验的原假设为相关系数矩阵为单位阵,Sig值为0.000小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。公因子方差初始提取年底总人口(万人)1.000.923地区生产总值(当年价格)(万元)1.000.976客运量(万人)1.000.779货运量(万吨)1.000.699地方财政预算内收入(万元)1.000.966地方财政预算内支出(万元)1.000.966固定资产投资总额(万元)1.000.890城乡居民储蓄年末余额(万元)1.000.968在岗职工平均工资(元)1.000.642年末邮政
18、局(所)数(处)1.000.767年末固定电话用户数(万户)1.000.968社会商品零售总额(万元)1.000.977货物进出口总额(万美元)1.000.860年末实有公共(汽)电车营运车辆数(辆)1.000.922剧场、影剧院数(个)1.000.789普通高等学校在校学生数(人)1.000.532医院、卫生院(个)1.000.809执业(助理)医师(人)1.000.936提取方法:主成份分析。 分析:上表给出了每个变量共同度的结果。表格数据表左侧表示每个变量可以被所有因素所能解释的方差,右侧表示变量的共同度。从该表可以得到,因子分析的变量共同度都非常高,表明变量中的大部分信息均能被因子所提
19、取,说明因子分析的结果是有效的。解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %111.85965.88465.88411.85965.88465.8849.10350.57350.57322.50513.91879.8022.50513.91879.8023.34518.58469.15731.0075.59385.3951.0075.59385.3952.92316.23885.3954.8714.84190.2365.5002.77793.0136.3802.11095.1237.2581.43496.5578.21
20、21.17797.7349.125.69698.42910.091.50698.93511.067.37199.30612.054.30299.60813.031.17499.78314.018.09899.88015.009.05099.93116.008.04799.97817.003.01599.99218.001.008100.000提取方法:主成份分析。分析:上表给出了因子贡献率的结果。该表中的左侧部分为初始特征值,中间为提取主因子结果,右侧为旋转后的主因子结果。“合计”指因子的特征值,“方差的”表示该因子的特征值占总特征值得百分比,“累积%”表示累积的百分比。其中只有前三个因子的特
21、征值大于1,并且前三个因子的特征值之和占总特征值的85.34%,因此,提取前三个因子作为主因子。成份矩阵a成份123年底总人口(万人).644.662-.264地区生产总值(当年价格)(万元).965-.183.113客运量(万人).475.735.115货运量(万吨).804.191.125地方财政预算内收入(万元).929-.316-.065地方财政预算内支出(万元).953-.228-.078固定资产投资总额(万元).933.110-.087城乡居民储蓄年末余额(万元).968-.161.073在岗职工平均工资(元).643-.464.114年末邮政局(所)数(处).551.448.51
22、3年末固定电话用户数(万户).978.097-.025社会商品零售总额(万元).977-.090.118货物进出口总额(万美元).757-.534.041年末实有公共(汽)电车营运车辆数(辆).945-.169.027剧场、影剧院数(个).746-.230-.423普通高等学校在校学生数(人).514.380.351医院、卫生院(个).482.552-.522执业(助理)医师(人).956.135-.069提取方法 :主成份。a. 已提取了 3 个成份。分析:上表给出了未旋转的因子载荷。从该表可以得到利用主成份方法提取的三个主因子的载荷值。从该表的因子分析模型为:年底总人口(万人)=0.644
23、F1+0.662F2-0.264F3地区生产总值(当年价格)(万元)=0.965F1-0.183F2+0.113F3客运量(万人)=0.475F1+0.735F2+0.115F3货运量(万吨)=0.804F1+0.191F2+0.125F3地方财政预算内收入(万元)=0.929F1-0.316F2-0.065F3地方财政预算内支出(万元)=0.953F1-0.228F2-0.078F3固定资产投资总额(万元)=0.933F1+0.110F2-0.087F3城乡居民储蓄年末余额(万元)=0.968F1-0.161F2+0.073F3在岗职工平均工资(元)=0.643F1-0.464F2+0.11
24、4F3年末邮政局(所)数(处)=0.551F1+0.448F2+0.513f3年末固定电话用户数(万户)=0.978F1+0.097F2-0.025F3社会商品零售总额(万元)=0.977F1-0.090F2+0.118F3货物进出口总额(万美元)=0.757F1-0.534F2+0.041F3年末实有公共(汽)电车营运车辆数(辆)=0.945F1-0.169F2+0.027F3剧场、影剧院数(个)=0.746F1-0.230F2-0.423F3普通高等学校在校学生数(人)=0.514F1+0.380F2+0.351F3医院、卫生院(个)=0.482F1+0.552F2-0.522F3执业(助
25、理)医师(人)=0.956F1+.135F2-0.069F3旋转成份矩阵a成份123年底总人口(万人).191.471.815地区生产总值(当年价格)(万元).906.364.154客运量(万人)-.003.709.526货运量(万吨).568.528.312地方财政预算内收入(万元).953.148.190地方财政预算内支出(万元).927.201.260固定资产投资总额(万元).727.387.461城乡居民储蓄年末余额(万元).898.351.197在岗职工平均工资(元).788.068-.130年末邮政局(所)数(处).203.847.096年末固定电话用户数(万户).770.440.
26、425社会商品零售总额(万元).866.429.210货物进出口总额(万美元).924.022-.079年末实有公共(汽)电车营运车辆数(辆).884.305.217剧场、影剧院数(个).765-.125.433普通高等学校在校学生数(人).215.679.158医院、卫生院(个).124.161.877执业(助理)医师(人).732.422.471提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 5 次迭代后收敛。分析:上表给出了旋转后的因子载荷值,其中旋转方法采用的是Kaiser标准化的正交旋转法。通过因子旋转,各个因子有了比较明确的含义。可以看出,地区
27、生产总值、地方财政预算内收入、地方财政预算内支出、固定资产投资总额、城乡居民储蓄年末余额、在岗职工平均工资、年末固定电话用户数、社会商品零售总额、货物进出口总额、年末实有公共(汽)电车营运车辆数、剧场、影剧院数在第一个因子里有较高载荷;客运量、货运量、年末邮政局(所)数、普通高等学校在校学生数在第二个因子里有较高载荷,其他的在第三个因子里有较高载荷。分析:上图给出了特征值的碎石图,通常该图显示大因子的陡峭斜率和剩余因子平缓的尾部,之间有明显的中断。一般选取主因子在非常陡峭的斜率上,而处于平缓斜率上的因子对变异的解释非常小。从该图可以看出前三个因子都处于非常陡峭的斜率上,而从第四个因子开始斜率变
28、平缓,因此选择前三个因子作为主因子。成份得分系数矩阵成份123年底总人口(万人)-.089-.004.366地区生产总值(当年价格)(万元).104.068-.095客运量(万人)-.129.269.108货运量(万吨).012.159-.019地方财政预算内收入(万元).136-.087-.001地方财政预算内支出(万元).119-.075.030固定资产投资总额(万元).045-.002.116城乡居民储蓄年末余额(万元).101.046-.061在岗职工平均工资(元).142-.008-.173年末邮政局(所)数(处)-.075.479-.242年末固定电话用户数(万户).049.040
29、.070社会商品零售总额(万元).085.094-.077货物进出口总额(万美元).168-.071-.134年末实有公共(汽)电车营运车辆数(辆).103.011-.031剧场、影剧院数(个).117-.321.270普通高等学校在校学生数(人)-.057.350-.144医院、卫生院(个)-.068-.213.518执业(助理)医师(人).041.017.110提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。分析:由上表数据可得,因子分析得分函数为:F1=-0.089年底总人口+0.104地区生产总值-0.129客运量+0.012货运量+0.136方财政
30、预算内收入+0.119地方财政预算内支出+0.045固定资产投资总额+0.101城乡居民储蓄年末余额+0.142在岗职工平均工资-0.075年末邮政局(所)数+0.049年末固定电话用户数+0.085社会商品零售总额+0.168货物进出口总额+0.103年末实有公共(汽)电车营运车辆数+0.117剧场、影剧院数-0.057普通高等学校在校学生数-0.068医院、卫生院+0.041执业(助理)医师 F2=-0.004年底总人口+0.068地区生产总值+0.269客运量+0.159货运量-0.087地方财政预算内收入-0.075地方财政预算内支出-0.002固定资产投资总额+0.046城乡居民储蓄
31、年末余额-0.008在岗职工平均工资+0.479年末邮政局(所)数+0.040年末固定电话用户数+0.094社会商品零售总额-0.071货物进出口总额+0.011年末实有公共(汽)电车营运车辆数-0.321剧场、影剧院数+0.350普通高等学校在校学生数-0.213医院、卫生院+0.017执业(助理)医师 F3=0.366年底总人口-0.095地区生产总值+0.108客运量-0.019货运量-0.001方财政预算内收入+0.030地方财政预算内支出+0.116固定资产投资总额-0.061城乡居民储蓄年末余额-0.173在岗职工平均工资-0.242年末邮政局(所)数+0.070年末固定电话用户数
32、-0.077社会商品零售总额-0.134货物进出口总额-0.031年末实有公共(汽)电车营运车辆数+0.270剧场、影剧院数-0.144普通高等学校在校学生数+0.518医院、卫生院+0.110执业(助理)医师 四 回答问题1 答:在0.001的显著性水平下,各省市的主要经济指标服从正态分布,因此可以为随后的深入分析做基础。2 答:通过系统聚类分析,可以将各省市的生活水平分为三类,北京、上海为一类,城市生活水平较高;天津、重庆、广州、深圳为一类,城市生活水平中等;其余省市为一类,城市生活水平较低。 3. 答:通过因子分析可以看出,每个因子只有少数几个指标的因子载荷较大,因此可以分类,将18个指
33、标按高载荷分成三类:地区生产总值(当年价格)、地方财政预算内收入、地方财政预算内支出、固定资产投资总额、城乡居民储蓄年末余额、在岗职工平均工资、年末固定电话用户数、社会商品零售总额、货物进出口总额、年末实有公共(汽)电车营运车辆数、剧场、影剧院数在第一个因子里有较高载荷;客运量、货运量、年末邮政局(所)数、普通高等学校在校学生数在第二个因子里有较高载荷,其他的在第三个因子里有较高载荷。五 归纳总结或意见 答:由上述内容可以看出,K-S检验数据的分布特征,通过检验得出数据为正态分布,而正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。系统聚类将各省市主要经济指标清晰地分类,为我们分析各省市城市生活水平提供了便利,因子分析则可以提取公共因子,分析衡量城市生活水平的指标,从众多的经济指标中挖掘出三个潜在的综合因子,让我们对各省市主要经济指标有个更深的解读。但是,这三种方法对数据有一定要求。总之,三种方法在分析不同的问题上各有所长。
限制150内