主成分分析应用实例.doc
主成分分析应用实例应用实例对全国30个省市自治区经济发展基本情况的8项指标作主成分分析,数据见程序中。其中八个指标依次为GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。SAS程序如下:data a1;input diqu $ x1x8;cards;北京 1394.892505519.018144373。9117.3112.6843。43天津 920。112720345。466501342.8115.2110。6582.51河北 2849。521258704.8748392033。3115.2115.81234。85山西 1092。481250290。94721717.3116.9115。6697.25内蒙 832.881387250。234134781。7117.5116.8419。39辽宁 2793。372397387.9949111371。1116。11141840。55吉林 1129。21872320。454430497。4115。2114。2762。47黑龙江 2014.532334435。734145824。8116。1114。31240。37上海 2462。575343996。489279207。4118.71131642。95江苏 5155.2519261434.9559431025。5115。8114.32026。64浙江 3524。7922491006。396619754。4116.6113。5916.59安徽 2003.5812544744609908。3114。8112.7824。14福建 2160.522320553.975857609。3115。2114。4433。67江西 1205.111182282。844211411.7116。9115.9571.84山东 5002.3415271229.5551451196.6117。6114。22207.69河南 3002。741034670。3543441574.4116。5114.91367.92湖北 2391。421527571。684685849120116。61220.72湖南 2195.71408422.6147971011.8119115.5843.83广东 5381.7226991639。838250656。5114111.61396.35广西 1606。151314382.595150556118。4116。4554.97海南 364。171814198.355340232。1113.5111.364.33四川 35341261822。544645902。3118.51171431.81贵州 630。07942150.844475301.1121。4117.2324.72云南 1206.6812613345149310.4121.3118。1716.65西藏 55.98111017.8773824.2117。3114。95.57陕西 1000。031208300。274396500.9119117600.98甘肃 553。351007114。815493507119.8116。5468。79青海 165.31144547.76575361。6118116.3105。8宁夏 169。75135561。985079121。8117.1115.3114。4新疆 834.571469376.965348339119.7116.7428。76;proc princomp data=a1 n=4 out=w1 outstat=w2;var x1-x8;proc sort data=w1;by descending prin1;proc print data=w1;run;结果分析:(1)相关系数矩阵由相关系数矩阵可以看出,有较强相关性的变量依次为:GDP(x1)与固定资产投资(x2)之间的相关系数为0.9506;GDP(x1)与工业总产值(x8)之间的相关系数为:0。8734;固定资产投资(x3)与工业总产值(x8)之间的相关系数为0.7919;居民消费价格指数(x6)与商品零售价格指数(x7)之间的相关系数为0.7628;货物周转量(x5)与工业总产值(x8)之间的相关系数为0.6586。(2)相关系数矩阵特征值相关系数矩阵的特征值即各主成分的方差,由它可以看出,第一主成分对方差的贡献率为46。93,第二主成分对方差的贡献率为27.6%,第三主成分对方差的贡献率为15。19%,第四主成分对方差的贡献率为5。03%。因前三个主成分的累积贡献率为89.58,故用前三个主成分就可以很好的概括此组数据。(3)特征向量由此可写出前三个主成分的表达式:Prin1=Prin2=Prin3=可见,第一主成分中的系数较大;第二主成分中具有较大的正系数,则具有较大的负系数;第三主成分中的系数最大,远远超过其他指标的影响。因此可以把第一主成分看成是由固定资产投资、居民消费水平、GDP、工业总产值所刻画的反映经济发展水平的综合指标;把第二主成分看成是由货物周转量、商品零售价格指数所刻画的与人民生活水平有关的综合指标;把第三主成分单独看成是居民消费价格指数的影响指标。(4)按第一主成分排序结果