《主成分分析法例子精选课件.ppt》由会员分享,可在线阅读,更多相关《主成分分析法例子精选课件.ppt(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于主成分分析法例子第一页,本课件共有20页一、主成分分析的基本原理 v假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵(1)第二页,本课件共有20页v降维处理!当p较大时,在p维空间中考察问题比较麻烦。降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。第三页,本课件共有20页定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标(2)第四页,本课件共有20页v系数lij的确定原则:zi与zj(ij;i,j=1,2,m)相互无关;z1是x1,x2,xP的一切线性组
2、合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者;zm是与z1,z2,zm1都不相关的x1,x2,xP,的所有线性组合中方差最大者。则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分。第五页,本课件共有20页 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,p)在诸主成分zi(i=1,2,m)上的载荷 lij(i=1,2,m;j=1,2,p)。从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量。第六页,本课件共有20页二、计算步骤(一)计算相关系数矩阵(一)计算相关系数矩阵 ri
3、j(i,j=1,2,p)为原变量xi与xj的相关系数,rij=rji,其计算公式为:(3)(4)第七页,本课件共有20页 (二)计算特征值与特征向量:(二)计算特征值与特征向量:解特征方程,求出特征值,并使其按大小顺序排列;分别求出对应于特征值的特征向量 ,要求=1,即,其中表示向量 的第j个分量。第八页,本课件共有20页 计算主成分贡献率及累计贡献率 贡献率:累计贡献率:一般取累计贡献率达8595%的特征值所对应的第一、第二、第m(mp)个主成分。第九页,本课件共有20页(6)各主成分的得分第十页,本课件共有20页三、主成分分析方法应用实例表表1 1 某农业生态经济系统各区域单元的有关数据某
4、农业生态经济系统各区域单元的有关数据 第十一页,本课件共有20页第十二页,本课件共有20页步骤如下:(1)将表1中的数据作标准差标准化处理,然后将它们代入公式(4)计算相关系数矩阵(见表2)。表表2 2相关系数矩阵相关系数矩阵 第十三页,本课件共有20页 (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)。由表3可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。第十四页,本课件共有20页表表3 3特征值及主成分贡献率特征值及主成分贡献率 第十五页,本课件共有20页 (3)对于特征值=4.
5、6610,=2.0890,=1.0430分别求出其特征向量l1,l2,l3。第十六页,本课件共有20页表表4 4 主成分载荷主成分载荷 第十七页,本课件共有20页 第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量。分析:分析:第十八页,本课件共有20页显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,x9),描述农业生态经济系统,可以使问题更进一步简化、明了。第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构。第十九页,本课件共有20页感谢大家观看第二十页,本课件共有20页
限制150内