主成份分析法用于评价需注意的若干问题.pdf
《主成份分析法用于评价需注意的若干问题.pdf》由会员分享,可在线阅读,更多相关《主成份分析法用于评价需注意的若干问题.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、文章编号:1006?8309(2002)01?0030?04?作者简介:陈伟(1971?),男,重庆人,讲师,博士,主要从事运筹学与控制论、系统工程、评价理论、优化理论等研究。主成份分析法用于评价需注意的若干问题陈伟(中国科学技术大学数学系,安徽 合肥 230026)?摘要:文章首先指出主成份分析法的原理,然后分析了主成份分析的若干特性,最后指出主成份分析法应用于评价中需注意的若干问题。关键词:主成份分析;评价;问题中图分类号:O 212.4?文献标识码:A1?引言主成份分析是一种常用的多元统计方法,它在社会经济、企业管理及地质、生化、医药等各个领域中都有着广泛的应用,如服装行业的服装定型、企
2、业的经济效益分析、新开发项目目标的制订等问题 1,2。主成份分析的目标,就是要对多变量的高维系统进行最佳简化。也就是说,要在力保数据信息丢失最少的原则下,对高维变量空间进行降维处理 3。设评价问题有 p个指标 x1,x2,?,xp,这p 个指标反映了评价对象的各个属性,因此每个对象观察到的 p 个指标值就是一个样本值,它是一个p 维的向量。如果有 n 个对象,就有 n 个 p 维向量,用矩阵 X 表示就有X=x11?x12?x1px21?x22?x2p?.?.?.?.?.?.?.?.?.xn1?xn2?xnp?若把 p 个指标 x1,x2,?,xp看成随机变量,它们的期望值和协方差矩阵是Ex=
3、Ex1x2.xp=?1?2.?pV=(vij)=(Cov(xi,xj)=v11v12?v1pv21v22?v2p.?.?.?.?.?.?.vp1vp2?vppvij就是第 i 个变量的方差,因此这 p 个变量总的变化状况可以用?pi=1vij来反映(实际中,V 可以由样本矩阵 X 近似求出)。现在的问题是,能否找到一组新的变量 y1,y2,?,ym(m p),使yj=Lj?x,?j=1,?,mLj?R=?L:L?L=1?(R 称为 p 维正则化向量的集合)满足:?y1是一切形如 y=L?x 中方差达到最大者(L?R)?y2是一切形如 y=L?x 中与 y1不相关且方差达到最大者(L?R)?yk
4、是一切形如y=L?x 中与y1,?,yk-1都不相关而方差达到最大者(L?R),k=3,4,?,m该问题就是求 max V?r(y)=V?r(L?x)=L?VLs.t.?L?L=1用拉格朗日乘数法,建立目标函数Q=L?VL-?(L?L-1)于是?Q?L=2VL-2?L?30?人类工效学?2002年 3 月第 8卷第 1 期由?Q?L=0,有?VL=?L,L?L=1,这表明 L 是矩阵V 的特征向量,利用上式,有V?r(y)=L?VL=?L?L=?也即特征根?就是变量y 的方差。因此只要求出最大特征根对应的特征向量 L,主成份就可解出。这样求出的新变量 y1,y2,?,ym均是原变量x1,x2,
5、?,xp的线性组合(m 0由前?(y1,xj)=?1vij?l1j?j=1,?,p因为 L1 0,所以?(y1,xj)0?j=1,?,p。也就是说 y1与所有的 xj都正相关。这时,当 y1取较大值时,说明样本点在所有指标上的取值都是比较向前的。只有在这时,第一主分量 y1才能作为评价指数。相反,如果该前提条件不满足,在原变量系统中,一部分变量正相关,而另一部分变量负相关,则无法保证 L1 0,y1也就不能作为评价指数。事实上,在实际问题中求出的第一主分量 y1的各个系数往往均相差不大,就是因为所有变量xj都正相关。不妨假设一种极端的情况,即所有变量(标准化后)都以概率 1 线性正相关,则有协
6、方差阵V=1?1?11?1?1.?.?.?.?.?.?.1?1?1p?p这时最大特征根?1=?max=p相应的特征向量L1?=(l11,l12,?,l1p)有l11=l12=?=l1p又?L?L=1所以l11=l12=?=l1p=1p3.2?第一主分量不一定是希望的评价综合表达式主成份分析的第一主分量 y1对应于原数据变异最大的方向,在 y1上样本点间的离差取到最大,但它并不一定代表希望的评价综合。试以一例以说明。设评价系统有同等重要的相互独立的两个属性 x?,x?。对 x?若用两个完全相同的变量 x1=x2来描述。而对 x?,则仅用一个变量 x3来描述。设 xj,j=1,2,3 均为标准化变
7、量,则可得协方差距阵R=1?1?01?1?00?0?1R 的特征值为?1=2,?2=1,?3=0相应的特征向量为L1?=(22,22,0)L2?=(0,0,1)L3?=(0,0,0)三个主分量分别为:y1=22x1+22x2y2=x3y3=0以二维变量系统 y1,y2来表示原三维变量系统,其精确度为100%。而第一主分量 y1的贡献率就占了 2?3?67%。如果以第一主分量 y1作为系统评价指数,则 x3被完全忽略掉了,而它恰好表示了系统的第二个主要属性 x?。因此仅用 y1并不一定能得到正确的评价结果。3.3?主成份分析并不能消除变量多重共线性的影响由前分析,可知主分量存在如下性质:?均值为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成份 分析 用于 评价 注意 若干问题
限制150内