怎样用做Eviews主成分分析和因子分析ppt课件.ppt
《怎样用做Eviews主成分分析和因子分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《怎样用做Eviews主成分分析和因子分析ppt课件.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分1 在建立多元回归模型时,为了更准确地反映事物的特在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生重叠,甚至会抹杀事物的真性,使得数据提供的信息发生重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所正特征。为了解决这
2、些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。本章介息分解为互不相关的部分以获得更有意义的解释。本章介绍的主成分分析和因子分析可用于解决这类问题。绍的主成分分析和因子分析可用于解决这类问题。 变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分2 主成分分析(主成分分析(principal components analysis,简称,简称PCA)是由霍特林()是由霍特林(Hotel
3、ling)于)于1933年首先提出的。年首先提出的。它通过投影的方法,实现数据的降维,在损失较少数它通过投影的方法,实现数据的降维,在损失较少数据信息的基础上把多个指标转化为几个有代表意义的据信息的基础上把多个指标转化为几个有代表意义的综合指标。综合指标。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分3 假如对某一问题的研究涉及假如对某一问题的研究涉及 p 个指标,记为个指标,记为X1,X2, , Xp,由这,由这 p 个随机变量构成的随机向量为个随机变量构成的随机向量为X=(X1, X2, , Xp)
4、,设设 X 的均值向量为的均值向量为 ,协方差矩阵为,协方差矩阵为 。设。设Y=(Y1, Y2 , , Yp) 为对为对 X 进行线性变换得到的合成随机向量,即进行线性变换得到的合成随机向量,即 (13.1.1) 设设 i=( i1, i2 , , ip) ,( ), A=( 1 , 2 , p) ,则有,则有 (13.1.2)ppppppppXXXYYY2121222211121121AXY pi,2,1变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分4且且 (13.1.3) 由式(由式(13.1.1)和
5、式()和式(13.1.2)可以看出,可以对原始变)可以看出,可以对原始变量进行任意的线性变换,不同线性变换得到的合成变量量进行任意的线性变换,不同线性变换得到的合成变量Y的的统计特征显然是不一样的。每个统计特征显然是不一样的。每个Yi 应尽可能多地反映应尽可能多地反映 p 个原个原始变量的信息,通常用方差来度量始变量的信息,通常用方差来度量“信息信息”,Yi 的方差越大的方差越大表示它所包含的信息越多。由式(表示它所包含的信息越多。由式(13.1.3)可以看出将系数)可以看出将系数向量向量 i 扩大任意倍数会使扩大任意倍数会使Yi 的方差无限增大,为了消除这种的方差无限增大,为了消除这种不确定
6、性,增加约束条件:不确定性,增加约束条件:pjiYYpiYjijiii,2,1,),cov(,2,1)var(i1iaai变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分5 为了有效地反映原始变量的信息,为了有效地反映原始变量的信息,Y的不同分量包含的的不同分量包含的信息不应重叠。综上所述,式(信息不应重叠。综上所述,式(13.1.1)的线性变换需要满)的线性变换需要满足下面的约束:足下面的约束: (1) ,即,即 ,i =1, 2, , p。 (2) Y1在满足约束在满足约束 (1) 即的情况下,方差最大
7、;即的情况下,方差最大;Y2是在满是在满足约束足约束(1) ,且与,且与Y1不相关的条件下,其方差达到最大;不相关的条件下,其方差达到最大;Yp是在满足约束是在满足约束(1) ,且与,且与Y1,Y2,Y p-1不相关的条件下,不相关的条件下,在各种线性组合中方差达到最大者。在各种线性组合中方差达到最大者。 满足上述约束得到的合成变量满足上述约束得到的合成变量Y1, Y2, , Yp分别称为原始分别称为原始变量的第一主成分、第二主成分、变量的第一主成分、第二主成分、第、第 p 主成分,而且各主成分,而且各成分方差在总方差中占的比重依次递减。在实际研究工作中,成分方差在总方差中占的比重依次递减。在
8、实际研究工作中,仅挑选前几个方差较大的主成分,以达到简化系统结构的目仅挑选前几个方差较大的主成分,以达到简化系统结构的目的。的。122221ipiiaaa1iaai变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分6 13.1.1节中提到主成分分析的基本思想是考虑合成节中提到主成分分析的基本思想是考虑合成变量的方差大小及其对原始变量波动变量的方差大小及其对原始变量波动(方差方差)的贡献大小,的贡献大小,而对于原始随机变量而对于原始随机变量X1,X2,Xp,其协方差矩阵,其协方差矩阵或相关矩阵正是对各变量离散程
9、度和相关程度的度量。或相关矩阵正是对各变量离散程度和相关程度的度量。在实际求解主成分时,一般从原始变量的协方差矩阵在实际求解主成分时,一般从原始变量的协方差矩阵或相关矩阵的结构分析出发。或相关矩阵的结构分析出发。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分7 设设 1是任意是任意 p 1向量,求解主成份就是在约束条件向量,求解主成份就是在约束条件 下,下,求求 X 的线性函数的线性函数 使其方差使其方差 达到最大,达到最大,即达到最大,且即达到最大,且 ,其中,其中 是随机变量向量是随机变量向量X =(
10、X1, X2, , Xp) 的协方差矩阵。设的协方差矩阵。设 1 2 p 0 为为 的特征值,的特征值,e1 , e2 , ep为为 矩阵各特征值对应的标准正交特征向量,则对于任矩阵各特征值对应的标准正交特征向量,则对于任意的意的ei 和和 ej,有,有 (13.1.4)且且 (13.1.5)Xa11Y1iaai111)var(aaY1iaaijijiji, 0, 1ee,1piiiieeIeeipii1变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分8因此因此 (13.1.6)当当 1 = e1 时有时有
11、 (13.1.7)此时此时 达到最大值为达到最大值为 1。同理有。同理有 并且并且 (13.1.8)1111111111111)()(Iaaaeeaaeeaaapiiipiiii111111111eeeeee111)var(aaYii)var( Xepjijijjiji, 2, 1, 0),cov(eeeeXeXe变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分9 由上述推导得由上述推导得 (13.1.9) 可见可见Y1, Y2, , Yp 即为原始变量的即为原始变量的 p 个主成份。因此,主个主成份。因此
12、,主成分的求解转变为求成分的求解转变为求 X1, X2, , Xp 协方差矩阵协方差矩阵 的特征值和特的特征值和特征向量的问题。征向量的问题。 XeXeXeppYYY,2211变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分10 Y的协方差矩阵为对角阵的协方差矩阵为对角阵 ,即,即 (13.1.10) 设设 =( ij)pp是随机变量向量是随机变量向量 X 的协方差矩阵,可的协方差矩阵,可得得即即 p00)var(1YpiipiiYX11)var()var(piipiii11变电站电气主接线是指变电站的变压
13、器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分11 由此可见,主成分分析是把由此可见,主成分分析是把 p 个随机变量的总方差分解为个随机变量的总方差分解为 p 个不相关随机变量的方差之和个不相关随机变量的方差之和 1 2 P,则总方差,则总方差中属于第中属于第 i 个主成分(被第个主成分(被第 i 个主成分所解释)的比例为个主成分所解释)的比例为 (13.1.12)称为第称为第 i 个主成分的贡献度。定义个主成分的贡献度。定义 (13.1.13)称为前称为前 m 个主成分的累积贡献度,衡量了前个主成分的累积贡献度,衡量了前 m 个主成份
14、对原个主成份对原始变量的解释程度。始变量的解释程度。pi21pmpiimjj11变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分12记第记第k个主成分个主成分 Yk 与原始变量与原始变量 Xi 的相关系数为的相关系数为r(Yk,Xi),称为因子载荷,或者因子负荷量,则有,称为因子载荷,或者因子负荷量,则有 (13.1.14)pkieeXYXYXYriikkiiikkikikikik,2, 1,)var()var(),cov(),(变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配
15、电任务。变电站的主接线是电力系统接线组成中一个重要组成部分13 在实际应用时,为了消除原始变量量纲的影响,通常将在实际应用时,为了消除原始变量量纲的影响,通常将数据标准化。考虑下面的标准化变化,令数据标准化。考虑下面的标准化变化,令 (13.1.15)其中其中 i, ii 分别表示随机变量分别表示随机变量 Xi 的期望与方差,则的期望与方差,则 piXZiiiii,2, 1,1)var(,0)(iiZZE变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分14 原始变量的相关矩阵就是原始变量标准化后的协方差原始
16、变量的相关矩阵就是原始变量标准化后的协方差矩阵,因此,由相关矩阵求主成分的过程与由协方差矩阵矩阵,因此,由相关矩阵求主成分的过程与由协方差矩阵求主成分的过程是一致的。如果仍然采用(求主成分的过程是一致的。如果仍然采用(i ,ei)表示)表示相关矩阵相关矩阵R对应的特征值和标准正交特征向量,根据式对应的特征值和标准正交特征向量,根据式(13.1.9)有:)有: (13.1.17) 由相关矩阵求得的主成分仍然满足性质由相关矩阵求得的主成分仍然满足性质13。性质。性质3可可以进一步表示为:以进一步表示为: (13.1.18))()(12/1XVeZeiiiYpi,2,1pkieZYrkkiik,2,
17、 1,),(变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分15 在实际工作中,我们通常无法获得总体的协方差矩阵在实际工作中,我们通常无法获得总体的协方差矩阵 和相关矩阵和相关矩阵R。因此,需要采用样本数据来估计。设从均值。因此,需要采用样本数据来估计。设从均值向量为向量为 ,协方差矩阵为,协方差矩阵为 的的 p 维总体中得到的维总体中得到的 n 个样本,个样本,且样本数据矩阵为且样本数据矩阵为 (13.1.19)npnnppnxxxxxxxxx21222211121121),(xxxx变电站电气主接线是指
18、变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分16则样本协方差矩阵为:则样本协方差矩阵为: (13.1.20)其中其中: (13.1.21)样本相关矩阵为:样本相关矩阵为: (13.1.22) 样本协方差矩阵样本协方差矩阵 S 是总体协方差矩阵是总体协方差矩阵 的无偏估计量,样的无偏估计量,样本相关矩阵本相关矩阵 是总体相关矩阵是总体相关矩阵 R 的估计量。的估计量。ppijnkkksn)()(111xxxxSjkjnkikiijnkkiipxxxxnspixnxxxx1121)(11,2, 11),(x,)(ppijrRj
19、jiiijijsssr R变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分17 由于采用相关矩阵和协方差矩阵求解主成分的过程基本由于采用相关矩阵和协方差矩阵求解主成分的过程基本一致,因此本节仅介绍基于样本相关矩阵求解主成分的过程。一致,因此本节仅介绍基于样本相关矩阵求解主成分的过程。设样本相关矩阵设样本相关矩阵 的特征值为的特征值为 ,且,且与特征值相对应的标准正交特征向量为与特征值相对应的标准正交特征向量为 ,根据式,根据式(13.1.17)第)第 i 个样本主成分可表示为:个样本主成分可表示为: (13
20、.1.23)而且而且 (13.1.24) (13.1.25) Rp,21021ppeee,21pipiieeexxxxeyii2211pi,2,1pkikik,2,1,0),cov(yyipii,2,1,)var(iy变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分18且由式(且由式(13.1.16)和性质)和性质2可得可得 (13.1.26) 则第则第i个样本主成分的贡献度为个样本主成分的贡献度为 ,前,前m个样本主成份的累个样本主成份的累计贡献度为计贡献度为 另外另外 (13.1.27)piiipiis
21、p11iikkiiksexyr),(pipmii/1变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分19 主成分分析的目的之一是减少变量的个数,但是对于应主成分分析的目的之一是减少变量的个数,但是对于应保留多少个主成分没有确切的回答。通常需要综合考虑样本保留多少个主成分没有确切的回答。通常需要综合考虑样本总方差的量、特征值的相对大小以及各成分对现实的阐述。总方差的量、特征值的相对大小以及各成分对现实的阐述。一般所取一般所取 m 使得累积贡献率达到使得累积贡献率达到85%以上为宜。以上为宜。 另一个比较常用的
22、可视的方法是碎石图,首先将特征值另一个比较常用的可视的方法是碎石图,首先将特征值 按照从大到小的顺序进行排列,碎石图是特征值与相应序号按照从大到小的顺序进行排列,碎石图是特征值与相应序号i的(的(i, )图形,其中横轴表示序号,纵轴表示特征值)图形,其中横轴表示序号,纵轴表示特征值 。为了确定主成分的合适个数,选择碎石图斜率变化较大的拐为了确定主成分的合适个数,选择碎石图斜率变化较大的拐弯点,通常在此序号之后的特征值取值比较小,则此序号作弯点,通常在此序号之后的特征值取值比较小,则此序号作为主成分的个数。例如,图为主成分的个数。例如,图13.1所示的碎石图在所示的碎石图在 i=2 处拐弯,处拐
23、弯,则则 m 选择选择2。第三个经验的判断方法是只保留那些方差大于。第三个经验的判断方法是只保留那些方差大于1的主成分。的主成分。iii变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分20 本例从一批对景气变动敏感,有代表的指标中筛选出本例从一批对景气变动敏感,有代表的指标中筛选出5个反个反应宏观经济波动的一致指标组:工业增加值增速(应宏观经济波动的一致指标组:工业增加值增速(iva)、工业)、工业行业产品销售收入增速(行业产品销售收入增速(sr)、固定资产投资增速()、固定资产投资增速(if)、发电)、发
24、电量增速(量增速(elec)和货币供应量)和货币供应量M1增速(增速(m1),样本区间从),样本区间从1998年年1月月2006年年12月,为了消除季节性因素和不规则因素,采用月,为了消除季节性因素和不规则因素,采用X-12方法进行季节调整。常用的方法是美国商务部采用的计算方法进行季节调整。常用的方法是美国商务部采用的计算合成指数合成指数CI的方法。特别的,本例利用主成分分析降维的思想,的方法。特别的,本例利用主成分分析降维的思想,提取主成分(提取主成分(PCA),并与合成指数),并与合成指数CI的结果进行比较。的结果进行比较。变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,
25、从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分21 本节以例本节以例13.1的数据为例,介绍的数据为例,介绍EViews软件中主成软件中主成分分析的实现过程。首先将所涉及的变量建成一个组分分析的实现过程。首先将所涉及的变量建成一个组(g1),选择组菜单的选择组菜单的View/Principal Components.,出现如图,出现如图13.6所示的窗口。在窗口中有两个切换钮:第一个钮标着所示的窗口。在窗口中有两个切换钮:第一个钮标着Components,第二个钮标着,第二个钮标着Calculation,控制着组中各,控制着组中各序列离差矩阵的计算和估计。默认的,序列离
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 怎样 用做 Eviews 成分 分析 因子分析 ppt 课件
限制150内