主成分分析法教案.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《主成分分析法教案.pdf》由会员分享,可在线阅读,更多相关《主成分分析法教案.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-主成分分析法主成分分析法一、主成分分析一、主成分分析(prpacomnntsanlysi)也称为主分量分析,是由 Holing 于93年首先提出的。主成分分析是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法。二、应用背景二、应用背景:对同一个体进行多项观察时,必定涉及多个随机变量 1,X2,Xp,它们都是相关的,一时难以综合。这时就需要借助主成分分析(pricipl opoent anals)来概括诸多信息的主要方面。我们希望有一个或几个较好的综合指标来概括信息,而且希望综合指标互相独立地各代表某一方面的性质。任何一个度量指标的好坏除了可靠、真实之外,还必须能充分反映个体间
2、的变异。如果有一项指标,不同个体的取值都大同小异,那么该指标不能用来区分不同的个体。由这一点来看,一项指标在个体间的变异越大越好。因此我们把“变异大”作为“好”的标准来寻求综合指标。例、例、考察对象股票业绩(这里单个股票为观察个体这里单个股票为观察个体)。(1)确定影响股票业绩主要因素:主营业务收入(X1),主营业务利润(X2)利润总额(X),净利润(X4),总资产(X5),净资产(X6),净资产收益率(X7),每股权益(X8),每股收益(9),每股公积金(X0),速动比率(X11)作为变量。因此对单个股票来说,用 11 个随机变量综合刻化。但这些因素过多,各因素区别不明显,有交叉反映。通过主
3、成分分析,可降为少数几个综合指标加以刻化。(2)考察 20 支不同的股票。从数学角度看,每种影响因素是随机变量(Xi),观察一支股票便得到影响该股票的 11 个随机变量取值;观察 20 支股票,便得到了 211 的原始数据阵 X21(略)。三、问题三、问题:作为主成分?严格的数学定义?相应的性质有哪些?主成分取多少?、主成分的一般定义、主成分的一般定义X设有随机变量 X,,Xp,其样本均数记为X1,X2,p,样本标准差记为 S,2,Sp。首先作标准化变换X XxS我们有如下的定义:22a11a12a12p1 (1)若 x+a12x2+a1pxp,,且使Var(Y1)最大,则称 Y1 为第一主成
4、分;(2)若Y=a21x1a22x2+a2px222a21a22a2p1,(a21,a22,a2p)垂直于(a11,a12,a1p),且使a(Y2)最大,则称 Y2 为第二主成分;()类似地,可有第三、四、五主成分,至多有 p 个。-2 2、主成分的性质、主成分的性质:1,2,Yp 具有如下几个性质(1)主成分间互不相关,即对任意 i 和 j,i 和 Yj 的相关系数Corr(Yi,Yj)0 ()组合系数(i1,i2,ip)构成的向量为单位向量,(3)各主成分的方差是依次递减的,即Var(Y)V(Y2)Va(Y)(4)总方差不增不减,即Var(Y1)Var(Y2)+a(Yp)Var(1)+Vr
5、(x2)+Va(xp)这一性质说明这一性质说明:主成分是原变量的线性组合,是对原变量信息的一种改组,主成分不增加总信息量,也不减少总信息量。Var(Yi)(5)主成分和原变量的相关系数 Cor(Yi,x)=ijaii()令 X,X2,p 的相关矩阵为 R,(1,ai2,,ip)则是相关矩阵 R 的第个特征向量(eignetor)。而且,特征值i 就是第 i 主成分的方差,即ar(Y)=i其中i 为相关矩阵的第 i 个特征值(eigevale)1p3 3、主成分的数目的选取、主成分的数目的选取前已指出,设有 p 个随机变量,便有 p 个主成分。由于总方差不增不减,Y1,Y2等前几个综合变量的方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 教案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内