第八讲 主成分分析和因子分析精选文档.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第八讲 主成分分析和因子分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第八讲 主成分分析和因子分析精选文档.ppt(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八讲 主成分分析和因子分析本讲稿第一页,共十七页变变量量压压缩缩。主主成成分分分分析析通通过过线线性性变变换换,在在尽尽可可能能保保留留原原始始变变量量的的信信息息的的基基础础,降降低低维维度度,将将原原来来的的多多个个变变量量组组合合成成相相互互独独立立的的少少数数的的、新新的综合变量。的综合变量。变变量量解解释释。利利用用新新变变量量进进一一步步探探讨讨变变量量内内在在联联系和结构,利于简化和解释问题。系和结构,利于简化和解释问题。因因子子分分析析和和主主成成分分分分析析方方法法,往往往往是是更更复复杂杂的的统计分析方法的基础。统计分析方法的基础。Factor1.sav、Factor2.
2、sav 本讲稿第二页,共十七页二、主成分分析二、主成分分析1、基本原理、基本原理l统计信息实际上是指统计信息实际上是指数据变异信息数据变异信息l右图中,在椭圆的长轴右图中,在椭圆的长轴方向数据变异明显大于方向数据变异明显大于短轴方向短轴方向本讲稿第三页,共十七页F1F2F1与F2不相关l沿长、短轴方向设定沿长、短轴方向设定新坐标系,长轴变量新坐标系,长轴变量承载大部分变异信息,承载大部分变异信息,短轴变量承载少量变短轴变量承载少量变异信息异信息l一个长轴新变量一个长轴新变量F就可以代表原来两个就可以代表原来两个变量的主要信息,从变量的主要信息,从而起到降维作用而起到降维作用l在主成分分析中,提
3、在主成分分析中,提取出的每个新变量取出的每个新变量(主主成分成分)都是原来多个都是原来多个变量的线性组合变量的线性组合本讲稿第四页,共十七页如由两个原始变量如由两个原始变量X1和和X2,可提取两个主成分,可提取两个主成分:F1=a11X1+a21X2 F2=a12X 1+a22X2 依次类推:由依次类推:由N个原始变量可提取个原始变量可提取N个主成分,个主成分,但如果将它们全部提取出来就失去了该方法简但如果将它们全部提取出来就失去了该方法简化数据的实际意义化数据的实际意义一般情况下按贡献率由大到小,取累计贡献率一般情况下按贡献率由大到小,取累计贡献率达到达到85的前的前23个主成分,其他的忽略
4、不计。个主成分,其他的忽略不计。在进行主成分回归时,提取出的主成分能包含在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。主要信息即可,不一定要有准确的实际含义。本讲稿第五页,共十七页利用主成分进行综合评价:当进行多指标的利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,信息集中为若干个主成分,然后加权求和,得到综合评价指数。得到综合评价指数。利用主成分进行回归分析:通过对存在共线利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多性的自变
5、量进行主成分分析,从而在提取多数信息的同时解决共线性问题。数信息的同时解决共线性问题。2、应用、应用本讲稿第六页,共十七页与主成分分析相同,也是一种多变量化简、降与主成分分析相同,也是一种多变量化简、降维技术。维技术。在主成分分析时,要求提取出的主成分能包含在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中但在因子分析中,目的是分解原始变量,从中归纳出潜在的归纳出潜在的“类别类别”,相关性较强的指标归,相关性较强的指标归为一类,每一类变量代表了一个为一类,每一类变量代表了一个“共同因子
6、共同因子”,即一种内在结构。因子分析就是要寻找该结,即一种内在结构。因子分析就是要寻找该结构。构。在实际应用中,有时两者不加区分在实际应用中,有时两者不加区分三、因子分析三、因子分析1、概述、概述本讲稿第七页,共十七页 为了找出变量间内在结构,要求因子分析满足为了找出变量间内在结构,要求因子分析满足以下条件:以下条件:样本量样本量u样本量与变量数的比例应在样本量与变量数的比例应在5:15:1以上以上u总样本量最好大于总样本量最好大于100100,而且原则上越大越好,而且原则上越大越好各变量间必须有相关性各变量间必须有相关性uKMOKMO统计量统计量:在(在(0 0,1 1)之间,大于)之间,大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八讲 主成分分析和因子分析精选文档 第八 成分 分析 因子分析 精选 文档
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内