Chp8因子分析.pptx
《Chp8因子分析.pptx》由会员分享,可在线阅读,更多相关《Chp8因子分析.pptx(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 在科学研究中,需要对反在科学研究中,需要对反映事物的多个变量进行大量的映事物的多个变量进行大量的观测,收集大量数据以便进行观测,收集大量数据以便进行分析寻找规律。分析寻找规律。多变量大样本在提供丰富多变量大样本在提供丰富信息的同时,一定程度上也增信息的同时,一定程度上也增加了数据采集的工作量,更重加了数据采集的工作量,更重要的是在大多数情况下,许多要的是在大多数情况下,许多变量之间可能存在相关性而增变量之间可能存在相关性而增加了问题分析的复杂性,对分加了问题分析的复杂性,对分析带来不便。析带来不便。如果分别分析每个指标,如果分别
2、分析每个指标,分析又可能是孤立的,而不是分析又可能是孤立的,而不是综合的。综合的。盲目减少指标会损失很多盲目减少指标会损失很多信息,容易产生错误的结论。信息,容易产生错误的结论。出路:出路:找到一种方法,在减少找到一种方法,在减少分析指标的同时,尽量减少原分析指标的同时,尽量减少原指标包含信息的损失,对所收指标包含信息的损失,对所收集的资料作全面的分析。集的资料作全面的分析。由于各变量间存在一定的由于各变量间存在一定的相关关系,因此有可能用较少相关关系,因此有可能用较少的综合指标分别综合存在于各的综合指标分别综合存在于各变量中的各类信息。变量中的各类信息。因子分析就是从多个变量因子分析就是从多
3、个变量指标中选择出少数几个综合变指标中选择出少数几个综合变量指标的一种降维的多元统计量指标的一种降维的多元统计分析方法。分析方法。Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 固定资产利税率固定资产利税率资金利税率资金利税率销售收入利税率销售收入利税率资金利税率资金利税率固定资产产值率固定资产产值率流动资金周转天数流动资金周转天数万元产值能耗万元产值能耗全员劳动生产率全员劳动生产率观测变量观测变量盈利能力盈利能力产值能耗产值能耗 资金和人资金和人力利用力利用公共因子公共因子Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 1 1一个分类问题一个分类问题 在碳
4、酸岩的分类研究中,用在碳酸岩的分类研究中,用其中其中C C、O O、CaCa、MgMg、SiSi等元素等元素的含量,而不考虑各元素相互的含量,而不考虑各元素相互间的内在联系,分类效果不好。间的内在联系,分类效果不好。如果考虑元素间的内在联系,如果考虑元素间的内在联系,例如用例如用CaCOCaCO3 3、MgCOMgCO3 3、SiOSiO2 2三个三个因素来进行研究,则可取得很因素来进行研究,则可取得很好的效果。好的效果。Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 2 2问题的延伸问题的延伸 用三个组合比用用三个组合比用5 5个元素研究碳酸个元素研究碳酸岩岩合理,易于解释
5、。合理,易于解释。可以把可以把C C、O O、CaCa、MgMg、SiSi看成原始变量,把看成原始变量,把CaCOCaCO3 3、MgCOMgCO3 3、SiOSiO2 2看成是原始变量的组合,它们是新变量看成是原始变量的组合,它们是新变量(公共因子)(公共因子),更反映事物的本质。,更反映事物的本质。从多个变量(从多个变量(5 5个)减少为少数变量(个)减少为少数变量(3 3个)有利于研个)有利于研究。究。Chp.8因子分析因子分析8.1概述概述 新变量的组合可表示为:新变量的组合可表示为:Fj=j1x1+j2x2+jpxpF1(CaCO3)=11Ca+12C+13O+14Mg+15Si F
6、2(MgCO3)=21Ca+22C+23O+24Mg+25Si F3(SiO2)=31Ca+32C+33O+34Mg+35Si反过来,也可用三个组合表示原始变量,来研究组反过来,也可用三个组合表示原始变量,来研究组合与原始变量的关系:合与原始变量的关系:Zj=aj1F1+aj2F2+ajmFm+j jUj如对如对Si,可用,可用Si=a51F1+a52F2+a53F3Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 因子分析的任务,就是分析、表征事物的属性与因子分析的任务,就是分析、表征事物的属性与其影响因素之间的数据结构和关系,达到简化问其影响因素之间的数据结构和关系,达到简
7、化问题、突出事物本质的目的。题、突出事物本质的目的。Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 因子分析主要是由心理学家发展起来的,由因子分析主要是由心理学家发展起来的,由ChalesSpearman于于1904年提出,主要用于智力测验年提出,主要用于智力测验得分的统计分析。得分的统计分析。19571957年年,KrumbeinKrumbein将因子分析方法将因子分析方法从心理学研究从心理学研究引入岩石学,它是把一些具有复杂关系的样品或变量引入岩石学,它是把一些具有复杂关系的样品或变量归结为少数几个综合因归结为少数几个综合因子,然后进行进一步的研究。子,然后进行进一步的研
8、究。目前因子分析在心理学、社会学、经济学、人口目前因子分析在心理学、社会学、经济学、人口学、地质学和教育学中都取得了成功的应用。学、地质学和教育学中都取得了成功的应用。3 3因子分析的基本思想因子分析的基本思想Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 从数学角度而言,因子分析是一种寻找潜在支配从数学角度而言,因子分析是一种寻找潜在支配因子的模型分析方法,其实质就是因子的模型分析方法,其实质就是一种降维的多元统一种降维的多元统计方法计方法。其特点包括:。其特点包括:3 3因子分析的基本思想因子分析的基本思想 通过数学方法把数目较多的原始变量进行变换,通过数学方法把数目较多
9、的原始变量进行变换,找到一些新变量(组合);找到一些新变量(组合);新变量较原始变量数目少得多,且使原来复杂新变量较原始变量数目少得多,且使原来复杂的关系相对简单化,有助于了解自然现象的规律,在的关系相对简单化,有助于了解自然现象的规律,在变量多、数据量大时更具优点。变量多、数据量大时更具优点。少数组合能尽量反映原来多变量的信息,它们少数组合能尽量反映原来多变量的信息,它们又彼此正交,便于对变量进行分类解释。又彼此正交,便于对变量进行分类解释。Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 有两种主要的分析方法:有两种主要的分析方法:R R型因子分析:型因子分析:研究变量之间
10、的相互关系,通过对变量研究变量之间的相互关系,通过对变量间的相关系数阵的内部结构的研究,找出控制着所有间的相关系数阵的内部结构的研究,找出控制着所有变量的几个主成分,所以又称变量的几个主成分,所以又称主成分分析主成分分析(PrincipalComponentAnalysis)。Q Q型因子分析:型因子分析:研究样品间的相关关系,通过对样品间研究样品间的相关关系,通过对样品间的相似系数阵的内部结构的研究,找出控制着所有样的相似系数阵的内部结构的研究,找出控制着所有样品的几个主要因素,所以又称品的几个主要因素,所以又称主因素分析主因素分析。4 4因子分析的主要方法因子分析的主要方法 Chp.8 C
11、hp.8 因子分析因子分析8.1 8.1 概述概述 归归纳纳综综合合地地质质现现象象,剔剔除除原原始始观观测测值值中中重重复的成分,用更简练的形式描述地质现象。复的成分,用更简练的形式描述地质现象。用于研究诸如成因、成岩、共生组合、指用于研究诸如成因、成岩、共生组合、指示元素等地质问题。示元素等地质问题。5 5因子分析的因子分析的地质学地质学用途用途 Chp.8 Chp.8 因子分析因子分析8.1 8.1 概述概述 进行因子分析进行因子分析前前,必须对数据进行初始化必须对数据进行初始化:6 6进行因子分析进行因子分析的前提的前提标准化后数据的均值为标准化后数据的均值为0 0,标准差为,标准差为
12、1 1。这时,变量这时,变量j j与与k k之间的相关系数为之间的相关系数为 设原始数据为设原始数据为x xjiji,j=1,n(,j=1,n(变量变量),i=1,N(i=1,N(样品样品)标准化后的数据为:标准化后的数据为:其中其中:Chp.8因子分析因子分析8.2因子分析的基本原理因子分析的基本原理 设有设有N个样品,每个样品有个样品,每个样品有n个变量(个变量(x1,xn),它们有它们有m个综合因子,记为个综合因子,记为F1,F2,Fm(m=n)1主因子(主成分、主因素)的几何意义主因子(主成分、主因素)的几何意义F1F2为了方便,现设有两个变量为了方便,现设有两个变量x1,x2对于二元
13、正态分布变量,对于二元正态分布变量,N个点的散个点的散布点大致为一椭圆,若在椭圆长轴布点大致为一椭圆,若在椭圆长轴方向取坐标方向取坐标F1,短轴方向取,短轴方向取F2,相当,相当于作了一个坐标变换于作了一个坐标变换(x1F1,x2F2)Chp.8因子分析因子分析8.2因子分析的基本原理因子分析的基本原理 变换后的坐标有如下性质:变换后的坐标有如下性质:)N个样品点的坐标个样品点的坐标F1,F2的相关性的相关性0)N个点的波动(方差)大部分可以归结为个点的波动(方差)大部分可以归结为F1轴上轴上的波动,而的波动,而F2上波动上波动趋近于趋近于0。)F1,F2为为x1,x2的综合因子的综合因子X1
14、=a11F1+a12F2X2=a21F1+a22F21主因子(主成分、主因素)的几何意义主因子(主成分、主因素)的几何意义当图中椭圆很扁平时,当图中椭圆很扁平时,可可只考虑只考虑F1上的波动,忽略上的波动,忽略F2上的波动,这样,二维可以降为一维。上的波动,这样,二维可以降为一维。Chp.8因子分析因子分析8.2因子分析的基本原理因子分析的基本原理 把两个变量推广到把两个变量推广到n个变量个变量(x1,x2,xn),将它们综,将它们综合成合成m个综合因子时,则原始变量:个综合因子时,则原始变量:Zj=aj1F1+aj2F2+ajmFm+j jUj而综合因子:而综合因子:F1=11x1+12x2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Chp8 因子分析
限制150内