第10章-SPSS-20.0主成分分析与因子分析PPT.ppt
《第10章-SPSS-20.0主成分分析与因子分析PPT.ppt》由会员分享,可在线阅读,更多相关《第10章-SPSS-20.0主成分分析与因子分析PPT.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第10章主成分分析与因子分析主成分分析的概念主成分分析的概念主成分分析的数学模型主成分分析的数学模型因子分析因子分析的概念的概念因子分析数学模型因子分析数学模型第10章主成分分析与因子分析实际工作中,为了全面系统地反映问题,往往收集的变量实际工作中,为了全面系统地反映问题,往往收集的变量较多,但这样就会经常出现所收集的变量间存在较强相关较多,但这样就会经常出现所收集的变量间存在较强相关关系的情况。这些变量间存在着较多的信息重复,直接用关系的情况。这些变量间存在着较多的信息重复,直接用它们分析现实问题,不但模型复杂,还会因为变量间存在它们分析现实问题,不但模型复杂,还会因为变量间存在的多重共线性
2、而引起极大的误差。的多重共线性而引起极大的误差。为了能够充分而有效的利用数据,通常希望用较少的新指为了能够充分而有效的利用数据,通常希望用较少的新指标代替原来较多的旧变量,同时要求这些新指标尽可能地标代替原来较多的旧变量,同时要求这些新指标尽可能地反映原变量的信息。主成分分析和因子分析正是解决此问反映原变量的信息。主成分分析和因子分析正是解决此问题最有效的多元统计方法,它们能够提取信息,使变量简题最有效的多元统计方法,它们能够提取信息,使变量简化降维,从而使问题更加简单直观,在经济、社会等领域化降维,从而使问题更加简单直观,在经济、社会等领域得到广泛应用。得到广泛应用。10.1 主成分分析的概
3、念主成分分析是考察多个变量间相关性的一种多元统计方法。主成分分析是考察多个变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量来解释多个变量间的内它是研究如何通过少数几个主分量来解释多个变量间的内部结构。部结构。也就是说,从原始变量中导出少数几个主分量,使它们尽也就是说,从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。可能多地保留原始变量的信息,且彼此间互不相关。主成分分析的应用目的可以被简单归结为两句话:数据的主成分分析的应用目的可以被简单归结为两句话:数据的压缩、数据的解释。它常被用来寻找判断某种事物或现象压缩、数据的解释。它常被用来寻找判断
4、某种事物或现象的综合指标,并且给综合指标所包含的信息以适当的解释,的综合指标,并且给综合指标所包含的信息以适当的解释,从而更加深刻的揭示事物的内在规律。从而更加深刻的揭示事物的内在规律。10.2 主成分分析的数学模型通常数学上的处理是将原来的个指标作线性组合,作为通常数学上的处理是将原来的个指标作线性组合,作为新的综合指标。新的综合指标。如果将选取的第一个线性组合即第一个综合指标记为,如果将选取的第一个线性组合即第一个综合指标记为,一般自然希望中尽可能多地反映原来指标的信息,这里一般自然希望中尽可能多地反映原来指标的信息,这里的的“信息信息”用什么表示呢?用什么表示呢?最经典的方法就是用的方差
5、来表达,即越大,则表示包最经典的方法就是用的方差来表达,即越大,则表示包含的信息越多。含的信息越多。因此在所有的线性组合中所选取的第因此在所有的线性组合中所选取的第1 1主成分应该是方差主成分应该是方差最大的。最大的。如果第如果第1 1主成分不足以完全代表原来个指标的信息,再考主成分不足以完全代表原来个指标的信息,再考虑选第虑选第2 2个线性组合,即第个线性组合,即第2 2主成分,主成分,依次类推可以造出第依次类推可以造出第3 3,第,第4 4,第个主成分。这,第个主成分。这些主成分间互不相关,且方差递减。些主成分间互不相关,且方差递减。在实际应用中,通常只选前面几个最大的主成分,在实际应用中
6、,通常只选前面几个最大的主成分,虽然这样损失了部分信息,但抓住了主要矛盾,虽然这样损失了部分信息,但抓住了主要矛盾,并从原始变量中进一步提取了某些信息,从而既并从原始变量中进一步提取了某些信息,从而既减少了变量的数目又抓住了主要矛盾,有利于问减少了变量的数目又抓住了主要矛盾,有利于问题的分析和处理。题的分析和处理。10.2.1 主成分模型中各统计量的意义()特征根:它可以被看成是主成分影响力度的指标,代表引入该主成分后可以解释平均多少原始变量的信息。如果特征根小于,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大。因此一般可以用特征根大于作为纳入标准。()主成分的方差贡献率:其计
7、算公式为表明主成分的方差在全部方差中的比重。这个值越大,表明主成分综合信息的能力越强。()累计贡献率()累计贡献率:前个主成分的累计贡献率定义:前个主成分的累计贡献率定义为,表示前面个主成分累计提取了多少的信息。为,表示前面个主成分累计提取了多少的信息。一般来说,如果前个主成分的贡献率达到一般来说,如果前个主成分的贡献率达到85,表明前个主成分基本包含了全部测量指标所具有表明前个主成分基本包含了全部测量指标所具有的信息,这样既减少了变量的个数又便于对实际的信息,这样既减少了变量的个数又便于对实际问题的分析和研究。问题的分析和研究。10.2.2 主成分分析的步骤主成分分析的步骤 主成分分析常常通
8、过以下步解决:主成分分析常常通过以下步解决:()对原来的个指标进行标准化,以消除变量在()对原来的个指标进行标准化,以消除变量在数量极或量纲上的影响。数量极或量纲上的影响。()根据标准化后的数据矩阵求出协方差或相关()根据标准化后的数据矩阵求出协方差或相关阵。阵。()求出协方差矩阵的特征根和特征向量。()求出协方差矩阵的特征根和特征向量。()确定主成分,结合专业知识给各主成分所蕴()确定主成分,结合专业知识给各主成分所蕴含的信息给予适当的解释。含的信息给予适当的解释。SPSS中没有把主成分分析作为一种独立的分析方中没有把主成分分析作为一种独立的分析方法,而是和因子分析共用一个过程,因此在法,而
9、是和因子分析共用一个过程,因此在SPSS中进行主成分分析时会输出许多因子分析中的结中进行主成分分析时会输出许多因子分析中的结果,但是这并不影响分析结果的准确性,而且相果,但是这并不影响分析结果的准确性,而且相应的输出都可以根据因子分析模型和主成分分析应的输出都可以根据因子分析模型和主成分分析模型之间的关系进行转换。模型之间的关系进行转换。10.2.3 主成分分析的用途主成分分析的用途如前所述,主成分分析往往会在大型研究中成为一个中间如前所述,主成分分析往往会在大型研究中成为一个中间环节,用于解决数据信息浓缩等问题,这就可能产生各种环节,用于解决数据信息浓缩等问题,这就可能产生各种各样的组合方法
10、。这里仅举最为典型的两种应用情况。各样的组合方法。这里仅举最为典型的两种应用情况。()主成分评价()主成分评价 在进行多指标综合评价时,由于要求评价结果客观、全面,在进行多指标综合评价时,由于要求评价结果客观、全面,就需要从各个方面用多个指标进行测量,但这样就使得观就需要从各个方面用多个指标进行测量,但这样就使得观测指标间存在信息重叠,同时还会存在量纲、累加时如何测指标间存在信息重叠,同时还会存在量纲、累加时如何确定权重系数等问题。为此就可以使用主成分分析方法进确定权重系数等问题。为此就可以使用主成分分析方法进行信息的浓缩,并解决权重的确定等问题。本章最后的综行信息的浓缩,并解决权重的确定等问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 10 SPSS 20.0 成分 分析 因子分析 PPT
限制150内