第六章多元统计PPT讲稿.ppt
《第六章多元统计PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第六章多元统计PPT讲稿.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章多元统计第1页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心2第六章第六章 因子分分析因子分分析 目录 上页 下页 返回 结束 6.1 6.1 因子分析的基本理论因子分析的基本理论6.2 6.2 因子载荷的求解因子载荷的求解6.3 6.3 因子分析的步骤与逻辑框图因子分析的步骤与逻辑框图6.4 6.4 因子分析的上机实现因子分析的上机实现第2页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心3第六章第六章 因子分分析因子分分析 目录 上页 下页 返回 结束 因子分析(因子分析(factor anal
2、ysis)模型是主成分分析的推广。它也)模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析,因子分析子的一种多变量统计分析方法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关矩阵。因子分析的思想始于发点是原始变量的相关矩阵。因子分析的思想始于1904年年
3、Charles Spearman对学生考试成绩的研究。近年来,随着电子计对学生考试成绩的研究。近年来,随着电子计算机的高速发展,人们将因子分析的理论成功地应用于心理学、算机的高速发展,人们将因子分析的理论成功地应用于心理学、医学、气象、地质、经济学等各个领域,也使得因子分析的理医学、气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。本章主要介绍因子分析的基本理论及方法,论和方法更加丰富。本章主要介绍因子分析的基本理论及方法,运用因子分析方法分析实际问题的主要步骤及因子分析的上机运用因子分析方法分析实际问题的主要步骤及因子分析的上机实现等内容。实现等内容。第3页,共108页,编辑
4、于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心4 目录 上页 下页 返回 结束 6.1 6.1 因子分析的基本理论因子分析的基本理论6.1.1 6.1.1 因子分析的基本思想因子分析的基本思想6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型 第4页,共108页,编辑于2022年,星期三 因子分析的基本思想是根据相关性大小把原始变量分组,使得同组因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并
5、用一个不可观测的综合变量表示,这个基变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量就可本结构就称为公共因子。对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。在经济统计子的线性函数,另一部分是与公共因子无关的特殊因子。在经济统计中,描述一种经济现象的指标可以有很多,比如要反映物价的变动情中,描述一种经济现象的指标可以有很多,比如要反映物价的变动情况,对各种商品的价格做全
6、面调查固然可以达到目的,但这样做显然况,对各种商品的价格做全面调查固然可以达到目的,但这样做显然耗时耗力,为实际工作者所不取。实际上,某一类商品中很多商品的耗时耗力,为实际工作者所不取。实际上,某一类商品中很多商品的价格之间存在明显的相关性或相互依赖性,只要选择几种主要商品的价格之间存在明显的相关性或相互依赖性,只要选择几种主要商品的价格或进而对这几种主要商品的价格进行综合,得到某一种假想的价格或进而对这几种主要商品的价格进行综合,得到某一种假想的“综合商品综合商品”的价格,就足以反映某一类物价的变动情况,这里,的价格,就足以反映某一类物价的变动情况,这里,“综综合商品合商品”的价格就是提取出
7、来的因子。的价格就是提取出来的因子。2023/1/25中国人民大学六西格玛质量管理研究中心5 目录 上页 下页 返回 结束 6.1.1 6.1.1 因子分析的基本思想因子分析的基本思想第5页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心6 目录 上页 下页 返回 结束 6.1.1 6.1.1 因子分析的基本思想因子分析的基本思想 这样,对各类商品物价或仅对主要类别商品的物价进行类似分析然后加以这样,对各类商品物价或仅对主要类别商品的物价进行类似分析然后加以综合,就可以反映出物价的整体变动情况。这一过程也就是从一些有错综复综合,就可以反映出物价的整体
8、变动情况。这一过程也就是从一些有错综复杂关系的经济现象中找出少数几个主要因子,每一个主要因子就代表经济变杂关系的经济现象中找出少数几个主要因子,每一个主要因子就代表经济变量间相互依赖的一种经济作用。抓住这些主要因子就可以帮助我们对复杂的量间相互依赖的一种经济作用。抓住这些主要因子就可以帮助我们对复杂的经济问题进行分析和解释。经济问题进行分析和解释。因子分析还可用于对变量或样品的分类处理,我们在得出因子的表达式之因子分析还可用于对变量或样品的分类处理,我们在得出因子的表达式之后,就可以把原始变量的数据代入表达式得出因子得分值,根据因子得分在后,就可以把原始变量的数据代入表达式得出因子得分值,根据
9、因子得分在因子所构成的空间中把变量或样品点画出来,形象直观地达到分类的目的。因子所构成的空间中把变量或样品点画出来,形象直观地达到分类的目的。因子分析不仅仅可以用来研究变量之间的相关关系,还可以用来研究样品之因子分析不仅仅可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系,通常将前者称之为间的相关关系,通常将前者称之为R 型因子分析,后者称之为型因子分析,后者称之为Q 型因子分型因子分析。我们下面着重介绍型因子分析。析。我们下面着重介绍型因子分析。第6页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心7 目录 上页 下页 返回 结束 6
10、.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型(一)(一)Charles Spearman提出因子分析时用到的例子提出因子分析时用到的例子为了对因子分析的基本理论有一个完整的认识,我们先给出为了对因子分析的基本理论有一个完整的认识,我们先给出Charles Spearman 1904年用到的例子。在该例中年用到的例子。在该例中Spearman研究了研究了33名学生在古典语(名学生在古典语(C)、法语)、法语(F)、英语()、英语(E)、数学()、数学(M)、判别()、判别(D)和音乐()和音乐(Mu)六门考试成绩之间)六门考试成绩之间的相关性并得到如下相关阵:的相关性并
11、得到如下相关阵:第7页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心8 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型 式中,为第式中,为第 门科目标准化后的考试成绩,均值为门科目标准化后的考试成绩,均值为0 0,方差为,方差为1 1。为公共因子,对各科考试成绩均有影响,是均值为为公共因子,对各科考试成绩均有影响,是均值为0 0,方差为,方差为1 1。为仅对第为仅对第 门科目考试成绩有影响的特殊因子,门科目考试成绩有影响的特殊因子,与与 相互独立。相互独立。也就是说,每一门科目的考试成绩都可以
12、看作是由一个公共因子也就是说,每一门科目的考试成绩都可以看作是由一个公共因子(可以认为是一般智力)与一个特殊因子的和。(可以认为是一般智力)与一个特殊因子的和。SpearmanSpearman注意到上面相关阵中一个有趣的规律,这就是如果不注意到上面相关阵中一个有趣的规律,这就是如果不考虑对角元素的话,任意两列的元素大致成比例,对考虑对角元素的话,任意两列的元素大致成比例,对C C列和列和E E列列有:有:于是于是SpearmanSpearman指出每一科目的考试成绩都遵从以下形式:指出每一科目的考试成绩都遵从以下形式:(6.1)第8页,共108页,编辑于2022年,星期三2023/1/25中国
13、人民大学六西格玛质量管理研究中心9 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型(6.2)(6.2)式与式与 无关,也正与在相关矩阵中所观察到的比例关系相一致。无关,也正与在相关矩阵中所观察到的比例关系相一致。在满足以上假定的条件下,就有:在满足以上假定的条件下,就有:于是,有 (6.2)除此之外,还可以得到如下有关除此之外,还可以得到如下有关 方差的关系式:方差的关系式:第9页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心10 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析
14、的基本理论及模型因子分析的基本理论及模型因此,常数因此,常数 的意义就在于其平方表示了公共因子的意义就在于其平方表示了公共因子 解释解释 的方的方差的比例,因此被称之为因子载荷,而差的比例,因此被称之为因子载荷,而 被称作共同度。被称作共同度。对对SpearmanSpearman的例子进行推广,假定每一门科目的考试成绩都受的例子进行推广,假定每一门科目的考试成绩都受到到 个公共因子的影响及一个特殊因子的影响,于是(个公共因子的影响及一个特殊因子的影响,于是(6.16.1)就)就变成了如下因子分析模型的一般形式:变成了如下因子分析模型的一般形式:(6.4)因为因为 是一个常数,与是一个常数,与
15、相互独立且相互独立且 与与 的方差均被假定为的方差均被假定为1 1。于是有于是有(6.3)第10页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心11 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型式中,式中,为标准化后的第为标准化后的第 门科目的考试成绩,均值为门科目的考试成绩,均值为0 0,方差为,方差为1 1。是彼此独立的公共因子,都满足均值为是彼此独立的公共因子,都满足均值为0 0,方差为,方差为1 1。为特殊因为特殊因子,与每一个公共因子均不相关且均值为子,与每一个公共因子均不相关且均
16、值为0 0。则则 为对第为对第 门科目考试成绩的因子载荷。对该模型,门科目考试成绩的因子载荷。对该模型,有:有:(6.5)式中,式中,表示公共因子解释表示公共因子解释 方差的比例,称为方差的比例,称为 的的共同度,相对的共同度,相对的 可称为可称为 的特殊度或剩余方差,表示的特殊度或剩余方差,表示 的方差中与公共因子无关的部分。因为共同度不会大于的方差中与公共因子无关的部分。因为共同度不会大于1 1,因,因此,此,。由模型。由模型(6.4)(6.4)还可以很容易地得到如下还可以很容易地得到如下 与与 相关系数的关系式:相关系数的关系式:(6.6)所以当所以当 与与 在某一公共因子上的载荷均较大
17、时,也就表在某一公共因子上的载荷均较大时,也就表明了明了 与与 的相关性较强。的相关性较强。第11页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心12 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型(二)一般因子分析模型(二)一般因子分析模型下面我们给出更为一般的因子分析模型:设有下面我们给出更为一般的因子分析模型:设有 个样品,每个样个样品,每个样品观测品观测 个指标,这个指标,这 个指标之间有较强的相关性(要求个指标相个指标之间有较强的相关性(要求个指标相关性较强的理由是很明确的,只有相关
18、性较强才能从原始变量中关性较强的理由是很明确的,只有相关性较强才能从原始变量中提取出提取出“公共公共”因子)。为了便于研究,并消除由于观测量纲的因子)。为了便于研究,并消除由于观测量纲的差异及数量级不同所造成的影响,将样本观测数据进行标准化处差异及数量级不同所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量均值为理,使标准化后的变量均值为0 0,方差为,方差为1 1。为方便把原始变量及。为方便把原始变量及标准化后的变量向量均用标准化后的变量向量均用 表示,用表示,用 表示标准表示标准化的公共因子。化的公共因子。第12页,共108页,编辑于2022年,星期三2023/1/25中国人民大
19、学六西格玛质量管理研究中心13 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型(2 2)()是不可观测的变量,其均值向)是不可观测的变量,其均值向 量量 ,协方差矩阵,协方差矩阵 ,即向量,即向量 的各分量是相互独立的;的各分量是相互独立的;如果:如果:(1 1)是可观测随机向量,且均值向量是可观测随机向量,且均值向量 ,协,协方差矩阵方差矩阵 ,且协方差矩阵,且协方差矩阵 与相关阵与相关阵 相等;相等;(3 3)与与 相互独立,且相互独立,且 ,的协方差阵的协方差阵 是对角方阵是对角方阵第13页,共108页,编辑于2022年,星期三20
20、23/1/25中国人民大学六西格玛质量管理研究中心14 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型 即即 的各分量之间也是相互独立的。则模型的各分量之间也是相互独立的。则模型 (6.7)称为因子模型,模型称为因子模型,模型(6.7)(6.7)式的矩阵形式为:式的矩阵形式为:(6.8)其中 第14页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心15 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型由模型(由模型(6.76.7)及其假设前提
21、知,公共因子)及其假设前提知,公共因子 相互独立且相互独立且不可测,是在原始变量的表达式中都出现的因子。公共因子的含不可测,是在原始变量的表达式中都出现的因子。公共因子的含义,必须结合实际问题的具体意义确定。义,必须结合实际问题的具体意义确定。叫做特殊因子,叫做特殊因子,是向量是向量 的分量的分量 ()所特有的因子。各特殊因子)所特有的因子。各特殊因子之间以及特殊因子与所有公共因子之间也都是相互独立的。矩阵之间以及特殊因子与所有公共因子之间也都是相互独立的。矩阵 中的元素中的元素 称为因子载荷,称为因子载荷,的绝对值大的绝对值大 ,表明,表明 与与 的相的相依程度越大,或称公共因子依程度越大,
22、或称公共因子 对于对于 的载荷量越大,进行因子分的载荷量越大,进行因子分析的目的之一,就是要求出各个因子载荷的值。析的目的之一,就是要求出各个因子载荷的值。第15页,共108页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心16 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型经过后面的分析我们会看到,因子载荷的概念与上一章主成分分经过后面的分析我们会看到,因子载荷的概念与上一章主成分分析中的因子负荷量相对等,实际上,由于因子分析与主成分分析析中的因子负荷量相对等,实际上,由于因子分析与主成分分析非常类似,在
23、模型非常类似,在模型(6.7)(6.7)式中,若把式中,若把 看作看作 的综合作用,则除了此处的因子为不可测变量这一区别,因子载的综合作用,则除了此处的因子为不可测变量这一区别,因子载荷与主成分分析中的因子负荷量是一致的;很多人对这两个概念荷与主成分分析中的因子负荷量是一致的;很多人对这两个概念并不加以区分而都称做因子载荷。矩阵并不加以区分而都称做因子载荷。矩阵 称为因子载荷矩阵。称为因子载荷矩阵。为了更好地理解因子分析方法,有必要讨论一下载荷矩阵的为了更好地理解因子分析方法,有必要讨论一下载荷矩阵的统计意义与公因子与原始变量之间的关系。统计意义与公因子与原始变量之间的关系。第16页,共108
24、页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心17 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型1.1.因子载荷因子载荷 的统计意义的统计意义 由模型(6.7)式(6.9)即即 是是 与与 的协方差,而注意到,的协方差,而注意到,与与 ()都是均值为)都是均值为0 0,方差为,方差为1 1的变量,因此,的变量,因此,同时也是同时也是 与与 的相的相关系数。请读者对比主成分分析一章有关因子负荷量的论述并关系数。请读者对比主成分分析一章有关因子负荷量的论述并对两者进行比较。对两者进行比较。第17页,共10
25、8页,编辑于2022年,星期三2023/1/25中国人民大学六西格玛质量管理研究中心18 目录 上页 下页 返回 结束 6.1.2 6.1.2 因子分析的基本理论及模型因子分析的基本理论及模型2 2变量共同度与剩余方差变量共同度与剩余方差在上面在上面SpearmanSpearman的例子中我们提到了共同度与剩余方差的概念,的例子中我们提到了共同度与剩余方差的概念,对一般因子模型对一般因子模型(6.7)(6.7)式的情况,我们重新总结这两个概念如式的情况,我们重新总结这两个概念如下:下:称称 为变量为变量 的共同度,记为的共同度,记为 ()。)。由因子分析模型的假设前提,易得:由因子分析模型的假
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 多元 统计 PPT 讲稿
限制150内