第14章因子分析1统计学原理(精品).ppt
《第14章因子分析1统计学原理(精品).ppt》由会员分享,可在线阅读,更多相关《第14章因子分析1统计学原理(精品).ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第14章章 因子分析因子分析因子分析因子分析因子分析1 1 因子分析的概念因子分析的概念2 2 数学模型及统计意义数学模型及统计意义3 3 因子载荷阵的估计方法因子载荷阵的估计方法4 4 因子得分因子得分5 5 因子旋转因子旋转*6 6 计算步骤及实例计算步骤及实例因子分析的概念因子分析的概念因子分析的概念因子分析的概念 因子分析的概念起源于因子分析的概念起源于Karl PearsonKarl Pearson和和Charles Charles SpearmenSpearmen等人关于智力测验的统计分析。等人关于智力测验的统计分析。19041904年年Charles SpearmanCharl
2、es Spearman发表了一篇著名论文发表了一篇著名论文对智力测对智力测验得分进行统计分析验得分进行统计分析被视为因子分析的起点。因被视为因子分析的起点。因子分析最早用来研究心理学和教育方面的问题,但子分析最早用来研究心理学和教育方面的问题,但因子分析由于计算量大,在缺少计算机条件下其应因子分析由于计算量大,在缺少计算机条件下其应用受到了很大限制。随着计算机的大量使用,使得用受到了很大限制。随着计算机的大量使用,使得因子分析的计算问题得到了解决大大促进了该方法因子分析的计算问题得到了解决大大促进了该方法的发展。的发展。因子分析方法应用范围十分广泛,在经济管理科因子分析方法应用范围十分广泛,在
3、经济管理科学、社会科学、生物学、医学、地质科学、考古学、学、社会科学、生物学、医学、地质科学、考古学、教育学乃至体育科学等取得了显著成就。教育学乃至体育科学等取得了显著成就。1 1 引言引言引言引言 因子分析是主成分分析的推广和发展,它是将具有错综因子分析是主成分分析的推广和发展,它是将具有错综因子分析是主成分分析的推广和发展,它是将具有错综因子分析是主成分分析的推广和发展,它是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以复杂关系的变量(或样品)综合为数量较少的几个因子,以复杂关系的变量(或样品)综合为数量较少的几个因子,以复杂关系的变量(或样品)综合为数量较少的几个因子,以
4、再现原始变量与因子之间的相互关系,同时根据不同因子还再现原始变量与因子之间的相互关系,同时根据不同因子还再现原始变量与因子之间的相互关系,同时根据不同因子还再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中可以对变量进行分类,它也是属于多元分析中可以对变量进行分类,它也是属于多元分析中可以对变量进行分类,它也是属于多元分析中处理降维处理降维处理降维处理降维的一的一的一的一种统计方法。种统计方法。种统计方法。种统计方法。1 1 引言引言引言引言因子分析因子分析因子分析因子分析(factor analysis)(factor analysis)是一种数据简
5、化的技术。它通过研究是一种数据简化的技术。它通过研究是一种数据简化的技术。它通过研究是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,众多变量之间的内部依赖关系,探求观测数据中的基本结构,众多变量之间的内部依赖关系,探求观测数据中的基本结构,众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假并用少数几个假想变量来表示其基本的数据结构。这几个假并用少数几个假想变量来表示其基本的数据结构。这几个假并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可想变量能
6、够反映原来众多变量的主要信息。原始的变量是可想变量能够反映原来众多变量的主要信息。原始的变量是可想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是观测的显在变量,而假想变量是观测的显在变量,而假想变量是观测的显在变量,而假想变量是不可观测的潜在变量,称为不可观测的潜在变量,称为不可观测的潜在变量,称为不可观测的潜在变量,称为因子。因子。因子。因子。问题一:问题一:问题一:问题一:某公司对某公司对某公司对某公司对100100名招聘人员的知识和能力名招聘人员的知识和能力名招聘人员的知识和能力名招聘人员的知识和能力进行测试,出了进行测试,出了进行测试,出了进行测试,出了
7、5050道题的试卷,其内容包括的面较道题的试卷,其内容包括的面较道题的试卷,其内容包括的面较道题的试卷,其内容包括的面较广,但总的来讲可归纳为六个方面:广,但总的来讲可归纳为六个方面:广,但总的来讲可归纳为六个方面:广,但总的来讲可归纳为六个方面:语言表达能力语言表达能力语言表达能力语言表达能力、逻辑思维能力逻辑思维能力逻辑思维能力逻辑思维能力、判断事物的敏捷判断事物的敏捷判断事物的敏捷判断事物的敏捷和和和和果断程度果断程度果断程度果断程度、思想思想思想思想修养修养修养修养、兴趣爱好兴趣爱好兴趣爱好兴趣爱好、生活常识生活常识生活常识生活常识等,我们将每一个方面等,我们将每一个方面等,我们将每一
8、个方面等,我们将每一个方面称为因子称为因子称为因子称为因子 .100100人测试的分数人测试的分数人测试的分数人测试的分数 可以用上述六个因子可以用上述六个因子可以用上述六个因子可以用上述六个因子表示成线性函数:表示成线性函数:表示成线性函数:表示成线性函数:称为公共因子称为公共因子称为公共因子称为公共因子 称为特殊因子称为特殊因子称为特殊因子称为特殊因子 称为因子载荷称为因子载荷称为因子载荷称为因子载荷 问题二:问题二:问题二:问题二:在企业形象或品牌形象的研究中,消费者可以通过在企业形象或品牌形象的研究中,消费者可以通过在企业形象或品牌形象的研究中,消费者可以通过在企业形象或品牌形象的研究
9、中,消费者可以通过一个有一个有一个有一个有2424个指标构成的评价体系,评价百货商场的个指标构成的评价体系,评价百货商场的个指标构成的评价体系,评价百货商场的个指标构成的评价体系,评价百货商场的2424个方面个方面个方面个方面的优劣。的优劣。的优劣。的优劣。消费者主要关心的是三个方面,即消费者主要关心的是三个方面,即消费者主要关心的是三个方面,即消费者主要关心的是三个方面,即商店的环境商店的环境商店的环境商店的环境、商店的服务商店的服务商店的服务商店的服务和和和和商品的价格商品的价格商品的价格商品的价格。因子分析方法可以通。因子分析方法可以通。因子分析方法可以通。因子分析方法可以通过过过过24
10、24个变量,找出反映商店环境、商店服务水平个变量,找出反映商店环境、商店服务水平个变量,找出反映商店环境、商店服务水平个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合和商品价格的三个潜在的因子,对商店进行综合和商品价格的三个潜在的因子,对商店进行综合和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为:评价。而这三个公共因子可以表示为:评价。而这三个公共因子可以表示为:评价。而这三个公共因子可以表示为:问题三,服装剪裁问题问题三,服装剪裁问题问题三,服装剪裁问题问题三,服装剪裁问题 对于裁缝来说,服装裁剪需要根据许多指标来进行决对于裁缝来说
11、,服装裁剪需要根据许多指标来进行决对于裁缝来说,服装裁剪需要根据许多指标来进行决对于裁缝来说,服装裁剪需要根据许多指标来进行决定,虽然有许多指标如领长、袖长、等一些列指标,但最定,虽然有许多指标如领长、袖长、等一些列指标,但最定,虽然有许多指标如领长、袖长、等一些列指标,但最定,虽然有许多指标如领长、袖长、等一些列指标,但最后关键指标是后关键指标是后关键指标是后关键指标是衣服的长度衣服的长度衣服的长度衣服的长度和和和和衣服的宽度衣服的宽度衣服的宽度衣服的宽度两个核心指标或者两个核心指标或者两个核心指标或者两个核心指标或者因子。其他指标都是相关指标。因子。其他指标都是相关指标。因子。其他指标都是
12、相关指标。因子。其他指标都是相关指标。因子分析的因子分析的基本思想基本思想是通过变量的相关系数矩是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低组的变量相关性较低.注:注:注:注:因子分析
13、与回归分析因子分析与回归分析因子分析与回归分析因子分析与回归分析不同,因子分析中的因子是一个不同,因子分析中的因子是一个不同,因子分析中的因子是一个不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;比较抽象的概念,而回归因子有非常明确的实际意义;比较抽象的概念,而回归因子有非常明确的实际意义;比较抽象的概念,而回归因子有非常明确的实际意义;主成分分析分析与因子分析主成分分析分析与因子分析主成分分析分析与因子分析主成分分析分析与因子分析也有不同,主成分分析仅也有不同,主成分分析仅也有不同,主成分分析仅也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。仅是变
14、量变换,而因子分析需要构造因子模型。仅是变量变换,而因子分析需要构造因子模型。仅是变量变换,而因子分析需要构造因子模型。主成分分析主成分分析主成分分析主成分分析:原始变量的线性组合表示新的综合变量,原始变量的线性组合表示新的综合变量,原始变量的线性组合表示新的综合变量,原始变量的线性组合表示新的综合变量,即主成分;即主成分;即主成分;即主成分;因子分析:潜在的假想变量和随机影响变量的线性组因子分析:潜在的假想变量和随机影响变量的线性组因子分析:潜在的假想变量和随机影响变量的线性组因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。合表示原始变量。合表示原始变量。合表示原始变量。2 数
15、学模型及统计意义数学模型及统计意义1)因子分析因子分析模型模型(正交因子模型正交因子模型)(1 1)R R型型型型因子分析模型因子分析模型因子分析模型因子分析模型 (变量变量变量变量因子模型因子模型因子模型因子模型)用矩阵表示:用矩阵表示:用矩阵表示:用矩阵表示:简记为简记为简记为简记为且满足且满足且满足且满足:其中其中其中其中X X是可实测的是可实测的是可实测的是可实测的p p个指标所构成个指标所构成个指标所构成个指标所构成p p维随机向量,维随机向量,维随机向量,维随机向量,F F是不可观是不可观是不可观是不可观测的向量,测的向量,测的向量,测的向量,F F称为称为称为称为X X的的的的公
16、共因子或潜因子公共因子或潜因子公共因子或潜因子公共因子或潜因子;a aij ij称为称为称为称为因子载荷因子载荷因子载荷因子载荷是是是是第第第第i i个变量在第个变量在第个变量在第个变量在第j j个公共因子上的负荷,如果把变量个公共因子上的负荷,如果把变量个公共因子上的负荷,如果把变量个公共因子上的负荷,如果把变量X Xi i看成看成看成看成mm维维维维因子空间中的一个向量,则表示因子空间中的一个向量,则表示因子空间中的一个向量,则表示因子空间中的一个向量,则表示X Xi i在坐标轴在坐标轴在坐标轴在坐标轴F Fj j上的投影,矩上的投影,矩上的投影,矩上的投影,矩阵阵阵阵A A称为称为称为称
17、为因子载荷矩阵因子载荷矩阵因子载荷矩阵因子载荷矩阵;称为称为称为称为X X的的的的特殊因子特殊因子特殊因子特殊因子,通常理论上要,通常理论上要,通常理论上要,通常理论上要求的协方差阵是对角阵,其中包括了随机误差求的协方差阵是对角阵,其中包括了随机误差求的协方差阵是对角阵,其中包括了随机误差求的协方差阵是对角阵,其中包括了随机误差.由上述模型满足的条件由上述模型满足的条件由上述模型满足的条件由上述模型满足的条件可知可知可知可知:是不相关的是不相关的是不相关的是不相关的.此时此时此时此时X X1 1,X X2 2,X Xn n表示表示表示表示n n个样品个样品个样品个样品.(2)Q型型因子分析模型
18、因子分析模型(样品样品样品样品因子模型因子模型因子模型因子模型)因子分析的目的因子分析的目的因子分析的目的因子分析的目的就是通过模型就是通过模型就是通过模型就是通过模型 代替代替代替代替X X,由于,由于,由于,由于 ,从而达到简化变量维数的愿,从而达到简化变量维数的愿,从而达到简化变量维数的愿,从而达到简化变量维数的愿望。望。望。望。2 2)因子载荷和变量共同度及其统计意义)因子载荷和变量共同度及其统计意义)因子载荷和变量共同度及其统计意义)因子载荷和变量共同度及其统计意义(1 1)因子因子因子因子载载载载荷的统计意义荷的统计意义荷的统计意义荷的统计意义于是于是于是于是:已知模型:已知模型:
19、已知模型:已知模型:两端后乘两端后乘两端后乘两端后乘F Fj j得:得:得:得:所以上式可写成:所以上式可写成:所以上式可写成:所以上式可写成:由于在标准化下有:由于在标准化下有:由于在标准化下有:由于在标准化下有:因此因此因此因此因子载荷因子载荷因子载荷因子载荷 a ai i j j的统计意义的统计意义的统计意义的统计意义:第第第第i i个变量与第个变量与第个变量与第个变量与第j j个公共因个公共因个公共因个公共因子的相关系数子的相关系数子的相关系数子的相关系数,即表示即表示即表示即表示X Xi i依赖依赖依赖依赖F Fj j的的的的份量(比重)份量(比重)份量(比重)份量(比重).(2)(
20、2)变量共同度的统计意义变量共同度的统计意义变量共同度的统计意义变量共同度的统计意义所谓变量所谓变量所谓变量所谓变量X Xi i的的的的共同度定义共同度定义共同度定义共同度定义为因子载荷阵为因子载荷阵为因子载荷阵为因子载荷阵A A中第中第中第中第i i行元行元行元行元素的平方和,即素的平方和,即素的平方和,即素的平方和,即共同度共同度共同度共同度 h hi i2 2:它刻划全部公共因子对变量它刻划全部公共因子对变量它刻划全部公共因子对变量它刻划全部公共因子对变量X Xi i的总方差所的总方差所的总方差所的总方差所作的贡献,作的贡献,作的贡献,作的贡献,越接近越接近越接近越接近1 1,说明由原始
21、变量空间转为因,说明由原始变量空间转为因,说明由原始变量空间转为因,说明由原始变量空间转为因子空间转化的性质越好,保留原来信息量多子空间转化的性质越好,保留原来信息量多子空间转化的性质越好,保留原来信息量多子空间转化的性质越好,保留原来信息量多;其值;其值;其值;其值越小,越小,越小,越小,说明公共因子对说明公共因子对说明公共因子对说明公共因子对X Xi i影响很小,主要由特殊因影响很小,主要由特殊因影响很小,主要由特殊因影响很小,主要由特殊因子子子子 来描述来描述来描述来描述,因此是因此是因此是因此是X Xi i方差的重要组成部分。方差的重要组成部分。方差的重要组成部分。方差的重要组成部分。
22、所以所以所以所以 i i2 2:是特定变量所产生的方差,称为特殊因子方差是特定变量所产生的方差,称为特殊因子方差是特定变量所产生的方差,称为特殊因子方差是特定变量所产生的方差,称为特殊因子方差,仅与变量仅与变量仅与变量仅与变量X Xi i本身的变化有关,它是使本身的变化有关,它是使本身的变化有关,它是使本身的变化有关,它是使X Xi i的方差为的方差为的方差为的方差为1 1的的的的补充值。补充值。补充值。补充值。3)3)公公公公共共共共因子因子因子因子F Fj j的方差贡献的统计意义的方差贡献的统计意义的方差贡献的统计意义的方差贡献的统计意义将因子载荷矩阵中各列元素的平方和记为将因子载荷矩阵中
23、各列元素的平方和记为将因子载荷矩阵中各列元素的平方和记为将因子载荷矩阵中各列元素的平方和记为称称称称q qj j为为为为公公公公共共共共因因因因子子子子F Fj j对对对对变变变变量量量量组组组组X X的的的的贡贡贡贡献献献献,即即即即S Sj j表表表表示示示示同同同同一一一一公公公公共共共共因因因因子子子子F Fj j对对对对诸诸诸诸变变变变量量量量所所所所提提提提供供供供的的的的方方方方差差差差贡贡贡贡献献献献之之之之总总总总和和和和,它是它是它是它是衡量公共因子相对重要性衡量公共因子相对重要性衡量公共因子相对重要性衡量公共因子相对重要性指标。指标。指标。指标。3 因子载荷阵的估计方法因
24、子载荷阵的估计方法 设随机向量设随机向量设随机向量设随机向量X X的协差阵为的协差阵为的协差阵为的协差阵为 ,i i为的特征根,为的特征根,为的特征根,为的特征根,e ei i为对为对为对为对应的标准正交化特征向量应的标准正交化特征向量应的标准正交化特征向量应的标准正交化特征向量(只要特征根不等,对应的只要特征根不等,对应的只要特征根不等,对应的只要特征根不等,对应的单位特征向量一定是正交的单位特征向量一定是正交的单位特征向量一定是正交的单位特征向量一定是正交的),则根据线性代数知识,则根据线性代数知识,则根据线性代数知识,则根据线性代数知识可分解为可分解为可分解为可分解为 1 1)忽略特殊因
25、子)忽略特殊因子)忽略特殊因子)忽略特殊因子 上边给出的上边给出的上边给出的上边给出的 表达式是精确的,但实际应用时表达式是精确的,但实际应用时表达式是精确的,但实际应用时表达式是精确的,但实际应用时总是希望公共因子个数小于变量的个数即总是希望公共因子个数小于变量的个数即总是希望公共因子个数小于变量的个数即总是希望公共因子个数小于变量的个数即mm p p,当最后当最后当最后当最后p p-mm个特征根较小时,通常是略去最后个特征根较小时,通常是略去最后个特征根较小时,通常是略去最后个特征根较小时,通常是略去最后p p-mm项对项对项对项对 的贡献,于是得到的贡献,于是得到的贡献,于是得到的贡献,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 14 因子分析 统计学 原理 精品
限制150内