《教育与心理统计因素分析 (2)课件.ppt》由会员分享,可在线阅读,更多相关《教育与心理统计因素分析 (2)课件.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教育与心理统计因素分析第1页,此课件共32页哦n因子分析方法是英国心理学家斯皮尔曼在因子分析方法是英国心理学家斯皮尔曼在考察考察“智力智力”结构时发展起来的统计方法,结构时发展起来的统计方法,目前它已经发展成为统计学的一个分支。目前它已经发展成为统计学的一个分支。第2页,此课件共32页哦n第一节第一节 实例分析实例分析n例例1:职业能力倾向自我评定量表:职业能力倾向自我评定量表第3页,此课件共32页哦n第二节第二节 因子分析的类别因子分析的类别n一、一、R型因子分析与型因子分析与Q型因子分析型因子分析nR型因子分析是针对变量所做得因子分析,其基本型因子分析是针对变量所做得因子分析,其基本思想是
2、通过对变量的相关系数矩阵内部结构的研究,思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。但这少数几个随机多个随机变量之间的相关关系。但这少数几个随机变量是不能直接观测的,通常称为因子。然后再根变量是不能直接观测的,通常称为因子。然后再根据相关性的大小把变量分组,使同组内的变量之间据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。的相关性较高,不同组变量之间的相关性较低。Q型因子分析是针对样品所做的因子分析。型因子分析是针对样品所做的因子分析。第4
3、页,此课件共32页哦n二、探索性因子分析与验证性因子分析二、探索性因子分析与验证性因子分析n1、探索性因子分析、探索性因子分析(EFA)就是指传统的因就是指传统的因子分析。在典型的子分析。在典型的EFA中,研究者通过共中,研究者通过共变关系的分解,找出共同因子,然后进一变关系的分解,找出共同因子,然后进一步探讨这些共同因子与个别变量的关系,步探讨这些共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,找出观察变量与其相对应因子之间的强度,以说明因子与所属的观察变量的关系,决以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。定因子的内容,为因子取一个合适的名字
4、。第5页,此课件共32页哦n 由于传统的因子分析企图找出最少的因子由于传统的因子分析企图找出最少的因子来代表所有的观察变量,因此研究者必须来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量两者间寻找平在因子数目与可解释变异量两者间寻找平衡点。因为因子分析至多可抽取出相等于衡点。因为因子分析至多可抽取出相等于观察变量总数的因子数目,这样,虽可解观察变量总数的因子数目,这样,虽可解释全部释全部100的变异,但失去因子分析找寻的变异,但失去因子分析找寻因子结构的目的,但如果研究者企图以少因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,数几个较明显的因子来代表所有的项
5、目,势必将损失部分可解释变异来作为代价。势必将损失部分可解释变异来作为代价。第6页,此课件共32页哦n2、验证性因子分析(、验证性因子分析(CFA)要求研究者对)要求研究者对于潜在变量的内容与性质,在测量之初就于潜在变量的内容与性质,在测量之初就必须有非常明确的说明或有具体的理论基必须有非常明确的说明或有具体的理论基础,并已先期决定相对应的观察变量的组础,并已先期决定相对应的观察变量的组成模式,进行因子分析的目的是为了检验成模式,进行因子分析的目的是为了检验这一先期提出的因子结构的适合性。这一先期提出的因子结构的适合性。第7页,此课件共32页哦n三、因子分析基本思想、模型与条件三、因子分析基本
6、思想、模型与条件n1、因子与因子负荷、因子与因子负荷n因子分析发展最初目的是在简化一群庞杂的测量,找因子分析发展最初目的是在简化一群庞杂的测量,找出可能存在于观察变量背后的因子结构,使之更为明出可能存在于观察变量背后的因子结构,使之更为明确,增加其可理解性。因子分析的基本假设是那些不确,增加其可理解性。因子分析的基本假设是那些不可观测的可观测的“因子因子”隐含在许多现实可观察的事物背后,隐含在许多现实可观察的事物背后,虽然难以直接测量,但可以从复杂的外在现象中计算、虽然难以直接测量,但可以从复杂的外在现象中计算、估计或抽取得到。估计或抽取得到。第8页,此课件共32页哦n 因子分析运算的过程,与
7、回归分析类似。为了进行因因子分析运算的过程,与回归分析类似。为了进行因子分析,必须假定每一测试的分数都符合正态分布,对子分析,必须假定每一测试的分数都符合正态分布,对于一个给定的被试,每一测试分数都是它在一组或因子于一个给定的被试,每一测试分数都是它在一组或因子上的分数再加上该因子测试特有成分的线性组合。即上的分数再加上该因子测试特有成分的线性组合。即Xijbj1Fi1bj2Fi 2bj mFi mij。其中。其中Xij是是第第i个被试在第个被试在第j个子测试中的分数值,个子测试中的分数值,Fik是同一被试是同一被试在第在第k个维度上的个维度上的“分数分数”。ij是是Xij的一部分,它不能用的
8、一部分,它不能用普通的维度来说明,可以认为是第普通的维度来说明,可以认为是第j个测试中的特殊量。个测试中的特殊量。该因子等式可写成更简单的形式:该因子等式可写成更简单的形式:Xjbj1F1bj2F2bj mF mj。这个等式的意思是。这个等式的意思是“第第j个子测个子测试的分数是在公共因子试的分数是在公共因子F1,F2,Fm上的分数加一个上的分数加一个特殊因子所贡献的特殊因子所贡献的j线性组合线性组合”。bjk是第是第k个因子在个因子在第第j个子测试分数中的负荷,又称为因子分数系数个子测试分数中的负荷,又称为因子分数系数。第9页,此课件共32页哦n2、因子分析的条件、因子分析的条件n 因子分析
9、的进行必须满足以下几个条件:因子因子分析的进行必须满足以下几个条件:因子分析的变量都必须是连续变量,符合线性关系的假分析的变量都必须是连续变量,符合线性关系的假设;抽样过程必须随机,并具有一定规模,专家设;抽样过程必须随机,并具有一定规模,专家建议样本数在建议样本数在100以下不宜进行因子分析,样本数以下不宜进行因子分析,样本数最好大于最好大于300。或样本数最少为变量数的五倍,且。或样本数最少为变量数的五倍,且大于大于100;变量之间具有一定程度的相关,对于一;变量之间具有一定程度的相关,对于一群相关太高或太低的变量,不太适合进行因子分析。群相关太高或太低的变量,不太适合进行因子分析。第10
10、页,此课件共32页哦第三节 因素分析的原理与过程n一、效度与探索性因素分析一、效度与探索性因素分析n1、效度的分类、效度的分类n效度分为内容效度、效标关联效度、建构效度分为内容效度、效标关联效度、建构效度和专家评定效度。效度和专家评定效度。n建构效度(建构效度(construct validity):指测验):指测验能够测量出理论的特质或概念的程度,即能够测量出理论的特质或概念的程度,即实际的测验分数能解释某一心理特质有多实际的测验分数能解释某一心理特质有多少。少。第11页,此课件共32页哦2 关系 统计学上,检验建构效度的最常用的统计学上,检验建构效度的最常用的方法是因素分析。研究者如果以因
11、素分析方法是因素分析。研究者如果以因素分析去检验测验工具的效度,并有效地抽取共去检验测验工具的效度,并有效地抽取共同因素,此共同因素与理论结构的心理特同因素,此共同因素与理论结构的心理特质甚为接近,就可以说,量表具有质甚为接近,就可以说,量表具有“建构建构效度效度”。第12页,此课件共32页哦n二、计算过程二、计算过程n1、计算相关矩阵、计算相关矩阵n因子分析的基础是变量之间的相关。因子因子分析的基础是变量之间的相关。因子分析的第一步是计算各个题目之间的两两分析的第一步是计算各个题目之间的两两相关。相关。第13页,此课件共32页哦n(1)巴特莱球形检验。)巴特莱球形检验。Bartlett球型检
12、验球型检验(bartletts test of sphercity)用于检验)用于检验相关阵是否是单位阵,检验这些相关系数相关阵是否是单位阵,检验这些相关系数是否不同且大于零。是否不同且大于零。第14页,此课件共32页哦n(2)KMO检验。以判断数据是否适合进行检验。以判断数据是否适合进行因素分析。因素分析。第15页,此课件共32页哦nKaiser认为,认为,KMO0.9时,极适合进行因时,极适合进行因素分析;素分析;KMO0.8时,适合进行因素分析;时,适合进行因素分析;KMO0.7时,尚可进行因素分析;时,尚可进行因素分析;KMO0.6时,勉强进行因素分析;时,勉强进行因素分析;KMO0.
13、5时,不适合进行因素分析,时,不适合进行因素分析,KMO0.5时,非常不宜做因素分析。时,非常不宜做因素分析。第16页,此课件共32页哦n(3)共同性指数检查。在某一变量上各因)共同性指数检查。在某一变量上各因子负荷量平方值的总和。变量的共同性越子负荷量平方值的总和。变量的共同性越高,因子分析的结果越理想。题项平均共高,因子分析的结果越理想。题项平均共同性最好在同性最好在.70以上,如果样本数大于以上,如果样本数大于250,平均共同性应该在平均共同性应该在.60以上。以上。第17页,此课件共32页哦n2、因子抽取的方法、因子抽取的方法A 主成分分析法:是以线性组合式将所有变量加主成分分析法:是
14、以线性组合式将所有变量加以合并,计算所有变量共同解释的变异量,该以合并,计算所有变量共同解释的变异量,该线性组合称为主要成分。第一次线性组合所解线性组合称为主要成分。第一次线性组合所解释的变异量最大,分离此变异量所剩余的变异释的变异量最大,分离此变异量所剩余的变异量,经第二个线性组合式,可以分离出第二个量,经第二个线性组合式,可以分离出第二个主成分,其所包含的变异量属于第二个主成分主成分,其所包含的变异量属于第二个主成分的变异量,依次类推。的变异量,依次类推。第18页,此课件共32页哦nB 主轴因素法:是分析变量间的共同变量而非全体主轴因素法:是分析变量间的共同变量而非全体变异量,其计算方式是
15、将相关矩阵中的对角线,由变异量,其计算方式是将相关矩阵中的对角线,由原来的原来的1.00改为共同性来取代,其目的在于抽出改为共同性来取代,其目的在于抽出一系列互相独立的因素。第一个因素解释最大的一系列互相独立的因素。第一个因素解释最大的原始变量间共同变异量;第二个因素解释剩余共原始变量间共同变异量;第二个因素解释剩余共同变异量的最大变异。此法符合因素分析模式的同变异量的最大变异。此法符合因素分析模式的假设,即分析变量间共同变异,而非分析变量的假设,即分析变量间共同变异,而非分析变量的总变异,且因素的内容较易了解。总变异,且因素的内容较易了解。第19页,此课件共32页哦一般化最小二乘法未加权最小
16、二乘法极大似然法Alpha因素抽取法映象因素抽取法第20页,此课件共32页哦n3、因子数目、因子数目n(1)特征值)特征值 主要根据特征值的大小。特主要根据特征值的大小。特征值代表某一因子可解释的总变异量,特征值代表某一因子可解释的总变异量,特征值越大,代表改因子解释力越强。一般征值越大,代表改因子解释力越强。一般情况下,选取特征值大于情况下,选取特征值大于1的因素。的因素。第21页,此课件共32页哦n(2)碎石图 即陡坡检验。将每一个因子依其特征值从达到小排序,当因子的特征值逐渐接近,没有变化之时,代表特殊的因子已经无法抽取出来。第22页,此课件共32页哦n4、转轴方法、转轴方法n在因素抽取
17、上,通常最初因素抽取后,对因素无法做有在因素抽取上,通常最初因素抽取后,对因素无法做有效解释,转轴的目的就在于改变题项在各因素的负荷量效解释,转轴的目的就在于改变题项在各因素的负荷量的大小,转轴时根据题项与因素结构关系的密切程度,的大小,转轴时根据题项与因素结构关系的密切程度,调整各因素负荷量的大小,转轴后,大部分题项在每个调整各因素负荷量的大小,转轴后,大部分题项在每个共同因素中有一个差异较大的因素负荷量。共同因素中有一个差异较大的因素负荷量。n说明:说明:因素旋转的目的是寻找一个因素旋转的目的是寻找一个“最简结构最简结构”,即经过使得:在即经过使得:在K个因素上所有原变量变异矢量的个因素上
18、所有原变量变异矢量的投影(又称因素负荷)都尽可能都是正的;取值投影(又称因素负荷)都尽可能都是正的;取值为零的因素负荷的数目尽可能地多。为零的因素负荷的数目尽可能地多。第23页,此课件共32页哦n 寻找一个寻找一个“最简结构最简结构”的目的,为了能够更加逻辑合的目的,为了能够更加逻辑合理地辨识因素并且为它们命名。理地辨识因素并且为它们命名。n(1)正交旋转)正交旋转 正交,指旋转过程中,因子之间的正交,指旋转过程中,因子之间的轴线夹角为轴线夹角为90度,即因子之间的相关设定为度,即因子之间的相关设定为0。有最。有最大变异法,四方最大法,均等变异法。大变异法,四方最大法,均等变异法。n(2)斜交
19、旋转:先求得在正交因素模型下的因素负荷矩)斜交旋转:先求得在正交因素模型下的因素负荷矩阵阵B,然后对因素负荷矩阵,然后对因素负荷矩阵A作斜交变换作斜交变换T*,求得斜交负,求得斜交负荷矩阵荷矩阵A*=BT*。这种方法因子与因子之间具有一定的。这种方法因子与因子之间具有一定的相关性。有最小斜交法,最大斜交法和四方最小法。相关性。有最小斜交法,最大斜交法和四方最小法。第24页,此课件共32页哦n至于采用何种转轴法,研究者可以根据文至于采用何种转轴法,研究者可以根据文献探究与理论基础分析结果作为依据,如献探究与理论基础分析结果作为依据,如果相关理论上显示共同因素层面间是彼此果相关理论上显示共同因素层
20、面间是彼此独立,没有关系存在的,则应采取正交转独立,没有关系存在的,则应采取正交转轴法;如果依理论研究所得,因素层面间,轴法;如果依理论研究所得,因素层面间,彼此有相关并且非独立的,则应采取斜交彼此有相关并且非独立的,则应采取斜交转轴法。转轴法。第25页,此课件共32页哦n5、决定因素与命名、决定因素与命名n 根据心理学专业知识。根据心理学专业知识。第26页,此课件共32页哦n三、量值的关系三、量值的关系n旋转前旋转前n旋转后旋转后第27页,此课件共32页哦n说明:说明:n(1)旋转前后。特征值的和不变)旋转前后。特征值的和不变n(2)旋转前后,共同性不变)旋转前后,共同性不变n(3)共同性为
21、行负荷值的平方和)共同性为行负荷值的平方和n(4)特征值为列负荷值的平方和。)特征值为列负荷值的平方和。第28页,此课件共32页哦第四节第四节 探索性因素分析的拓展探索性因素分析的拓展n一、探索性因素分析的反复性一、探索性因素分析的反复性n1、你所编制的量表必须依据于前人对抑郁的理解以、你所编制的量表必须依据于前人对抑郁的理解以及已有的研究成果。及已有的研究成果。2、编制纯粹的抑郁量表对现实、编制纯粹的抑郁量表对现实社会有什么意义?我们进一步了解到承受力与抑郁社会有什么意义?我们进一步了解到承受力与抑郁应该结合考虑,为什么?如果抑郁程度高,心理承应该结合考虑,为什么?如果抑郁程度高,心理承受力
22、低,那么他可能会从这个楼上跳下去,如果抑受力低,那么他可能会从这个楼上跳下去,如果抑郁程度高,但心理承受力高,他也不会出现过激行郁程度高,但心理承受力高,他也不会出现过激行为。所以,通过探索性因素分析编制题目时就需要为。所以,通过探索性因素分析编制题目时就需要考虑心理承受力因素,或者编制另外的心理承受力考虑心理承受力因素,或者编制另外的心理承受力量表,做有关抑郁研究时,将心理承受力作为协变量表,做有关抑郁研究时,将心理承受力作为协变量处理。量处理。3、由于量表题目有价值倾向,所以需要加、由于量表题目有价值倾向,所以需要加入测谎题。入测谎题。4本土化问题。本土化问题。第29页,此课件共32页哦
23、由于是探索性因素分析,在因素分析时,根由于是探索性因素分析,在因素分析时,根据项目分析或题项与总分的判别,剔除题项后,据项目分析或题项与总分的判别,剔除题项后,剩下的量表题项均纳入因素分析变量范围内,以剩下的量表题项均纳入因素分析变量范围内,以特征值等于特征值等于1为判别基准时,研究者常会发觉计算机为判别基准时,研究者常会发觉计算机所抽取的因素过多,或某些因素所包含的题项不够恰所抽取的因素过多,或某些因素所包含的题项不够恰当、因素命名不容易。在探索因素中,这是可以理解当、因素命名不容易。在探索因素中,这是可以理解的,因为受受试者填答、量表编制过程的严谨性等变的,因为受受试者填答、量表编制过程的
24、严谨性等变化因素的影响,常导致部分量表的因素分析结果,不化因素的影响,常导致部分量表的因素分析结果,不完全符合研究者当初编制的层面因素,所以研究者可完全符合研究者当初编制的层面因素,所以研究者可能会删除题项进行第二、第三次的因素分析。能会删除题项进行第二、第三次的因素分析。第30页,此课件共32页哦探索性因素分析与验证性因素分探索性因素分析与验证性因素分析模型假设的区分析模型假设的区分:n探索性因素分析的假设:探索性因素分析的假设:n(1)所有的公共因素都相关(或都无关)所有的公共因素都相关(或都无关)n(2)所有的公共因素直接影响所有的观测变量)所有的公共因素直接影响所有的观测变量n(3)特
25、殊因素之间相互独立)特殊因素之间相互独立n(4)所有观测变量只受一个特殊因素的影响)所有观测变量只受一个特殊因素的影响n(5)公共因素和特殊因素相互独立)公共因素和特殊因素相互独立 n(6)观测变量与潜在变量之间的关系不是事先假定观测变量与潜在变量之间的关系不是事先假定的;的;n(7)潜在变量的个数不是在分析前确定的)潜在变量的个数不是在分析前确定的n(8)模型通常是不可识别的)模型通常是不可识别的第31页,此课件共32页哦n验证性因素分析的假设验证性因素分析的假设:n(1)公共因素之间可以相关也可以无关)公共因素之间可以相关也可以无关n(2)观测变量可以只受某一个或几个公共因素)观测变量可以只受某一个或几个公共因素 的影的影响而不必受所有公共因素的影响响而不必受所有公共因素的影响n(3)特殊因素之间可以有相关,还可以出现不存)特殊因素之间可以有相关,还可以出现不存在误差因素的观测变量在误差因素的观测变量n(4)公共因素和特殊因素之间相互独立)公共因素和特殊因素之间相互独立 n(5)观测变量与潜变量之间的关系事先假定的;)观测变量与潜变量之间的关系事先假定的;n(6)潜在变量的个数在数据分析前确定的)潜在变量的个数在数据分析前确定的n(7)模型通常要求是可识别的)模型通常要求是可识别的第32页,此课件共32页哦
限制150内