结构方程模型.pdf
《结构方程模型.pdf》由会员分享,可在线阅读,更多相关《结构方程模型.pdf(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、三、结构方程模型的基本观念(一)结构方程模型是什么结构方程模型可以说,就是路径分析(path analysis)和因子分析(factor analysis)的结合体。它的用途,与大家所熟悉的多元回归分析十分相似,但是不同的地方在于,结构方程模型是一种更为强大的统计方法,在构造模型和估计参数的过程里,可以直接处理多组方程间的互动干扰、非线性关系、不独立(相关)的自变量、残差相关、衡量误差、以及将多组相依的衡量模型共冶于一个单一模型当中。事实上,我们可以将结构方程模型视为广义线性模型 (general linear model:GLM)的延伸,它的强大功能,绝对可以用来取代我们惯用的回归分析、路径
2、分析、因子分析、时间序列分析、甚至共变量分析。不过限于篇幅,本书将聚焦于结构方程模型在因子分析、潜变量路径分析、和一般路径分析上的应用。相对于多元回归分析,结构方程模型在应用上的限制也较少,关键的亮点包括在进行路径分析的时候,即使自变量间存在明显的共线性(multi-collinearity),结构方程模型依然可以照单全收,丝毫不影响其解释上的有效性。利用结构方程模型来进行验证性因子分析,更可以通过将多个可观测变量指定给单一潜变量,从而可以在根源处直接降低衡量误差。尤其在残差的处理上,很少有统计方法可以这么方便地直接检查每一个可观测变量的残差,甚至操弄这些残差之间的相关。结构方程模型在路径系数
3、的处理上也高人一等,不仅可以同时估计多个自变量对多组因变量的关系,还能够进行多样本多模型之间的系数比较。最重要的优势是,结构方程模型不仅仅可以估计单一参数的系数,还能够直接估计整体模型的拟合度,这是许多传统统计方法所望尘莫及的。如前所述,结构方程模型的主要用途,其实是用来验证研究者心中对于他所想象世界的猜想,而不是用来探索一个新的世界。换言之,在应用结构方程模型的一开始,大多数的研究者在他的心中,早已存在某些定见了。这些定见的存在形式,大抵上可以分成两种:(1)研究者想要检验他的某个想法是否正确,于是构造了一个结构方程模型,在代入真实数据对模型进行估计后,研究者可以根据拟合指标的好坏,来判断真
4、实世界里的数据,和他所构造的模型之间是否一致,从而明白他原先的想法是否可以接受。(2)研究者根据不同理论,得出两种或两种以上可以用来描述这个世界的不同看法,然后针对这些不同看法,分别构造出不同的结构方程模型来,在代入真实数据分别对这些模型进行估计后,研究者可以根据拟合指标的好坏,来判断究竟哪种看法,更加切合实际。尽管如此,我们还是可以在文献中看到有些研究者,利用结构方程模型来进行模型探索,而不是正确使用结构方程模型,来验证心中事先设定的模型猜想。例如有些研究者在验证原先设定好的结构模型时,发现拟合指标很差,于是通过修正指标(modification index)的暗示,为数字而数字地对模型任意
5、调整改动,直到拟合指标达到及格标准为止。当然这样的作法并不可取,因为通过这种过程而勉强予以接受的结构模型,可能只是刚好反映了这组特定样本的特征,而不是因为模型本身可以放诸四海而皆准,换句话说,是因为这组特定样本造就了一个事先想象不到、缺乏理论依据的模型,而不是通过真实数据,验证了一个具有理论深度的模型。这样的模型即使拟合指标合格了,可能还是缺乏外部效度,我们很难接受这样的模型会是能够代表事实真理的模型。对于这种情形下所构造出来的结构方程模型,研究者有必要使用多组不同的样本,对相同模型进行多次验证,也就是强韧度测试(robust tests),如果多组样本都证实了相同结构模型的拟合指标都是及格的
6、,那么我们才能够正式接受这个结构方程模型。(二)结构方程模型的前提假定如前所述,结构方程模型在应用上的限制相对已经较少了,但是它和其他的多变量分析技术一样,在实际应用的时候,仍然有其特定的前提假定必须遵守。(1)结构方程模型里面的可观测变量必须服从正态分布。(2)结构方程模型里面作为因变量的潜变量必须服从正态分布。(3)线性关系的假定(4)潜变量的假定(5)多元的可观测变量(6)不存在多重共线性的假定(7)残差独立的假定(8)不存在接近零的协方差矩阵(covariance matrix)(9)适当的样本大小(1)结构方程模型里面的可观测变量必须服从正态分布。由于在估计结构方程模型的拟合指标时,
7、我们所采用的最基本工具是卡方检定(chi-square test),卡方检定对于变量的正态性(normality)十分敏感,即使轻微的违背这个要求,都可能导致卡方检定结果发生很大的偏差。同时,大多数结构方程模型在估计参数时所采用的方法都是极大似然估计法,这方法在应用时的基本前提也是变量的正态性,尤其对于模型中内生变量(endogenous variables)的正态性更是严格要求,因此可观测变量服从正态分布,是进行结构方程模型时不可回避的必要条件。这里补充说明一下,如果可观测变量不服从正态分布,但是其残差却:(a)服从正态分布,(b)所有残差的方差都很接近(代表残差同质),(c)残差间彼此独立
8、(也就是不相关),这时卡方的估计结果还是不偏的。不过这三个条件看来比要求可观测变量服从正态分布还要困难。在实务上,避免违背这个条件的简易方法,首先就是尽可能不去使用顺序尺度(ordinal scale)或是名目尺度 (nominal scale)这种类别的,或是离散的变量衡量方法。其次,在万不得已必须使用类别型变量衡量的时候,还可以选用一些转换(transformation)技术,来正态化(normalize)那些有问题的变量。所谓转换,就是根据变量的分布特征,通过数学代换,将原本不属于正态分布的变量,设法将之转变成具有正态分布性质的变量。常见的转换技术包括:取平方根(square root)
9、、取自然对数(logarithmic)、或是函数1/x 反转(inverse)等等,其中函数反转优于取自然对数,自然对数又优于取平方根。例如,对于服从卜瓦松(Poisson)分布的变量,我们通常直接对它取平方根,即可赋予变量正态分布的特征;对于百分比形式的变量,反正弦(arcsine)处理也许是个好方法;对于二项式分布的变量,通常使用的方法是通过胜率(Odds)转换成概率后,再利用自然对数函数log(p/(1-p)进行转换;对于韦布(Weibull)型极值分布(extreme value distribution)形式的变量,则使用反转函数log(-log(1-x)进行转换。无论如何,这些变量
10、转换必须有根有据,确实依据数学原理让变量获得正态分布的性质,否则再怎么奇巧转换也是无益的。最后,当然还需要利用一些统计方法,来验证模型中所使用的可观测变量的正态性。这些方法包括QQ-plot,Shapiro-Wilk Statistic,或是Kolmogorov-Smirnov Statistic 等等,兹不赘叙。(2)结构方程模型里面作为因变量的潜变量必须服从正态分布。所以结构模型里面,所有的因变量都不可以被设计成类别型变量的形式。如果万不得已必须使用类别衡量的变量作为因变量,那么必须改用类别型潜变量分析(latent class analysis:LCA)方法处理,一般的结构方程模型软件并
11、不能处理这种问题。坊间存在若干特殊的统计软件是专门用来处理这种类别型潜变量问题的,例如 Statistical Innovations 公司的Latent GOLD 软件(商业软件),或是Jeroen Vermunt 博士的LEM(自由软件)。(3)线性关系的假定结构方程模型预设了所有的可观测变量和它们所属的潜变量之间,以及潜变量和潜变量之间的关系,都必须是线性的。不过这倒不至于构成太严重的限制,因为就和一般的回归分析一样,对于我们所假定的变量间的非线性关系,我们仍然可以针对变量进行函数转换,来适应这个变量间必须是线性的要求。(4)潜变量的假定在结构方程模型里面,我们基本上假定所有的路径关系,
12、都只能采用非直接衡量的方式加以处理,也就是只存在潜变量路径分析。(5)多元的可观测变量在结构方程模型中,所有的潜变量都必需由至少三个以上的可观测变量来加以描述,如果只有一个可观测变量在解释着某个特定的潜变量,那么这就不是结构方程模型,而是回归分析。如果只有两个可观测变量在解释着某个特定的潜变量,那么在模型中,这两个可观测变量必须被正式地表述(specify)为相关,通过对这个相关的估计(等于新增一个可观测变量),才能够避免因为可观测变量不足所导致的识别不足(under identification)问题,如果识别不足,则模型将受制于自由度不足而无法求解,连带的,当然也无法估计模型的拟合指标。一
13、个衡量模型至少必须满足恰好识别(just identification)的条件才可能求解。恰好识别的模型又称为饱和模型(saturated model),也就是模型所构造的协方差矩阵(港台称为共变异矩阵,covariance matrix)中的元素数量,刚好和所需要估计的参数数量相等,这时在估计参数的时候,刚好用尽了所有的自由度,所以参数虽然可以被估计出来,但是却也因此而无法估计拟合指标,因为没有自由度的估计,其实就等于是真实的计算,也就是百分之一百的拟合,或者这么说,其实根本就没有拟合的概念可言。在这样的情形下,用来估计结构方程模型的软件,不论是Lisrel 还是AMOS,都将会报告自由度为
14、0,卡方值为0,同时无法计算显著水平。研究者真正想要的其实是过度识别(over identification),过度识别代表已知变量间的协方差数量,大于未知的待估计参数的数量,所以这时模型的自由度将会是正的数值,我们才能够应用结构方程模型的软件来估计参数,同时计算出模型的各种拟合指标来。事实上由信度的立场来看这个问题,越多的可观测变量通常其结构信度也较佳,这可由Cronbachs alpha 信赖系数的计算即可清晰观察出来,在同一个构念中,当我们放入的近似的衡量题项愈多,Cronbachs alpha 的值很容易就可以升高。所以在构造衡量题项的时候,最好尽可能从多维度多视角的多元观点来广泛采纳
15、可观测变量,不要吝惜于可观测变量被纳入研究工具中的数量。毕竟在研究工具接受前测中效度信度检查的时候,就可能开始删减题项了,再加上田野调查之后,根据大规模数据进行衡量模型的效度信度检查时,还可能继续删减题项,如果原始题项不足,在最后的结构模型分析阶段,就很可能发生识别不足或是恰好识别的问题,为研究过程带来无谓的麻烦。(6)不存在多重共线性的假定和多元回归分析一样,结构方程模型假定了模型中的变量之间,不存在共线性的问题。但是由于结构方程模型的优势之一,就是可以在模型中直接将共线性清晰地予以表述(specify)出来,所以,本质上,结构方程模型还是可以处理多重共线性的问题。不过,如果这多重共线性十分
16、严重,在最极端的情形下称之为完全共线,那么就会导致模型中出现奇异(singular)矩阵,由于奇异矩阵是无法进行某些矩阵代数运算的,例如就不能进行转置(inverse)运算,结果就会使得结构方程模型无法求解。(7)残差独立的假定和多元回归分析一样,结构方程模型也假定了模型中可观测变量的残差之间是不存在相关的。但是由于结构方程模型中,我们一样可以将这些相关的残差,直接在模型中清晰地表述出来,所以结构方程模型还是可以处理残差相关的问题。只是要在模型中定义某些残差的相关,并不是随心所欲想要相关就相关的,更不应该只是单纯为了改善模型拟合指标,才让某些残差在模型中表述为相关,设计模型的要点就是要掌握理论
17、依据,实事求是,必须能够合理解释某对残差间为何必然存在相关,这才可以在模型中表述为相关。(8)不存在接近零的协方差矩阵(covariance matrix)结构模型本身必须真有意义,而不是潜变量的瞎拼瞎凑。如果结构模型里潜变量之间的因果关系不明确,或是关系甚小,就可能导致满盘都接近 0的协方差矩阵。由于许多拟合指标的计算过程(例如卡方检定、CFI、NFI、RMSEA、RMR 等等),其实是在观察每次模型修正后,真实数据下的协方差矩阵,和虚无假说(null hypothesis)下内容为 0的协方差矩阵之间差异的变化。当真实观察到的协方差矩阵很接近 0的时候,这些计算拟合指标的程序将无法分辨协方
18、差矩阵间的差异,所以就会认定不存在不拟合的现象,因此就高估了拟合指标。(9)适当的样本大小大多数国外管理学期刊里使用了结构方程模型的研究中,所使用的样本数量大约介乎于200到 400 之间。另外,许多学者对于样本数量做出了各种原则性的建议,但是也众说纷纭,没有一定的标准。其中大多数的学者相信,如果样本数低于 200,那么所获得的参数估计将不稳定。事实上,样本数量和模型中的变量数量之间,存在着密切关系。一般认为,适合进行结构方程模型的样本数量,至少应该是模型中所有可观测变量数量的 10到20倍(Mitchell,1993),或者是所需要估计的参数(包含所有系数和残差)的数量的5倍(Bentler
19、 and Chou,1987),虽然有些研究指出,卡方检定对样本数太敏感,过大的样本数容易导致较差的卡方拟合,但是比较新的观点认为,样本数还是尽可能愈大愈好,因为在中央极限定理之下,大的样本数比较能保证观测变量的正态性。(三)结构方程模型的构造与参数估计过程诚如前述,结构方程模型基本上是路径分析和因子分析的结合体,其中的路径,指的是潜变量之间的因果关系,而因子分析指的则是衡量模型,由可观测变量和潜变量组合而成。事实上,不论是路径还是衡量模型,这些变量之间的关系,全都可以使用一般人容易明白的图解形式很直观地加以表达,同时,它们也可以使用学者所熟悉的数学语言,例如线性代数的形式,精确地加以表述。这
20、两种方式,是一而二,二而一的事,本质上没有区别。在这里,本书将采用AMOS 软件为例,来对比一下结构方程模型的构造过程。不过在正式开始构造结构方程模型之前,让我们先来复习一下线性代数中,关于矩阵向量的一些基本概念。(1)向量与矩阵的基本概念二维行向量v=v1v2向量的加减v=v1v2与w=w1w2相加等于 v+w=v1+w1v2+w2常数乘向量av=av1v2=av1av2向量的乘积a bcd=ac+bdabc d=ac adbc bd矩阵和向量的乘积a bc def=ae+bfce+dfa bc d ef g h=ac+bf ad+bg ae+bh矩阵和矩阵的乘积a11a12a21a22b1
21、1b12b21b22=a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22(2)构造结构方程模型方框代表可观测变量,白色的圆圈代表潜变量,单箭头表示因果路径,双箭头表示相关。(3)模型的表述(specification)方式先考虑一个最简单的,只有三个“可观测变量”的“衡量模型”。假定三个“可观测变量”分别是x1,x2,x3,相对应的残差分别是1,2,3,需要估计的因子负载分别是1,2,3,“潜变量”是1。此一衡量模型以图形形式表达如下:以回归方程式的形式表达如下:x1=11+1x2=21+2x3=31+3以矩阵形式表达如下:X=x+1231
22、x1x2x3x1x2x3=1231+123这个模型的限制条件是:E(i)=0COV(1,i)=0,i=1,2,3COV(i,j)=0,i j结构方程模型的求解过程,其实是想要通过样本中的数据,来估计模型中所有的参数(),然后假定这个样本的,可以如实地反映母体的所有模型中的参数()。而这个求解过程,主要通过“方差-协方差矩阵(variance-covariance matrix)”的计算来达成。如果我们所构造的想像的概念模型,真的能够反映这个真实的世界,那么样本估计参数的“方差-协方差矩阵”和母体真实参数的“方差-协方差矩阵”应该相等,也就是:()()根据“方差-协方差矩阵”的定义,我们可以这么
23、来估计参数():()=E(XX)=E(x+)(x+)=xE()x+=xx+其中 是潜变量 的“方差-协方差矩阵”。是残差的“方差-协方差矩阵”。在这个衡量模型里,我们只有一个单一的潜变量,所以:=11=123=VAR(1)0VAR(2)00VAR(3)由于计算上的需要,我们必须定义一个初始值,于是将 11 强制限制为 1 ,代进上述的矩阵方程可以得到:()=11211+VAR(1)21111121211+VAR(2)31111131211131211+VAR(3)=11+VAR(1)211121211+VAR(2)311131211131211+VAR(3)换句话说,我们其实是在求解六个联立方
24、程式:S11=11+VAR(1)S21=2111S22=21211+VAR(2)S31=3111S32=312111S33=31211+VAR(3)详细求解过程在这不赘述。总而言之,这一个仅有三个“可观测变量”的“衡量模型”,也可以使用“方差-协方差矩阵”的形式加以表达,而这种表达方法,可以更有效地阐述一些单纯由回归式很难表达出来的,潜变量之间、或是残差之间可能的相关现象。所以最后这种表达形式,最能将模型完整表达清楚。X=x+x1x2x3=12311+110220033进一步稍微复杂化刚刚的衡量模型。假定刚才模型中的可观测变量 x1和x2的残差之间存在预期的相关21,那么此一衡量模型以图形表达
25、将变成如下形式:以“方差-协方差矩阵”的形式加以表达,则如下所示:X=x+x1x2x3=12311+1121220033这样的表达方式,确实非常的清晰简便。不过到此为止,我们所考虑的“衡量模型”是所谓的“一阶(first order)”的“验证性因子模型”,也就是说,其中的“可观测变量”之间只存在一个维度,也就是那个被归因的“潜变量”所代表的维度。但是许多时候,反映某个特定概念的一群“可观测变量”间,还可以再归纳出不同维度出来,换句话说,这个特定概念下,是存在结构的,通过这结构,可以进一步将这些“可观测变量”分群。这就是所谓的“多阶(higher order)”的“验证性因子模型”。例如下面这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 结构 方程 模型
限制150内