应用统计学 第十章 结构方程模型.ppt
Ma Xin,North China Electric Power University内容提要第十章 结构方程模型结构方程模型简介结构方程模型简介结构方程模型的机理结构方程模型的机理结构方程模型的求解和评价结构方程模型的求解和评价Ma Xin,North China Electric Power University基本概念基本概念两类变量:两类变量:隐变量和显变量隐变量和显变量l显变量(测量变量)可直接测量l隐变量不可直接测量的变量工作满意度:如何测量?工作满意度:如何测量?l您对自己的工作环境是否满意?在1-7分范围打分l用一组问题来测量,构建测量模型测量误差大测量误差大减小测量误差减小测量误差 X1X2X3X4 1 2 3 4 41 31 21 11Ma Xin,North China Electric Power UniversityAUSTRALIAN EMPLOYEE SATISFACTION:to their work environmentRespondents were asked to rate whether they agreed or disagreed with a number of statements using the following scale:l1.Disagree stronglyl2.Disagreel3.Neither agree nor disagreel4.Agreel5.Agree StronglyMa Xin,North China Electric Power UniversitystatementsMa Xin,North China Electric Power University基本概念基本概念-续续内生变量和外生变量内生变量和外生变量l内生变量由模型内其他变量作用所影响的变量l外生变量变量的影响因素在模型之外 Ma Xin,North China Electric Power University路径图:用带箭头的线表示变量间预先路径图:用带箭头的线表示变量间预先设定的关系设定的关系隐变量显变量因果关系相关关系潜在外生变量潜在内生变量Ma Xin,North China Electric Power University一、结构方程模型简介一、结构方程模型简介回归模型:回归模型:l一个变量与一组变量间的因果关系(单方程)l一组变量间的复杂因果关系(联立方程)l所有变量可观测:显变量因子分析因子分析l寻找影响一组可观测变量的潜在因子l或者说由一组可观测变量定义潜在因子Ma Xin,North China Electric Power University回归方程:结构模型单方程X1X2XkYMa Xin,North China Electric Power University回归方程:结构模型联立方程X1X2X3Y1Y2Y3内生变量外生变量识别:当不能得到联立方识别:当不能得到联立方程模型中某个结构方程的程模型中某个结构方程的确定的结构参数估计值时,确定的结构参数估计值时,称该方程为不可识别称该方程为不可识别结构参数Ma Xin,North China Electric Power University因子模型因子模型(测量模型)(测量模型)X1X2X3X4 1 2 3 4 41 31 21 11因子载荷测量误差Ma Xin,North China Electric Power University结构方程模型结构方程模型描述一组隐变量间的因果关系描述一组隐变量间的因果关系例如:顾客满意度和再购买意愿间的关系例如:顾客满意度和再购买意愿间的关系l顾客满意度:不可直接测量l再购买意愿:不可直接测量l结构方程构建方式建立测量模型测量隐变量:一组问题测量顾客满建立测量模型测量隐变量:一组问题测量顾客满意度,一组问题测量再购买意愿意度,一组问题测量再购买意愿构建再购买意愿与顾客满意度的结构关系模型构建再购买意愿与顾客满意度的结构关系模型Ma Xin,North China Electric Power University结构方程模型:路径图结构方程模型:路径图再购买意愿再购买意愿 X1X2X3X4 1 2 3 4 41 31 21 11 y1y2 1 2 22 12 顾客满意度顾客满意度 Ma Xin,North China Electric Power University一个实例:出租车行业服务满意度一个实例:出租车行业服务满意度Ma Xin,North China Electric Power UniversityMa Xin,North China Electric Power UniversityX1X2X3X4 1 2 3 4Y1Y2 1 2Y3Y4Y5 3 4 5Y6 6Y7Y8 7 8Ma Xin,North China Electric Power UniversityX1X2X3X4 1 2 3 4.81.64.64.59.59.72.72Y1Y2 1 2.97.64Y3Y4Y5 3 4 5.85.83.80Y6 6.40Y7Y8 7 8.79.47.57.24.75.92-.11.31Ma Xin,North China Electric Power University二、结构方程模型机理二、结构方程模型机理模型设定:模型设定:2个模型个模型l测量模型 表示隐变量和观测变量之间的关系 l结构模型(隐变量模型)表示隐变量之间的结构关系 Ma Xin,North China Electric Power University二、结构方程机理二、结构方程机理-续续简单示例:推销员的工作满意度与自尊需要简单示例:推销员的工作满意度与自尊需要,n=106工作满意度工作满意度 Y1Y2 1 2 y2 y1自尊需要自尊需要 X1X2 1 2 x2 x1注意:两个测量模注意:两个测量模型都无法识别型都无法识别测量模型测量模型独立测量模型可识别独立测量模型可识别至少需要三个指标至少需要三个指标Ma Xin,North China Electric Power University结构模型结构模型工作满意度工作满意度 自尊需要自尊需要 的性质不同于的性质不同于的性质不同于的性质不同于 和和和和 :反映反映反映反映和和和和 之间的相关之间的相关之间的相关之间的相关关系,而关系,而关系,而关系,而 和和和和 反映测量误差反映测量误差反映测量误差反映测量误差全模型全模型工作满意度工作满意度 Y1Y2 1 2 y2 y1自尊需要自尊需要 X1X2 1 2 x2 x1 测量模型测量模型结构模型:结构模型:为了解决尺度不确定性,我们设为了解决尺度不确定性,我们设=1=1,y1y1=1=1,因此待估参数有,因此待估参数有9 9个:个:Ma Xin,North China Electric Power University y1y1=1=1,上述,上述6 6个方程求解个方程求解5 5个参数:个参数:参数求解:参数求解:Ma Xin,North China Electric Power UniversityMa Xin,North China Electric Power University工作满意度工作满意度 Y1Y2 1 2.82.79自尊需要自尊需要 X1X2 1 2.71.77.47 Ma Xin,North China Electric Power University三、结构方程模型的求解和评价三、结构方程模型的求解和评价UppercaseLowercaseNameUppercaseLowercaseNamealphanubetaxigammaomicrondeltapiepsilonrhozetasigmaetatauthetaupsiloniotaphikappachilambdapsimuomegaMa Xin,North China Electric Power UniversityMatrices of the X-Model三、结构方程模型的求解和评价三、结构方程模型的求解和评价Ma Xin,North China Electric Power University符号说明符号说明xobserved indicators of xfactor loadings relating x to latent exogenous variables(外外生隐生隐变变量量)measurement errors for xMa Xin,North China Electric Power UniversityVariance/Covariances among the exogenous variables外生变量 方差/协方差矩阵Ma Xin,North China Electric Power UniversityMatrices of the Y-ModelMa Xin,North China Electric Power University变量说明变量说明yobserved indicators ofyfactor loadings relating y tolatent endogenous variables(内生内生隐变量隐变量)measurement errors for yMa Xin,North China Electric Power UniversityMatrices of the Structural ModelMa Xin,North China Electric Power University变量说明变量说明coefficients relatingtocoefficients relatingtoresiduals in equations Ma Xin,North China Electric Power UniversityResiduals in the prediction of the endogenous variables结构方程残差的协方差矩阵x1x1x2x2x x3 3x x4 411223 33 3y1y1y2y2y y3 3y y4 411223 34 411221122x11x11x x2 21 1x32x32x42x42y11y11y21y21y32y32y42y4221211 11 1221 12 21 12211结构方程模型的分析特点:透过所有观测变量间的方结构方程模型的分析特点:透过所有观测变量间的方差协方差,来验证如上理论模型(同时验证测量和结差协方差,来验证如上理论模型(同时验证测量和结构两系列模型)。构两系列模型)。设立假设:观测到的方差阵产生自如上理论模型设立假设:观测到的方差阵产生自如上理论模型What is SEM?Operating model(form unknown)PopulationdataSoPopulationCovarianceMatrixSpecifi-cation+parsimonyerrorSpecifi-cation+parsimonyerrorSpecifi-cation+parsimonyerroretc.etc.kk-1k+1#SSkSampleCovarianceMatrixFittedCovarianceMatrixSamplingErrorApproximating ModelsDestDpopPopulationDiscrepancyEstimatedDiscrepancy(Operationalizedas a GFI)POPULATIONSAMPLEspecifies relationships among.SkApproximateCovarianceMatrixYSampledatamatrixMa Xin,North China Electric Power University参数估计方法:Ma Xin,North China Electric Power University参数估计方法:作观测值协方差阵S的极大似然估计真实协方差阵的模型如下:Ma Xin,North China Electric Power University模型的识别问题:概念模型的识别问题:概念1-参数识别参数识别当一个未知参数可以由观测变量的方差协当一个未知参数可以由观测变量的方差协方差矩阵中的一个或者多个元素的代表函方差矩阵中的一个或者多个元素的代表函数来表达,就称这个参数可识别的。如果数来表达,就称这个参数可识别的。如果模型中的参数都是识别参数,那么这个模模型中的参数都是识别参数,那么这个模型就是可识别的。型就是可识别的。当参数可以由一个以上的不同函数来表达,当参数可以由一个以上的不同函数来表达,这种参数称为过度识别参数。过度识别参这种参数称为过度识别参数。过度识别参数可以由不同函数来求解。如果模型正确数可以由不同函数来求解。如果模型正确的话,该参数应该解惟一。的话,该参数应该解惟一。Ma Xin,North China Electric Power University概念概念2:模型识别:模型识别过度识别过度识别当一个模型中的参数都是识别的并当一个模型中的参数都是识别的并且至少有一个是过度识别的,那么这个模型就是过且至少有一个是过度识别的,那么这个模型就是过度识别的度识别的 恰好识别恰好识别当一个模型中的参数都是识别的并当一个模型中的参数都是识别的并且没有一个是过度识别的,那么这个模型就是恰好且没有一个是过度识别的,那么这个模型就是恰好识别的识别的 不可识别不可识别模型中至少有一个不可识别的参数模型中至少有一个不可识别的参数 不可识别模型和恰好识别模型都是不令人满意的,因为不可识别模型和恰好识别模型都是不令人满意的,因为不可识别模型和恰好识别模型都是不令人满意的,因为不可识别模型和恰好识别模型都是不令人满意的,因为我们无法得到确定解,或即使能得到惟一解也无法识别我们无法得到确定解,或即使能得到惟一解也无法识别我们无法得到确定解,或即使能得到惟一解也无法识别我们无法得到确定解,或即使能得到惟一解也无法识别模型在统计上是否合理。模型在统计上是否合理。模型在统计上是否合理。模型在统计上是否合理。Ma Xin,North China Electric Power University模型识别:不可识别的原因模型识别:不可识别的原因模型能否识别并不是样本的问题模型能否识别并不是样本的问题 原因:原因:1、自由度少自由度少 2、因子之间的相互作用,即双向作用因子之间的相互作用,即双向作用 Ma Xin,North China Electric Power University模型识别:判断方法模型识别:判断方法数据点的数目不能少于自由参数的数目。数据点数据点的数目不能少于自由参数的数目。数据点的数目就是观测变量的方差和协方差的数目。自的数目就是观测变量的方差和协方差的数目。自由参数的数目特指待定的因子载荷、路径系数、由参数的数目特指待定的因子载荷、路径系数、隐变量和误差项的方差、隐变量之间与误差项之隐变量和误差项的方差、隐变量之间与误差项之间的协方差的总数间的协方差的总数 必须为模型中的每一个隐变量建立一个测量尺度。必须为模型中的每一个隐变量建立一个测量尺度。通常将外生隐变量的方差设定为通常将外生隐变量的方差设定为1;将内生隐变;将内生隐变量的观测标识中任何的一个因子负载设定为一个量的观测标识中任何的一个因子负载设定为一个常数,通常为常数,通常为1 Ma Xin,North China Electric Power University模型识别:预防措施模型识别:预防措施预防不可识别的模型主要是有关参数的设预防不可识别的模型主要是有关参数的设定,尽量减少自由参数的数目,让模型简定,尽量减少自由参数的数目,让模型简约。当模型中的变量之间有循环或是双向约。当模型中的变量之间有循环或是双向关系,那么这个模型就是非递归的,一般关系,那么这个模型就是非递归的,一般是不可识别的。是不可识别的。Ma Xin,North China Electric Power University样本容量样本容量一般而言,最保守的是一个变量要一般而言,最保守的是一个变量要5个样个样本来衡量,此时样本服从多元正态分布,本来衡量,此时样本服从多元正态分布,而且没有奇异值。也有人认为一个变量由而且没有奇异值。也有人认为一个变量由15个样本来衡量比较好。最低的样本要求个样本来衡量比较好。最低的样本要求是是50。一般样本量在。一般样本量在100200之间比较合之间比较合适。适。Ma Xin,North China Electric Power University变量数量变量数量选择多个指标表示隐变量具有统计上和概念选择多个指标表示隐变量具有统计上和概念上的优势上的优势一般以一般以34个指标表示个指标表示1个因子比较合适个因子比较合适当因子互相关联的时候,可以减至当因子互相关联的时候,可以减至2个个Ma Xin,North China Electric Power University模型评价:模型评价:3个方面个方面结构检验、测量模型信度结构检验、测量模型信度(Measure Reliability)模型总体检验指标模型总体检验指标简约性简约性Ma Xin,North China Electric Power University结构检验、测量信度结构检验、测量信度结构参数结构参数t检验、合理性检验、合理性相关性相关性t检验检验测量信度测量信度X1XiXkh1hih3f1Ma Xin,North China Electric Power University实例:创新扩散研究实例:创新扩散研究AdoptionlY1:假设有一软件新模块上市,你在下月采用的可能性有多大?(0-100)lY2:如果你发现仅有10%的老用户在未来6个月内采用,你采用的可能性多大?(0-100)Value of innovationlX1:新模块将提供更强功能;lX2:新模块将更适合我的用途lX3:新模块将增加我处理离散逻辑系统的能力Leading-edge userl我们采用新技术很快l我们愿意承担采用新技术的风险Ma Xin,North China Electric Power University结构方程模型:路径图结构方程模型:路径图Ma Xin,North China Electric Power University非标准化输出非标准化输出Ma Xin,North China Electric Power University标准化输出标准化输出Ma Xin,North China Electric Power University模型评价:绝对指标模型评价:绝对指标从设定模型的拟合和独立模型拟合之间的从设定模型的拟合和独立模型拟合之间的比较得出的比较得出的 卡方值(卡方值(p0.20)lH0:the observed correlation metrics was generated by the proposed modelGFI:0.95AGFI:0.9Ma Xin,North China Electric Power University模型评价:简约性模型评价:简约性阿凯克信指数阿凯克信指数 AIC一致性阿凯克信指数一致性阿凯克信指数CAIC期望交叉证实指数期望交叉证实指数 ECVI这些值的数值越小,就说明模型简约并拟合的很这些值的数值越小,就说明模型简约并拟合的很好,但是这些指标都不是统计值,因此没有统计好,但是这些指标都不是统计值,因此没有统计检验来确认两个模型之间的差异是否显著。在应检验来确认两个模型之间的差异是否显著。在应用时,先估计每个模型,将它们按其中一个指标用时,先估计每个模型,将它们按其中一个指标进行比较,然后选择其中值最小的模型。进行比较,然后选择其中值最小的模型。Ma Xin,North China Electric Power UniversityAICModelAICBCCBICCAICDefault model54.40156.607113.414132.414Saturated model72.00076.181183.814219.814Independence model557.812558.741582.660590.660创新扩散研究创新扩散研究ECVIModelECVILO 90HI 90MECVIDefault model.332.335.415.345Saturated model.439.439.439.465Independence model3.4012.9633.8853.407Ma Xin,North China Electric Power University模型修正模型修正改变测量模型,增加新的结构参数改变测量模型,增加新的结构参数 设定某些误差项相关设定某些误差项相关 限制某些结构参数限制某些结构参数Ma Xin,North China Electric Power University建立结构方程模型的步骤Ma Xin,North China Electric Power University日日本本单单身身妇妇女女Ma Xin,North China Electric Power University日本单身妇女日本单身妇女Office LadyMa Xin,North China Electric Power UniversitySEM应用:应用:Ma Xin,North China Electric Power University本章小结本章小结结构方程模型:结构方程模型:l利用联立方程组求解,但是没有严格的假设限定条件,同时允许自变量和因变量存在测量误差。分析隐变量间因果关系分析隐变量间因果关系l两个模型测量模型:确认性因子分析测量模型:确认性因子分析/各参数的意义各参数的意义结构模型结构模型路径图路径图方程方程方程方程路径图路径图模型评价:模型评价:l结构检验、相关性检验、测量模型可靠度检验、模型总体评价