AMOS的使用.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《AMOS的使用.doc》由会员分享,可在线阅读,更多相关《AMOS的使用.doc(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流AMOS的使用【精品文档】第 31 页AMOS的使用 第一部分: 介绍 o 关于文挡 o 文挡o 获得AMOS帮助 第二部分 : SEM 基础o SEM概述o SEM术语 o 为什么使用SEM? 第三部分: SEM 假设o 合理的样本量 o 连续和正态内生变量o 模型识别(识别方程)o 完整数据或缺失数据的适当处理o 模型规范和因果关系的理论基础 使用AG建立和检验模型o 结构方程多重回归关系的说明o 使用AG绘制模型o 将数据读入到AMOS中o 选择AMOS分析选项和运行模型 第五部分: AMOS 输出解释o 评估整体模型拟合o 绝对拟合检验o 相对拟
2、合检验o 修改模型获得较好的拟合优度o 浏览路径图o 独立参数的显著性检验 摘要:结论的实质性解释第一部分:介绍关于文档 本课程使用AMOS(距结构分析)软件对结构方程进行简单的介绍和概述。结构方程模型(SEM) 包括多种统计技术,如路径分析,验证性因子分析,带潜变量的因果关系模型,甚至方差分析和多重线性回归。 课程介绍SEM的逻辑,SEM的假设和输入需求,怎样使用AMOS执行SEM分析。 到课程结束,能够使用AMOS拟合SEM。也能给出SEM适合研究问题的评价和SEM方法基本假设的概述。 应该已经知道使用SAS,SPSS或类似统计软件怎样产生多重线性回归分析。也应该理解怎样解释多重线性回归分
3、析的输出。最后,应该理解基本微软视窗导航操作:打开文件和文件夹,保存文件,重新调用先前保存过的文件,等等。 访问AMOS 可以用下列三种方法访问AMOS: 1. 个人计算机用户须从SPSS公司(SPSS 许可版本)或者Smallwaters 公司(独立版本)获得许可密码 2. 德克萨斯大学的教师,学生和职员经由STATS 视窗终端服务器访问AMOS。要使用终端服务器,必须获得ITS计算机账号(或分类账号),然后在NT服务器上验证账号。接下来下载和配置客户端软件使个人计算机,Macintosh,或 UNIX 工作站能连接终端服务器。最后连接服务器,通过双击位于STATS终端服务组中AMOS程序肖
4、像登陆AMOS。如何获得ITS计算机账号的细节,账号使用的变更,下载客户端软件和配置指导可以在 中找到。3. 从网站下载免费AMOS学生版到个人计算机上。如果模型比较小,免费演示版能充分满足需求。对大型模型,需要购买AMOS软件或通过校园网络访问ITS共享的软件副本。特别是如果决定利用服务器访问其它程序软件(例如,SAS,SPSS,HLM,Mplus等等),后一项选择最有效。 文档AMOS手册是由James Arbuckle 和 Werner Wothke撰写的AMOS 4.0 Users Guide 。包含20多个例子,有许多调查得到的典型模型。这些样本数据的例子在学生版和商业版的AMOS中
5、都有,所以能容易地在AMOS中拟合,修改描述模型。 AMOS 4.0 Users Guide 手册在UT Austin 的职员,学生,教师经检验合格后在 PCL 获得。也可以直接从网站定购。 Barbara Byrne 也写了一本使用AMOS的书。 书名是AMOS的SEM:基本概念,应用和编程。这本书由出版。 Lawrence Erlbaum Associates有限公司也出版SEM杂志(季刊)。杂志包含软件回顾,经验文章,理论文章以及教师部分和书评。 有许多SEM的教科书,范围从Ken Bollen的百科参考书到Rick Hoyle的更多实用编辑手册。几个常用的书名显示如下。 Bollen,
6、 K.A. (1989). 潜变量的结构方程 New York: John Wiley and Sons. Loehlin, J.C. (1997). 潜变量模型 Mahwah, NJ: Lawrence Erlbaum Associates. Hoyle, R. (1995). SEM:概念,问题和应用。 Thousand Oaks, CA: Sage Publications. Hatcher, L. (1996). 循序渐进把SAS系统用于因子分析和结构方程模型。Cary, NC: SAS Institute, Inc. 获得AMOS帮助如果在STATS视窗终端服务器上访问AMOS有困难
7、,请打ITS的客服电话512-475-9400 或发送 e-mail 到。如果能登陆视窗NT终端服务器运行AMOS,但有怎样使用AMOS或解释输出的问题,请预约统计和数学服务部,打ITS客服电话512-475-9400 或发送e-mail到 。 重要提示: 两个服务部只是在德克萨斯大学的教师,学生和职员使用。有关指导服务的更多信息及常见问题和回答EFA, CFA/SEM, AMOS, 其它题目见我们的网站 。非大学用户和大学AMOS用户可以访问网站获得有用的资源;怎样登陆论坛,发表问题和学习更多SEM的信息,见SEMNET上的在线讨论组第二部分: SEM基础 SEM概述 SEM是一般线性模型的
8、扩展。它能使研究者同时检验一组回归方程。SEM软件不但能检验传统模型,而且也执行更复杂关系和模型的检验,例如,验证性因子分析和时间序列分析。 进行SEM分析的基本途径显示如下: 理论解释模型构建模型识别数据收集模型检验结果研究者首先基于理论定义模型,然后确定怎样测量建构,收集数据,然后输入数据到SEM软件中。软件拟合指定模型的数据并产生包括整体模型拟合统计量和参数估计的结果。 分析的输入通常是测量变量的协方差阵,例如调查项目得分,虽然有时使用相关阵或协方差和均值阵。实际上,数据分析经常用原始数据提供给SEM,程序转换这些数据为它自身使用的协方差和均值。模型由测量变量间的关系组成。然后,这些关系
9、表示所有可能关系的限制。 样本协方差矩阵模型模型协方差矩阵结果有模型拟合的全部指数以及参数估计,标准误,模型中自由参数的检验统计量。 SEM术语SEM有其自身的语言。一般来讲统计方法有这种特性,但SEM用户和创建者似乎为这种方法发明了一个特殊的语言。 自变量,假设没有测量误差的,称为外生变量;因变量或中间变量被称作为内生变量。 观测变量直接由研究者测量,而潜在或不可观测变量不能直接测量但可由分析中测量变量的相关性或关联推断。统计估计可由多种方式实现,探索性因子分析从观测变量的共享方差中推断潜在因子的存在。SEM用户使用路径图表示观测和非观测变量间的关系。椭圆或圆形表示潜在变量,而长方形或方形表
10、示测量变量。残差总是非观测的,所以它们用椭圆或圆形表示。 下图所示,相关系数和协方差由双向箭头表示,表示没有明确定义因果方向的关系。例如F1和 F2 是有关的或相关的,但没有声称F1 导致 F2, 反之亦然。相反,我们声称 F1 引起测量变量I1 和 I2上的观测得分。因果效应在路径图中由单箭头表示。F1 和 F2 被两个指示因子共享的方差概念化(例如,两个指示因子共有什么。)至今为止正如所猜测的那样, F1 和 F2 是潜因子; I1 到I4 是观测变量。也许它们是调查项。E1 到 E4 是I1到 I4中引起响应方差的残差或误差方差 。路径图告诉我们1到4的得分或调查响应项是由两个相关因子及
11、每项的唯一方差引起的。部分唯一方差或许是由于测量误差。 路径图中一部分路径被标上数字 “1”。意思是这些路径系数设为固定值为1。必须要包括这些固定值: 它们设置潜在因子和残差的测量尺度。另一种选择是,把因子方差设置为1以获得固有的标准解。注释:当执行多组分析时不应该使用后一种方法。 为什么使用SEM? 如后面所见,研究者为什么想使用SEM和必需用它自己的语言处理一些相当严格的统计假设?SEM有许多吸引人的优点: 假设潜在的统计分析是明确的和可检验的,调查者能全部控制和进一步地分析理解。 绘图接口软件创造性地推进和使快速调式模型变得容易(这个特性取决于所选的SEM软件)。 SEM程序同时提供总体
12、模型检验和独立参数估计检验。 回归系数,均值和方差同时被比较,即使多个组间交叉。 测量和验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染。 拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。 SEM的最后特征是它最具吸引人的性质。SEM提供统一的架构,多个线性模型能使用灵活,功能强大的软件拟合。 第三部分: SEM的假设合理的样本量 SEM是一般线性模型灵活有力的扩展。像其它统计方法一样,需要一系列假设。这些假设应该满足或至少近似地保证有可信赖的结果。 按照James Stevens的社会科学的应
13、用多变量统计的说法,一个好的经验法则是在标准普通最小二乘多重回归分析中每个因子有15个个案。因为SEM在某些方面与多重回归紧密相关,SEM中每个测量变量15个个案是合理的。Bentler 和Chou (1987) 注意到只要数据表现良好(例如,正态分布,无缺失数据或例外值等等),在SEM分析中研究者对每个参数估计,只需要5个个案。注意Bentler 和Chou 提及每个参数估计要有5个个案而不是每个测量变量。测量变量在分析中至少有一个典型地路径系数与其它变量相关联,加上残差项或方差估计,所以认可Bentler 和Chou 和Stevens推荐的每个测量变量最小要15个个案相吻合是重要的。更一般
14、的, Loehlin (1992) 使用验证性因子分析模型报告蒙特卡洛仿真的研究结果,参考一些文献后,得出对两到四因子模型,调查者应该收集至少100个个案,200更好(如果可能)。使用小样本的结果包括迭代失败 (软件不能达到满意的解), 不合理的解 (包括测量变量的方差估计为负值)和降低参数估计的准确性,尤其是,标准误 SEM的标准误是在大样本假设下进行计算的。当数据是非正态分布或在某些方面是有缺陷的情况下 (几乎总是对个案),需要较大的样本。当数据有偏斜,有高低峰,不完整或不尽合理时,对所需要的样本量做出绝对的推荐是困难的。一般的推荐是尽可能获得较多的数据。 内生变量的连续和正态分布 SEM
15、程序假设因变量和中间变量(所谓的内生变量是SEM的叫法) 是连续分布,有正态分布的残差。事实上,SEM分析的残差不仅仅要求服从单变量正态分布,它们的联合分布也要服从联合多变量正态分布。然而,这个假设在实际中从未满足。 SEM专家已经开发多种方法处理非正态分布变量。这些方法是为假设有潜在连续分布的变量而设计。 例如,也许你管理一个研究参与者自信心项目的李克特量表。量表按照自信的连续程度由低到高计分,即使项目数据不是连续分布,潜在自信分布也是连续的。 相反,其它结果变量不是连续分布。例如,医学研究中病人处理后是生还是死?大部分SEM程序目前不能处理这些名义水平因变量的类型。 模型识别 (识别方程)
16、 如不久所见,为了产生有判断力的一组结果,SEM程序需要已知足够数量的相关阵或协方差阵作为输入。另一个要求是方程完全可识别。在SEM中,识别涉及参数估计至少有一个唯一解的概念。参数估计只有一个可能解的模型称为恰好识别。有无限可能参数估计值的模型叫做欠识别。最后,参数估计多于一个可能解(除了一个最佳或最优解外)的模型叫做过度识别。 下列方程,来自Rigdon (1997),或许可以帮助更清晰的理解这些概念: x + 2y = 7 在上面方程中,x 和 y 有无穷多个解(例如, x = 5 和 y =1, x = 3 和 y = 2)。因为“已知”比“未知”少,所以这些值是欠识别的。恰好识别模型是
17、方程个数与变量个数相同的方程。 x + 2y = 73x - y = 7 对这个方程,方程个数与变量个数相同,从而有一对最佳值 (x = 3, y = 2)。当每个参数可识别,至少一个参数是过度识别时,会出现过度识别模型(例如,方程能由多种方式求解而不是带一个方程的参数解,多个方程都会产生这种参数估计)。多数使用SEM的人都喜欢使用过度识别。过度识别模型有正自由度,也不必拟合恰好识别模型。当有过度模型时,施加在模型上的限制提供一组假设检验,然后它能被绝对拟合模型的卡方统计量和各种描述模型拟合指数估计。与过度识别模型相关的正自由度允许模型有虚假的卡方检验。当过度识别模型拟合良好时,研究者通常认为
18、模型有足够的拟合数据。 为了进行SEM 分析,识别是结构上或数学上的需要。许多规则能用于评价模型的识别水平,但这些规则不完善,用纸笔计算(事实上,几乎不可能)非常困难,尤其是复杂模型。SEM 软件例如AMOS把执行识别检查作为模型拟合过程的一部分。它们通常提供有关欠识别条件的合理警告。能出现另一个复杂化的情况是经验欠识别。当设置识别模型有非常小(接近0)估计的参数估计时,会出现经验欠识别。当SEM进行矩阵逆运算时,参数估计在模型参数定义的解空间中下降,这样程序突然侦测到结构欠识别问题是什么。由于SEM估计的自然迭代,参数估计例如方差从正值开始在一次一次迭代中渐渐地接近0。例如,估计值接近0的路
19、径系数在SEM矩阵逆运算算法中被当作0来处理。如果路径系数识别模型是必须的,那么模型就变成欠识别。 各种形式欠识别模式的补救方法是设法找到识别问题的来源和确定来源是经验欠识别还是结构欠识别。对结构欠识别,唯一的补救方法是重新定义模型。经验欠识别通过收集更多的数据或重新定义模型来校正。 Rigdon (1997)的例子可以说明这些问题。考虑下列模型: 它包含一个因子F1,两个误差或残差e1 和 e2,一个因子载荷连接F1 到 I2。模型需要估计四个参数:因子的方差,两个误差方差和一个因子载荷。 有多少可利用的输入能在分析过程中使用?三个。怎么知道要有输入三个变量?可以使用下面公式 Q(Q + 1
20、) / 2 这里Q 表示模型数据库中测量变量的数目。在这个模型中有两个观测变量, I1 和 I2,所以由上面公式显示, 2(2+1)/2 = 3。有两个方差,一个是两个变量都有的方差,一个是I1 和 I2间协方差。用三个输入估计四个未知参数怎么可能呢?答案是这是不可能的:有三个已知变量或可利用的自由度,但有四个未知参数要估计,所以模型的自由度是 3 4 = -1 ,明显地不可能。模型是欠识别为了得到满意识别水平,需要利用这个模型增加约束。 现在考虑第二个模型: 因为模型使用四个观测变量,所以新模型有 4(4+1) / 2 = 10个自由度。从10个自由度中减去四个误差方差,两个因子载荷和两个因
21、子方差,一个因子间的协方差结果剩下一个自由度。在结构上模型是可识别的。事实上,因为现在有一个正自由度,所以它是过度识别。事实表明,如果F1 和 F2的协方差参数估计恰好变成零或非常接近零,模型变成经验欠识别,因为即使在F1 和 F2间通过定义协方差在结构上识别它,从计算机软件观点看,依据经验它不会被识别。 实际上,所有成功的拟合模型是恰好识别或过度识别。通常使用过度识别模型因为这些模型允许检验统计假设,包括整体模型拟合(Loehlin, 1992)。完整数据或缺失数据的适当处理许多SEM软件接受相关阵或协方差阵的输入。换句话说,使用另一个软件(例如SPSS),能自己计算这些矩阵,然后将数据输入
22、到AMOS或其它SEM软件中进行分析。例如,在一本杂志中发表文章,如果打算重新分析报告的协方差阵,这个功能就很有用。 然而,通常使用行数据输入作为首选的模型分析:研究者通过数据库,也许是SPSS或其它通用格式(像微软的Excel ),给SEM程序,计算协方差作为分析的一部分。如果数据库没有完整的数据,这些程序能够做什么?缺失数据问题的典型解决方法包括个案的列删 ,如果个案有一个或多个缺失数据,整个个案的记录被删除;对删,两变量相关系数只有用到个案数据时才被计算。对删导致数据库中两变量协方差或相关系数有不同的样本量。缺失数据另一个典型的处理技术是在变量的缺失数据处用变量的均值替代。 但是这些典型
23、的缺失数据处理方法从统计观点来看没有多少吸引力。列删导致统计功效降低,特别是如果许多个案在多个变量上只有几个数据缺失,更不要说在数据库中所有完全测量的个体限制统计推断。对删在边际上比较好,但协方差或相关使用不同的样本量的结果对模型拟合效果有很大的影响,有时包括不可能解。最后,均值替代在所替代的地方会收缩变量的方差,这不是所期望的。这些方法最致命的问题是假设缺失数据是完全随机缺失,实际情况常常不是这回事 (Little & Rubin, 1987)。对缺失数据研究者能做什么?如果缺失数据个案的比例小,比如说小于或等于5%。列删可以接受 (Roth, 1994)。当然,如果5%(或更小)的个案不是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AMOS 使用
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内