多元统计分析原理与操作技术.ppt
《多元统计分析原理与操作技术.ppt》由会员分享,可在线阅读,更多相关《多元统计分析原理与操作技术.ppt(116页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七讲第七讲 多元统计分析原理与操作技术多元统计分析原理与操作技术宁波大学宁波大学 张张 林林心理学硕士研究生基础平台课程心理学硕士研究生基础平台课程数据分析数据分析描述统计推断统计平均数标准差相关系数差异检验相关分析方差分析(方差分析(ANOVAANOVA)n方差分析是一种通过分析样本数据各项差异的来源,以检验二个或二个以上样本空间的平均数是否相等或是否具有显著差异的方法。n方差分析的原理 变异分解 总变异=随机变异+实验处理所导致的变异 总变异=组内变异+组间变异 F值=组间变异(MSb)/组内变异(MSw)n 方差分析的主要功能是分析因变量的总变异中不同来源的变异,然后用系统变异误差变异
2、来看各种变异对总变异影响。n实验中各种变异的控制使系统变异的效应增大;)选取适当的自变量的水平;)选择对自变量敏感的因变量;控制无关变异;)随机化;)消除(恒定的方法);)匹配;)附加自变量;)统计控制;使误差变异最小;(被试和测量工具)注:实验设计的精髓就是增大系统变异,控制无关变异和注:实验设计的精髓就是增大系统变异,控制无关变异和减少误差变异减少误差变异 n方差分析的基本假设条件l正态分布(normolity);l变异的同质性(homogeneity of variance);l独立性(independence);一、单因变量1.单自变量1.1 自变量2个水平 独立样本:独立样本t检验
3、相关样本:相关样本t检验1.2 多个水平p独立样本:one-way 差异显著后,需事后比较,post hoc。p相关样本:repeated measure 差异显著后,需事后比较,做两两相关样本t检验。2.两个自变量2.1 两因素都是被试间设计p交互效应不显著,主效应显著,对主效应做事后比较;p交互作用显著,对交互效应做简单效应检验。n处理(处理(treatment)与处理水平的结合()与处理水平的结合(treatment combinations)处理和处理水平的结合都是指实验中一个特定的独特的实验条件n主效应(主效应(main effects)与交互作用()与交互作用(interactio
4、n)实验中由一个因素的不同水平引起的变异叫因素的主效主效应应在一个多因素实验中,一个因素的不同水平对另一个因素的不同水平的影响叫做因素之间的交互作用交互作用B1A1A2(a)B2A2B1 B2A1(c)A2A1B1 B2(d)A2A1B1 B2(b)n简单效应(简单效应(simple effects)在因素实验设计中,一个因素的水平在另一个因素的某个水平上的变异叫做简单效应。简单效应。图A因素在B、B水平的简单效应B1A1A2(a)B2A1(b)A2 A2A1B1 B2(c)A2A1B1 B2(c)图B因素在A、A水平的简单效应因素实验得出的数据如下:实验得出的数据如下:A 教学方法B 学习能
5、力a1 正常讲授教学a2 独立学习和讨论b1 能力较高的b2 能力较低的 例如,一个研究要探讨两种教学方法对不同能力学生学习例如,一个研究要探讨两种教学方法对不同能力学生学习成绩的影响。研究中有两个因素,如下所示:成绩的影响。研究中有两个因素,如下所示:b1 b2a1a2 80 78 92 647978 86 66下面我们用图解的方式观察一下各因素的影响及交互作用的情况:图图3 两种教学方法对不同能力学生学习成绩的影响两种教学方法对不同能力学生学习成绩的影响10090807060A1A2(79)(78)1001009090808070706060(86)(66)(92)(64)(78)(80)
6、教学方法与学习能力对学生学习成绩的影响教学方法与学习能力对学生学习成绩的影响B1B1B2B2(a)(a)(b)(b)(c)(c)由图由图(a)(a)可以看出,学生的学习能力对学习成绩有重要影响。可以看出,学生的学习能力对学习成绩有重要影响。由图由图(b)(b)可以看到,若只考察教学方法的影响,我们会发现两可以看到,若只考察教学方法的影响,我们会发现两种教学方法对学生学习成绩的影响没有明显的差别。种教学方法对学生学习成绩的影响没有明显的差别。只有当同时考察两个因素的作用时,才能观察到它们之间的只有当同时考察两个因素的作用时,才能观察到它们之间的真实关系:在真实关系:在a1a1的条件下能力高与能力
7、低的学生的成绩没有差异,的条件下能力高与能力低的学生的成绩没有差异,而当使用教学方法而当使用教学方法a2a2时,能力高与能力低学生的学习成绩出现了时,能力高与能力低学生的学习成绩出现了显著的差异。(见图显著的差异。(见图(c)(c))。a1a2两个被试间变量的简单效应检验程序A因素有三个水平,B因素有两个水平,因变量是Y1.检验B因素在A的三个水平上的简单效应 MANOVA Y BY A(1,3)B(1,2)/DESIGN=B WITHIN A(1)/DESIGN=B WITHIN A(2)/DESING=B WITHIN A(3).2.检验A因素在B的两个水平上的简单效应 MANOVA Y
8、BY A(1,3)B(1,2)/DESIGN=A WITHIN B(1)/DESIGN=A WITHIN B(2).2.2 两因素都是被试内设计p交互效应不显著,主效应显著,对主效应做事后比较;p交互作用显著,对交互效应做简单效应检验。两个被试内变量的简单效应检验程序A因素有三个水平,因素有三个水平,B因素有两个水平因素有两个水平1.检验B因素在A的三个水平上的简单效应 MANOVA A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 /WSFACTORS=A(3)B(2)/WSDESIGN=B WITHIN A(1)/WSDESIGN=B WITHIN A(2)/WSDESING=B
9、 WITHIN A(3).2.检验A因素在B的两个水平上的简单效应 MANOVA A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 /WSFACTORS=A(3)B(2)/WSDESIGN=A WITHIN B(1)/WSDESIGN=A WITHIN B(2).2.3 两因素混合设计p交互效应不显著,主效应显著,对主效应做事后比较;p交互作用显著,对交互效应做简单效应检验。两因素混合设计的简单效应检验程序A是被试内变量,有三个水平;B是被试间变量,有两个水平。1.以被试内变量为标准分类的程序:以被试内变量为标准分类的程序:MANOVA A1 A2 A3 BY B(1,2)/WSFA
10、CTORS=A(3)/WSDESIGN /DESIGN /WSDESIGN=MWITHIN A(1)MWITHIN A(2)MWITHIN A(3)/DESIGN=B.2.以被试间变量为标准分类的程序:以被试间变量为标准分类的程序:MANOVA A1 A2 A3 BY B(1,2)/WSFACTORS=A(3)/WSDESIGN /DESIGN /WSDESIGN=A /DESIGN=MWITHIN B(1)MWITHIN B(2).3.三个自变量3.1 三个自变量都是被试间设计p交互效应不显著,主效应显著,对主效应做事后比较;p交互作用显著,对交互效应做简单效应检验。三个被试间变量的简单效应
11、检验程序A因素有两个个水平,B因素有两个水平,C因素有两个水平,因变量是Y1.检验在c1水平上,B因素在A1和A2水平的简单效应;检验在c2水平上,B因素在A1和A2水平的简单效应;MANOVA Y BY A(1,2)B(1,2)C(1,2)/DESIGN=B WITHIN A(1)/DESIGN=B WITHIN A(2)/DESING=B WITHIN C(1)/DESING=B WITHIN C(2)/DESING=B WITHIN A(1)WITHIN C(1)/DESING=B WITHIN A(1)WITHIN C(2)/DESING=B WITHIN A(2)WITHIN C(1
12、)/DESING=B WITHIN A(2)WITHIN C(2).自变量个数和自变量水平的个数p自变量个数最好不超过3个p自变量水平个数最好不超过6个二、多因变量nMultivariate(多元方差分析)n多元方差分析,就是说存在着不止一个因变量,而是两个以上的因变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为因变量。nMultivariate(多元方差分析)相关分析1.两个变量之间的相关,散点图做法。2.偏相关分析是在相关的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来考虑这两个
13、因素间的关联程度。这种方法的目的是消除其他目的是消除其他变量关联性的传递效应变量关联性的传递效应。n 偏相关分析在理解检验变量和控制变量之间的关系时,通常有两种解释或模型,一种是共同作用假设,另一种是中介变量假设。被作用变量A共同作用变量 被作用变量B 作用变量 中介变量 被作用变量(变量A)(变量B)(1)在共同作用假设模型中,两个变量相关显著的原因在于他们都受同一变量的影响。如果这个起共同作用的变量不存在,即排除共同作用变量的效应,则两个分析变量的相关系数应为0。(2)在中介变量假设模型中,两个变量相关显著的原因在于变量A通过中介变量影响了变量B。在排除中介变量的效应后,两个变量的相关系数
14、显著逐渐降低或为0。学习策略、学习效能感、学习坚持性与学业成就学习策略、学习效能感、学习坚持性与学业成就的相关分析的相关分析回归分析1.一元回归分析2.多元回归分析p回归系数的意义p回归方程的检验p回归系数的检验pMethods的区别p多重共线性p虚拟变量转换方程系数的意义=a+bxa,,B,F,t,R2回归方程的检验回归系数的检验H0:Bj=0H1:Bj0t检验Methods的区别自变量的显著,且R2尽可能大。p同时分析法,将所有的预测变量同时纳入回归方程中估计因变量。分为Enter和Remove。p逐步分析法,依据解释力的大小,逐步地检查每个自变量的影响,分为Forward和Backwar
15、d。pStepwise,按各个自变量对因变量作用的大小,从大到小逐个引入回归方程。p层次分析法,有明确的理论依据,按顺序进入。多重共线性(定义)当自变量高度相关时,就会互相削弱各自对y的边际影响,使本身的回归系数下降而其标准误扩大,于是就会出现回归方程整体显著,但各个自变量都不显著的现象,即多重共线性。多重共线性(表现)1.方程检验F值显著,但是不显著;2.自变量的r12很高;3.多个自变量时,某一自变量可以被其他自变量线性表达。方程的确定系数很高,但每一自变量的偏确定系数很小。多重共线性(对策)1.去掉与因变量相关低,而与其他自变量高度相关的变量;2.去掉可以被其余变量线性表出的变量;3.增
16、加样本;4.组合自变量;5.数据转换n当自变量为分类变量时,必须先将分类变量转化为虚拟变量,然后当自变量为分类变量时,必须先将分类变量转化为虚拟变量,然后再将它再将它 们引入回归方程,所得到的回归结果才有明确的意义解释。们引入回归方程,所得到的回归结果才有明确的意义解释。n 虚拟变量虚拟变量:虚拟变量:虚拟变量是将分类变量加以量化描述的一种假设的变量,是将分类变量加以量化描述的一种假设的变量,当某种品质或属性出现时为当某种品质或属性出现时为1,不出现时为,不出现时为0。只有两个取值:。只有两个取值:0,1。虚拟变量数等于分类变量的水平数减一。将不设虚拟变量明确表示虚拟变量数等于分类变量的水平数
17、减一。将不设虚拟变量明确表示的类别为的类别为参照类参照类。n 例:例:汉族(汉族(1)藏族(藏族(2)回族(回族(3)汉族汉族1说明:说明:1表示是,表示是,0表示否表示否100100是汉族,而非藏族,也非回族是汉族,而非藏族,也非回族是藏族,而非汉族,也非回族是藏族,而非汉族,也非回族是回族,而非汉族,也非藏族是回族,而非汉族,也非藏族虚拟变量虚拟变量原变量原变量藏族藏族1回族回族1001其他民族其他民族(4)000非汉族,非藏族,也非回族,因非汉族,非藏族,也非回族,因而是其他民族而是其他民族虚拟变量的回归分析虚拟变量的回归分析n方差分析方差分析主要用于探讨不同来源的变异对总变异的影响主要
18、用于探讨不同来源的变异对总变异的影响大小,从而确定自变量对因变量的重要性。使用方差分大小,从而确定自变量对因变量的重要性。使用方差分析应满足的基本假设为:总体正态分布;变异是可加的;析应满足的基本假设为:总体正态分布;变异是可加的;各处理内及实验组内部的方差一致。扩大组间差异,减各处理内及实验组内部的方差一致。扩大组间差异,减小组内差异。小组内差异。n回归分析回归分析是通过观测值寻求自变量与因变量之间的函数是通过观测值寻求自变量与因变量之间的函数关系的一种统计方法,它所要解决的主要问题是:在相关系的一种统计方法,它所要解决的主要问题是:在相关变量间建立数学关系式,即回归方程;检验回归方程关变量
19、间建立数学关系式,即回归方程;检验回归方程存在的统计合理性,并对各自变量对因变量影响的显著存在的统计合理性,并对各自变量对因变量影响的显著性进行检验;利用回归方程进行预测和控制,并了解这性进行检验;利用回归方程进行预测和控制,并了解这种结果的精确程度。种结果的精确程度。回归分析与方差分析回归分析与方差分析单个分类变量的不同类别时,等价于单因素方差分析,回归系数检验等价于不同类别与参照类平均值之差的t检验。多个分类变量形成的虚拟变量,等价于多因素方差分析,只考虑主效应。既有分类变量,又有连续变量,等价于协方差分析,假定交互作用为0。(五)交互作用(五)交互作用 当某一自变量对因变量的作用大小与另
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 原理 操作 技术
限制150内