SPSS-23.0统计分析—在心理学与教育学中的应用-9第九章-回归分析.ppt
《SPSS-23.0统计分析—在心理学与教育学中的应用-9第九章-回归分析.ppt》由会员分享,可在线阅读,更多相关《SPSS-23.0统计分析—在心理学与教育学中的应用-9第九章-回归分析.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、全书目录全书目录第一章第一章 SPSS 23.0SPSS 23.0简介与基本操作简介与基本操作第二章第二章 数据编辑与整理数据编辑与整理 第三章第三章 数据转换数据转换第四章第四章 描述统计分析描述统计分析第五章第五章 交叉表分析交叉表分析第六章第六章 比较平均值比较平均值第七章第七章 方差分析方差分析第八章第八章 相关分析相关分析第九章第九章 回归分析回归分析 第十章 信度和效度分析 第十一章 非参数检验第十二章 多选变量分析 第十三章 SPSS应用案例问卷调查分析 第十四章 SPSS应用案例测验质量分析 第十五章 探索性因子分析及案例应用 第十六章 基本统计图表的制作第十七章 SPSS应用
2、分析归纳小结 回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用回归的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式,从而根据变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。 这里仅介绍SPSS软件进行线性回归分析的常用类型,包括一元线性回归、多元线性回归,以及虚拟自变量回归分析。第九章第九章 回归分析回归分析 9.1 一元线性回归分析 9.2 多元线性回归分析 9.3 虚拟自变量回归 9.4 回归分析的报告参考样例 第九章第九章 回归分析回归分析 9.1 9.1 一元线性回归分析
3、一元线性回归分析案例:【例9- 1】一个人的智力水平与其个人成就动机的关系,某研究者调查了94名大学生,进行智力测验和成就动机测验,获得数据文件为“智商与成就动机.sav”,试分析个人成就动机测验分数对智力测验的回归方程。分析:此例属于一元线性回归,一般先做两个变量之间的散点图进行简单地观测。若散点图的趋势大概呈线性关系,可以建立线性方程;若不呈线性分布,可建立其它方程模型,并比较R2 来确定选择其中一种最佳方程式。一元线性回归方程的原假设 为:所建立的回归方程无效,回归方程中来自总体自变量的系数为0。备择假设 为:所建立的回归方程有效,回归方程中来自总体自变量的系数不为0。第第1 1步:步:
4、打开分析数据。打开“智商与成就动机.sav”文件。第第2 2步:步:散点图分析。一般先做散点图,点击菜单【图形】【旧对话框 】【散点图/点图】,弹出对话框。 选择【简单散点图】,再点击【定义】。在弹出散点图的主对话框。 将自变量“智商分数”选到“X轴”框内,因变量“成就动机分数”选到“Y轴”框内,点击【确定】按钮,得到下图。如图所示,自变量“智商分数”与因变量“成就动机分数”基本呈线性关系,因此可以进行线性回归。 如果自变量与因变量的散点图不是呈线性关系,而是反函数、二次函数,或者logistic函数等曲线关系,则使用曲线回归【分析】【回归】【曲线估算】。第第3 3步:步:启动分析过程。点击【
5、分析】【回归】【线性】菜单命令,打开如图所示的对话框。 第第4 4步:步:设置分析变量。设置因变量:在左边变量列表中选“成就动机分数”,选入到“因变量”框中。设置自变量:在左边变量列表中选“智商分数”变量,选入“自变量”框中。如果是多元线性回归,则可以选择多个自变量。从“方法”框内下拉式菜单中选择回归分析方法,有输入(Enter)、步进(Stepwise)、除去(Remove)、后退(Backward)、前进(Forward)五种。本例中选择输入(Enter)。 第第5 5步:步:设置分析参数。单击【统计】按钮,打开“线性回归:统计”对话框,可以选择输出的统计量,如图所示。在“回归系数”栏,有
6、“ 估算值”、“ 置信区间”、“ 协方差矩阵”;本例中选择“ 估算值”。在对话框的右边,有五个复选框:(1)“ 模型拟合”:Model fit是系统默认项,输出复相关系数R、R2及R2修正值,估计值的标准误,方差分析表。(2)“ R方变化量”:增加进入或剔除一个自变量时,R2的变化。(3)“ 描述”:基本统计描述。(4)“ 部分相关性和偏相关性”:相关系数及偏相关系数。(5)“ 共线性诊断”:共线性诊断。主要对于多元回归模型,分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指标等。本例中仅有一个变量,选择“ “ 模型拟合模型拟合”、“ “ R R方变化量方变化量”、“
7、 “ 描述描述”。在“残差”栏,有两个选项:“ 德宾-沃森”;“ 个案诊断”。个案诊断,即奇异值诊断,有两个选项:“离群值标准差”:奇异值判据,默认项标准差3。“所有个案”:输出所有观测量的残差值。在本例中不选择。 第第6 6步:步:设置保存选项。单击【保存】按钮,打开“线性回归:保存”对话框。选择需要保存的数据种类作为新变量存在数据编辑窗口。本例中,在“预测值”框选择“ 未标准化”。在“预测区间”框选择“ 平均值”;置信区间默认保持为“95%”。第第7 7步:步:设置选项参数。单击【选项】按钮,打开“线性回归:选项”对话框:在“步进法标准”中选择模型拟合判断准则:“ 使用F的概率”,默认为“
8、进入 0.05,删除 0.10”;“使用F值”,默认为“进入3.84,删除2.71”。按系统默认的方式选择。第8步:在主对话框中点击【确定】按钮,提交执行。第9步:结果分析。第一个表:描述统计(略) 第二个表:相关性(略) 第三个表:变量已输入/已移除(略) 第四个表:模型摘要 第五个表:ANOVA(方差分析表)第六个表:回归系数第七个表:残差统计数据回到SPSS数据窗口,可以看到在数据窗口中多了四列新变量为“PRE_1”、“RES_1”、“ LMCI_1”、“UMCI_1”,这四列新变量就是回归方程的预测体现。“PRE_1”为根据回归方程并基于自变量“智商分数”的预测值,“成就动机分数”与“
9、PRE_1”预测值之残差值“RES_1”。“ LMCI_1”为预测值的最小值,“UMCI_1”为预测值的最大值。假如在本例中根据实际应用需要,假设定义残差值“RES_1”的绝对值小于一个标准差10.799时为预测成功,否则为预测失败,那么本例中的94个个案中有5个个案的“RES_1”大于一个标准差10.799,预测成功率为94.7%。9.1 一元线性回归分析 9.2 多元线性回归分析 9.3 虚拟自变量回归 9.4 回归分析的报告参考样例 第九章第九章 回归分析回归分析 9.2 9.2 多元线性回归分析多元线性回归分析在心理与教育测量中,影响一个的行为特征或心理特质往往有多方面因素,根据这些因
10、素对因变量作出预测分析,就是多元回归分析。案例:案例:【例9-2】某研究者调查工作满意度的影响因素,调查获取某一行业内的多名员工的自我效能感、服从领导满意度、绩效评价得分、工作经验得分、同事人际敏感程度、工作技能水平、个人信心指数、劳动强度,以及因变量:工作满意度,获得数据文件为“员工心理变量与工作满意度的关系.sav”,试分析影响或预测工作满意度的回归方程。第第1 1步:步:打开分析数据。打开“员工心理变量与工作满意度的关系.sav”文件。第第2 2步:步:启动分析过程。点击【分析】【回归】【线性】菜单命令。第第3 3步:步:设置分析变量。设置因变量:在左边变量列表中选“工作满意度”,选入到
11、“因变量”框中。设置自变量:在左边变量列表中选“自我效能感”、“服从领导满意度”、“绩效评价得分”、“工作经验得分”、“同事人际敏感程度”、“工作技能水平”、“个人信心指数”、“劳动强度”变量,选入“自变量”框中。从“方法”框内下拉式菜单中选择选择“输入“方法。 第第4 4步:步:设置分析参数。单击【统计】按钮,打开“线性回归:统计”对话框,可以选择输出的统计量如图所示。在“回归系数”栏,选择“估算值”。在对话框的右边,有五个复选框:(1)“ 模型拟合” 是系统默认项,输出复相关系数R、R2及R2修正值,估计值的标准误,方差分析表。 (2)“ R方变化量”: 增加进入或剔除一个自变量时,R2的
12、变化。(3)“ 描述”: 基本统计描述。(4)“ 部分相关性和偏相关性”:相关系数及偏相关系数。(5)“ 共线性诊断”:共线性诊断。主要对于多元回归模型,分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指标等。 “残差”栏,选择“德宾-沃森”。第第5 5步:步:设置图形输出。单击【图】按钮,在标准化残差中,选中复选框 “ 正态概率图”。 第第6 6步:步:设置保存选项。单击【保存】按钮,打开“线性回归:保存”对话框。本例中,在“预测值”框选择“ 未标准化”。在“预测区间”框选择“ 平均值”;置信区间默认保持为“95%”。 第第7 7步:步:设置选项参数。单击【选项】按
13、钮,打开“线性回归:选项”对话框,按照系统默认的选择。 第第8 8步:步:在主对话框中点击【确定】按钮,提交执行。第第9 9步:步:结果分析。第一个表:描述统计(略) 第二个表:相关性(略) 第三个表:变量已输入/已移除(略) 第四个表:模型摘要 第五个表:ANOVA(方差分析表) 分析:回归方程所对应的F值为5.504,对应的显著性为0.000,小于0.05,拒绝原假设。结论:所建立的回归方程有效。第六个表:回归系数分析:自我效能感、服从领导满意度、同事人际敏感、工作技能水平、个人信心指数这几个变量的回归系数所对应的显著性大于0.05,在回归方程中应该考虑删除这五个变量,然后再建立回归方程。
14、自变量的容差在0至1之间,越接近0,说明变量的共线性强;越接近1,说明共线性弱。VIF越大,特别是大于等于10,说明解释变量x与方程中其他解释变量之间有严重的多重共线性;VIF越接近1,表明解释变量x和其他解释变量之间的多重共线性越弱。容差和VIF是互为倒数关系,容忍度越小,膨胀因子越大。这里的八个自变量的容差在0.36至0.76左右;膨胀因子VIF都小于3,相对接近1,这些都说明这些变量之间共线性相对较弱。第七个表:共线性诊断分析:多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在高度相关关系而使回归模型估计失真或难以估计准确。判断方法1:特征值中前3个
15、或前4个特征值几乎接近0,可以说明可能存在明显的共线性。判断方法2:方差比例内存在接近1的数(0.99),可以说明存在明显的共线性。 在本例中,特征值中前3、4个特征值均大于0,说明不存在明显的共线性;变异数比例的数值都远远小于1,也说明不存在明显的共线性。结合前面的膨胀因子VIF都小于5,小于5说明变量之间不存在明显的共线性。第八个表:残差统计第九个:标准化残差的概率图分析:由此图可知,所有的点都比较靠近对角线,结合前面第八个表中的标准化残差为0.892,小于2,因此可以认为残差是正态的。由于自我效能感、服从领导满意度、同事人际敏感、工作技能水平、个人信心指数这几个变量的回归系数所对应的si
16、g值不显著,在回归分析中需要删除这几个变量,然后再建立回归方程。因此在SPSS中接着再次进行回归分析。第第9 9步:步:重复前面SPSS的操作步骤,从第2步至第6步。在第3步将自我效能感、服从领导满意度、同事人际敏感、工作技能水平、个人信心指数这几个变量从自变量移出,由于SPSS软件中还保存了刚才第4、5、6步的操作内容,此时只需要再点击【确定】按钮,输出分析结果。其中模型摘要、回归方程、回归系数表如下:【知识拓展】在多元回归分析中,“变量选择的目的是回归模型包含尽量多的自变量,以提高预测的精确度,同时又要尽量避免作用不显著的自变量进入方程,以减少计算量和计算误差,降低在建立回归方程后用于监控
17、或预测的成本。”(引用温忠麟的心理与教育统计第九章第三节中多元回归方程的论述)在SPSS中中包括了五种方法:输入、步进、除去、后退、前进。如何选择合适的回归分析方法,温忠麟教授的编著中有较为详细的论述(温忠麟,2016),包括向后剔除法(后退)、向前选择法(前进)、逐步回归法(步进),以及人工选择自变量尝试等探索性回归分析,并认为逐步回归方法逐步回归方法(步进)(步进)是较好的一种选择方法。至于具体的自变量的选择,可以据加入或剔除一个自变量后的R2的变化量,由R2的变化量是否有明显的增大或减小来判断,这在向后剔除法(后退)、向前选择法(前进)、逐步回归法(步进)中用于自变量选择的一个重要参考指
18、标。还可以根据研究实际问题,或源于研究假设、某一理论假设,由研究者自己来选择自变量的顺序,进行层次回归分析。一、向后剔除法(后退)时R2的变化量二、向前选择法(前进)时R2的变化量三、逐步回归法(步进)时R2的变化量 分析:向前选择法(前进)逐步回归法(步进)的回归分析的结果基本一样。在模型摘要的第二个回归模型中,有2个自变量(绩效评价得分, 工作经验得分)进入模型,比“输入”方法输入少了一个自变量,劳动强度, R2的变化量为0.498-0.455-=0.043。也就是说,如果增加劳动强度到回归模型中, R2的变化量增加为0.043。综合以上信息,输入、步进、后退、前进四种回归分析方法的分析,
19、绩效评价得分、工作经验得分是确定需要进入回归方程的,而自我效能感、 劳动强度这两个自变量则需要研究者根据根据研究实际问题(或研究假设、某一理论假设)来确定是否要将劳动强度、自我效能感这两个变量或其中一个变量纳入回归方程。9.1 一元线性回归分析 9.2 多元线性回归分析 9.3 虚拟自变量回归 9.4 回归分析的报告参考样例 第九章第九章 回归分析回归分析 9.3 9.3 虚拟自变量回归虚拟自变量回归9.3.1 9.3.1 虚拟自变量回归的性质虚拟自变量回归的性质在心理与教育测量中,影响被解释因变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 23.0 统计分析 在心 理学 教育学 中的 应用 第九 回归 分析
限制150内