线性回归分析的SPSS操作(多元线性回归).pdf
-
资源ID:69678716
资源大小:296.93KB
全文页数:9页
- 资源格式: PDF
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
线性回归分析的SPSS操作(多元线性回归).pdf
1 线性回归分析的线性回归分析的 SPSS 操作操作 本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。一、一元线性回归分析 1数据 以本章第三节例 3 的数据为例,简单介绍利用 SPSS 如何进行一元线性回归分析。数据编辑窗口显示数据输入格式如下图 7-8(文件 7-6-1.sav):图 7-8:回归分析数据输入 2用 SPSS 进行回归分析,实例操作如下:2.1.回归方程的建立与检验(1)操作 单击主菜单 Analyze/Regression/Linear,进入设置对话框如图 7-9 所示。从左边变量表列中把因变量 y 选入到因变量(Dependent)框中,把自变量 x 选入到自变量(Independent)框中。在方法即 Method 一项上请注意保持系统默认的选项 Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:2 图 7-9 线性回归分析主对话框 请单击 Statistics按钮,可以选择需要输出的一些统计量。如 Regression Coefficients(回归系数)中的 Estimates,可以输出回归系数及相关统计量,包括回归系数 B、标准误、标准化回归系数 BETA、T 值及显著性水平等。Model fit 项可输出相关系数 R,测定系数 R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图 7-10 所示。设置完成后点击 Continue 返回主对话框。图 7-10:线性回归分析的 Statistics 选项 图 7-11:线性回归分析的 Options 选项 回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。用户在进行回归分析时,还可以选择是否输出方程常数。单击 Options按钮,打开它的对话框,可以看到中间有一项 Include constant in equation 可选项。选中该项可输出对常数的检验。在 Options 对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图 7-11 所示。设置完成后点击 Continue 返回主对话框。在主对话框点击 OK 得到程序运行结果。3(2)结果及解释 上面定义的程序运行结果如下所示:方程方程中包含的自变量列表中包含的自变量列表 同时显示进入方法。如本例中方程中的自变量为 x,方法为Enter。Variables Entered/Removed Model Variables Entered Variables Removed Method 1 X.Enter a All requested variables entered.b Dependent Variable:Y 模型拟合模型拟合概述概述 列出了模型的R、R2、调整R2 及估计标准误。R2 值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。Model Summary Model R R Square Adjusted R Square Std.Error of the Estimate 1.859.738.723 6.2814 a Predictors:(Constant),X 本例所用数据拟合结果显示:所考察的自变量和因变量之间的相关系数为0.859,拟合线性回归的确定性系数为0.738,经调整后的确定性系数为0.723,标准误的估计为6.2814。方差分析表方差分析表 列出了变异源、自由度、均方、F值及对F的显著性检验。ANOVA Model Sum of Squares df Mean Square F Sig.1 Regression 1995.791 1 1995.791 50.583.000 Residual 710.209 18 39.456 Total 2706.000 19 a Predictors:(Constant),X b Dependent Variable:Y 本例中回归方程显著性检验结果表明:回归平方和为1995.791,残差平方和为710.209,总平方和为2706.000,对应的F统计量的值为50.583,显著性水平小于0.05,可以认为所建立的回归方程有效。回归系数表回归系数表 列出了常数及非标准化回归系数的值及标准化的回归系数,同时对其进行显 4 著性检验。Coefficients Unstandardized Coefficients Standardized Coefficients t Sig.Model B Std.Error Beta 1(Constant)-7.080 11.068 -.640.530 X.730.103.859 7.112.000 a Dependent Variable:Y 本例中非标准化的回归系数B的估计值为0.730,标准误为0.103,标准化的回归系数为0.859,回归系数显著性检验t统计量的值为7.112,对应显著性水平Sig.=0.0000.05,可以认为方程显著。因此,本例回归分析得到的回归方程为:Y=-7.08+0.73X 对方程的方差分析及对回归系数的显著性检验均发现,所建立的回归方程显著。22回归方程的预测 (1)通过因变量的观测值和回归预测值的比较,可以了解许多关于模型和各种假定对数据的适合程度,上面回归方程的检验结果表明,所得到的回归直线是有效的。在回归方程有效的前提下,研究者往往希望对于给定的预测变量 X 的一个具体数值(如 X0),预测因变量 Y 的平均值或者预测某一个观测的 y0 的值。如对于上面的例子,我们可以用回归方程来预测智商 x0=120 的被试,这次的平均成绩;也可以用来预测假如一名工作人员的智商是 120,那么他参加这次考试,将会得多少分。上面两种情况下,点预测值是相同的,不同的是标准误。Y0=A+BX0=-7.08+0.73120=86.52 在 X0 点,Y 的预测均值的估计标准误为公式(7-24);在 X0 点,Y 的个体预测值的估计标准误为公式(7-25)。(2)SPSS 可以提供上述两类预测值,具体操作如下:在如图 7-9 的线性回归模型定义的主对话框中,单击 save,出现如下对话框(图 7-12):5 图 7-12:预测值的定义选择窗口 在上面的窗口,可以选择输出变量的点预测值和平均值及其个体值预测的区间估计,如上图,我们在 Predicted Values 选择区选择复选项 Unstandardized,以输出非标准化的点预测值;在下面的 Prediction Intervals 选择区选择复选项 Means 和 Individual,下面的置信水平采用系统默认的95%,然后点击 Continue 返回主对话框,在主对话框中点击 Ok,得到的输出结果。(3)结果及解释 除了上面介绍的回归方程建立和检验的结果外,在数据编辑结果,因为选择了需要保存的预测变量的信息,数据编辑窗口数据显示如下:6 图 7-13:保存预测之后的数据窗口 从上面的结果可以看出,在以前的数据的基础上,新生成了五列数据,第一列命名为 pre_1的变量对应的数据表示预测变量对应的因变量非标准化的预测值,例如,智商为 120 的被试,用回归方程预测的这次考试的点预测值为 80.49;均值预测的区间估计的上下限分别用变量 lmci_1和 umci_1 表示,个体预测值的区间估计的上下限分别用变量 lici_1 和 uici_1 表示,例如,智商为 120 的被试,均值 95%的预测区间为:(76.42,84.56);个体预测 95%的预测区间为:(66.68,94.30)。二、多元线性回归 1数据 以本章第四节例 4 为例,简单说明多元线性回归方程的建立与检验。数据输入如图 7-14(文件 7-6-2.sav):7 图 7-14:多元回归分析所用数据 2SPSS 操作(1)多元线性回归所用命令语句与一元线性回归相同,同样可以通过单击主菜单 Analyze/Regression/Linear,进入设置对话框如图 7-9 所示。从左边变量表列中把因变量 y 选入到因变量(Dependent)框中,把自变量 x1 和 x2 选入到自变量(Independent)框中。(2)点击Method 后面的下拉框,在 Method 框中选择一种回归分析的方法。SPSS 提供下列几种变量进入回归方程的方法:Enter 选项,强行进入法,即所选择的自变量全部进入回归模型,该选项是默认方式。Remove 选项,消去法,建立回归方程时,根据设定的条件剔除部分自变量。Forward 选项,向前选择法,根据在 Option 对话框中所设定的判据,从无自变量开始,在拟合过程中,对被选择的自变量进行方差分析,每次加入一个 F 值最大的变量,直到所有符合判据的变量都进入模型为止。第一个引入回归模型的变量应该与因变量相关程度最大。Backward 选项,向后剔除法,根据在 Option 对话框中所设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的 F 值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。Stepwise 选项,逐步进入法,是向前选择法和向后剔除法的结合。根据在 Option 对话框中所设定的判据,首先根据方差分析结果选择符合判据的自变量且对因变量贡献最大的进入回归方程。根据向前选择法则进入自变量;然后根据向后剔除法,将模型中 F 值最小的且符合剔除判据的变量剔除模型,重复进行直到回归方程中的自变量均符合进入模型的判据,模型外的自变量都不符合进入模型的判据为止。这里我们采用系统默认的强行进入法,其他选项均采用系统默认的设置。8(3)点击 OK,得到上面定义模型的输出结果为:3结果及解释(1 1)方程中包含的自变量列表方程中包含的自变量列表 同时显示进入方法。如本例中方程中的自变量为 x1 和 x2,选择变量进入方程的方法为 Enter。Variables Entered/Removed Model Variables Entered Variables Removed Method 1 X2,X1.Enter a All requested variables entered.b Dependent Variable:Y (2 2)模型概述模型概述 列出了模型的R、R2、调整R2 及估计标准误。R2 值越大所反映的自变量与因变量的共变量比率越高,模型与数据的拟合程度越好。Model Summary Model R R Square Adjusted R Square Std.Error of the Estimate 1.996.991.988.82 a Predictors:(Constant),X2,X1 上面所定义模型确定系数的平方根为0.996,确定系数为0.991,调整后的确定系数为0.988,标准误为0.82。(3 3)方差分析表方差分析表 列出了变异源、自由度、均方、F值及对F的显著性检验。ANOVA Model Sum of Squares df Mean Square F Sig.1 Regression 518.219 2 259.109 387.469.000 Residual 4.681 7.669 Total 522.900 9 a Predictors:(Constant),X2,X1 b Dependent Variable:Y 本例中回归平方和为518.219,残差平方和为4.681,总平方和为522.900,F统计量的值为387.467,Sig.05,可以认为所建立的回归方程有效。9 (4)回归系数表)回归系数表 列出了常数及回归系数的值及标准化的值,同时对其进行显著性检验。Coefficients Unstandardized Coefficients Standardized Coefficients t Sig.Model B Std.Error Beta 1(Constant)-31.499 3.397 -9.272.000 X1 1.077.125.499 8.612.000 X2.828.086.555 9.581.000 a Dependent Variable:Y 本例中因变量Y对两个自变量X1和X2的回归的非标准化回归系数分别为1.077和0.828;对应的显著性检验的t值分别为8.612和9.581,两个回归系数B的显著性水平Sig.=0.000均小于0.05,可以认为自变量X1和X2对因变量Y均有显著影响。本例回归分析得到的回归方程为:Y=-31.499+1.077X1+0.828X2。