SPSS多元线性回归分析实例操作步骤.pdf
SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的:引入19982008 年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动 因素。实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。实验方法:多元线性回归分析法 软件:spss19.0 操作过程:第一步:导入Excel数据文件 1.open data document open dataopen;2.Opening excel data sourceOK.第二步:1.在最上面菜单里 面选中 Analyze Regression Linear,Dependent(因变量)选择商品房平均售价,Independents(自 变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷 款利率、房屋空置 率;Method 选择 Stepwise.进入如下界面:2.点击右侧 Statistics,勾选 Regression Coefficients(回归系数)选 项组中的 Estimates;勾选 Residuals(残差)选项组中的 Durbin-Watson、Casewise diagnostics 默认;接着选择 Model fit、Collinearity diagnotics;点击 Continue.3.点击右侧 Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择 DEPENDNT(因变量)作为横轴变量;勾选选项组中的 Standardized Residual Plots(标准化残差图)中的 Histogram、Normal probability plot;点击 Continue.4.点击右侧 Save,勾选 Predicted Vaniues(预测值)和 Residuals(残 差)选项组中的 Unstandardized;点击 Continue.5.点击右侧 Options,默认,点击 Continue.6.返回主对话框,单击 OK.输出结果分析:1.引入/剔除变量表 Variables Entered/Removed a Model Variables Entered Variables Removed Method 1 2 城市人口密度(人/平方公里)城市居民人均可支配收入(元).Stepwise(Criteria:Probability-of-F-to-enter=.100).Stepwise(Criteria:Probability-of-F-to-enter=.100).a.Dependent Variable:商品房平均售价(元/平方米)该表显示模型最先 引入变量城市人口密度(人/平方 公里),第二个引 入模型的是变量城 市居民人均可支配收入(元),没有变量被剔除。2.模型汇总 Model Summary c Model R R Square Adjusted R Square Std.Error of the Estimate Durbin-Watson 1 2 1.000a 1.000b 1.000 1.000 1.000 1.000 35.187 28.351 2.845 a.Predictors:(Constant),城市人口密度 b.Predictors:(Constant),城市人口密度(人/平方公里)(人/平方公里),城市居民人均可支配收入(元)c.Dependent Variable:商品房平均售价(元/平方米)该表显示模型的拟 合情况。从表中可以看出,模型的复相关系数(R)为 1.000,判定 系数(R Square)为 1.000,调整判 定系数(Adjusted R Square)为 1.000,估计值的标准误差(Std.Error of the Estimate)为 28.351,Durbin-Watson 检验统计量为 2.845,当 DW2 时说明残差独立。3.方差分析表 ANOVA c Model Sum of Squares df Mean Square F Sig.1 Regression Residual Total 38305583.506 11143.039 38316726.545 1 9 10 38305583.506 1238.115 30938.620.000a 2 Regression Residual Total 38310296.528 6430.018 38316726.545 2 8 10 19155148.264 803.752 23832.156.000b a.Predictors:(Constant),城市人口密度 b.Predictors:(Constant),城市人口密度(人/平方公里)(人/平方公里),城市居民人均可支配收入(元)c.Dependent Variable:商品房平均售价(元/平方米)该表显示各模型的方差分析结果。从表中可以看出,模型的 F 统计量 的观察值为 23832.156,概率 p 值为 0.000,在显著性水平为 0.05 的情形 下,可以认为:商品房平均售价(元/平方米)与城市人口密度(人/平方 公里),和城市居民 人均可支配收入(元)之间有线性关系。4.回归系数 Coefficients a Model Unstandardized Coefficients Standardize d Coefficients T Sig.Collinearity Statistics B Std.Error Beta Toleranc e VIF 1(Constant)城市人口密度(人/平 方公里)1652.246 1.072 24.137.006 1.000 68.454 175.89 4.000.000 1.000 1.000 2(Constant)城市人口密度(人/平 方公里)城市居民人均可支配 收入(元)1555.506 1.020 .017 44.432.022 .007 .951 .050 35.009 46.302 2.422.000.000 .042 .050 .050 20.126 20.126 a.Dependent Variable:商品房平均售价(元/平方米)该表为多元线性回 归的系数列表。表中显示了模型的偏回归系数(B)、标准误差(Std.Error)、常数(Constant)、标准化偏回归系 数(Beta)、回归系数检验的 t 统计量观测值和相应的概率 p 值(Sig.)、共线性统计量显示 了变量的容差(Tolerance)和方差膨胀因子(VIF)。令 x1 表示城市人口密度(人/平方公里),x2 表示城市居民人均可支配 收入(元),根据模 型建立的多元多元线性回归方程为:y=1555.506+1.020 x1+0.017x 2 方程中的常数项为 1555.506,偏回 归系数 b1 为 1.020,b2 为 0.017,经 T 检验,b1 和 b2 的概率 p 值分别为 0.000 和 0.042,按照给定 的显著性水平 0.10 的情形下,均有显著性意义。根据容差发现,自 变量间共线性问题严重;VIF 值为 20.126,也可以 说明共线性较明显。这可能是由于样本容量太小造成的。5.模型外的变量 Excluded Variables c Model Beta In t Sig.Partial Correlation Collinearity Statistics Toleranc e VIF Minimum Tolerance 1 城市居民人均可支配 收入(元)五年以上平均年贷款 利率(%)房屋空置率(%).050a -.001a .004a 2.422 -.241 .596.042 .815 .568.650 -.085 .206.050 .999 .928 20.126 1.001 1.078.050 .999 .928 2 五年以上平均年贷款 利率(%)房屋空置率(%).002b .002b.391 .452.708 .665.146 .168.913 .914 1.096 1.094.045 .049 a.Predictors in the Model:(Constant),城市人口密度 b.Predictors in the Model:(Constant),城市人口密度 c.Dependent Variable:商品房平均售价(元/平方米)(人/平方公里)(人/平方公里),城市居民人均可支配收入(元)该表显示的是回归方程外的各模型变量的有关统计量,可见模型方 程外的各变量偏回归系数经重检验,概率 p 值均大于 0.10,故不能引入 方程。6.共线性诊断 Collinearity Diagnostics a Model Dimension Eigenvalue Condition Index Variance Proportions (Constant)城市人口密度(人/平方公里)城市居民人均可 支配收入(元)1 1 2 1.898.102 1.000 4.3.05.95.05.95 2 1 2 2.891.106.003 1.000 5.2.00.21.78.00.03.97.00.00 a.Dependent Variable:商品房平均售价(元/平方米)该表是多重共线性检验的特征值以及条件指数。对于第二个模型,最大特征值为 2.891,其余依次快速减小。第三列的各个条件指数,可以 看出有多重共线性。7.残差统计量 Residuals Statistics a Minimum Maximum Mean Std.Deviation N Predicted Value Residual Std.Predicted Value Std.Residual 3394.71 -47.035 -1.058 -1.659 8382.83 40.271 1.490 1.420 5465.64 .000 .000 .000 1957.302 25.357 1.000 .894 11 11 11 11 a.Dependent Variable:商品房平均售价(元/平方米)该表为回归模型的 残差统计量,标准化残差(Std.Residual)的绝 对值最大为 1.659,没有超过默认值 3,不能发现奇异值。8.回归标准化残差的直方图 该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用 以判断标准化残差是否呈正态分布。但是由于样本数只有 11 个,所以只 能大概判断其呈正 态分布。9.回归标准化的正 态 P-P 图 该图回归标准化的正态 P-P 图,该图给出了观测值的残差分布与假 设的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判 断标准化残差呈正 态分布。10.因变量与回归标准化预测值的散点图 该图显示的是因变 量与回归标准化预测值的散点图,其中 DEPENDENT 为 x 轴变量,*ZPRED 为 y 轴变量。由图可见,两变量呈直线趋势。附件:原始数据:自变量散点图:由散点图可以看出,可进入分析的变量为城市人口密度、城市居民人均可支配收入。