2022年运用SPSS建立多元线性回归模型并进行检验---副本 .pdf
计量经济学实验报告一.实验目的:1、学习和掌握用 SPSS做变量间的相关系数矩阵;2、掌握运用 SPSS做多元线性回归的估计;3、用残差分析检验是否存在异常值和强影响值4、看懂 SPSS估计的多元线性回归方程结果;5、掌握逐步回归操作;6、掌握如何估计标准化回归方程7、根据输出结果书写方程、进行模型检验、解释系数意义和预测;二实验步骤:1、根据所研究的问题提出因变量和自变量,搜集数据。2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。3、如果为线性关系,则建立多元线性回归方程并估计方程。4、运用残差分析检验是否存在异常值点和强影响值点。5、通过 t 检验进行逐步回归。6、根据 spss输出结果写出方程,对方程进行检验拟合优度检验、F 检验和 t检验 。7、输出标准化回归结果,写出标准化回归方程。8、如果通过检验,解释方程并应用预测。三.实验要求 :研究货运总量 y 与工业总产值 x1,农业总产值 x2,居民非商品支出 x3,之间的关系。详细数据见表:1计算出 y,x1,x2,x3 的相关系数矩阵。2求 y 关于 x1,x2,x3 的三元线性回归方程3做残差分析看是否存在异常值。4对所求方程拟合优度检验。5对回归方程进行显著性检验。6对每一个回归系数做显著性检验。7如果有的回归系数没有通过显著性检验,将其剔除, 重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。8求标准化回归方程。9求当 x1=75,x2=42,x3=3.1时 y。并给出置性水平为99%的近似预测区间。10结合回归方程对问题进行一些基本分析。相关性精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 6 页货运总量工业总产值农业总产值居民非商品支出货运总量Pearson 相关性1 .556 .731*.724*显著性双侧.095 .016 .018 N 10 10 10 10 工业总产值Pearson 相关性.556 1 .155 .444 显著性双侧.095 .650 .171 N 10 11 11 11 农业总产值Pearson 相关性.731*.155 1 .562 显著性双侧.016 .650 .072 N 10 11 11 11 居民非商品支出Pearson 相关性.724*.444 .562 1 显著性双侧.018 .171 .072 N 10 11 11 11 *. 在 0.05 水平双侧上显著相关。五建立并估计多元线性回归模型:0112233YXXX精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 6 页六残差分析找异常值由上表分析得,残差分析找异常值后其Cook 距离不能大于1,Student 化已删除的残差的绝对值不能大于3,综上所述删除第六组观测值继续进行如上操作,再未发现异常值。七. 删除异常值继续回归:模型汇总模型R R 方调整 R 方标准 估计的误差1 .975a.950 .920 a. 预测变量 : ( 常量 ), 居民非商品支出, 工业总产值 , 农业总产值。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 6 页Anovaa模型平方和df 均方F Sig. 1 回归3 .001b残差5 总计8 a. 因变量 : 货运总量b. 预测变量 : (常量 ), 居民非商品支出, 工业总产值 , 农业总产值。系数a模型非标准化系数标准系数t Sig. B 的 95.0% 置信区间B 标准误差试用版下限上限1 ( 常量 ) .003 工业总产值.412 .013 农业总产值.002 居民非商品支出.176 则回归方程为:123659.5104.07016.04314.359YXXX由上述分析知居民的非商品支出的参数估计量3大于=0.05, 所以货运总量与居民非商品支出无显著性差异,即剔除变量: 居民的非商品支出, 继续做回归。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 6 页此时的回归方程为:12508.5013.53412.333YXX八.统计检验:1拟合优度检验:由估计结果图表可知,可决系数2R =0.962 ,修正的可决系数2R =0.925。计算结果说明,估计的样本回归方程较好的拟合了样本观测值。2F检验提出检验的原假设为0H:i=0 对立假设为1H:i至少有一个不等于零 i=0 ,1,2 对于给定的显著性水平=0.05,00, 所以否认原假设 , 总体回归方程是显著的。 (3)t检验提出的原假设为0H :i=0 i=0,1,2精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 6 页由表得, t 统计量为02 121 20 ,因为012所对应的P 值均小于=0.05,所以货运总量与工业总产值和农业总产值之间有显著性关系,4预测假设 X1=75,X2=42 试预测货运总量并构造其99%的置信区间将 X1=75,X2=42 代入估计的回归方程508.5013.5347512.33342274.535Y经计算得 Y 的置信区间为 237.71840,312.28406. (5)相关分析当维持农业总产值不变的情况下,每增加一单位的工业总产值, 货运总量相应的增加 3,534亿吨;当维持工业总产值不变的情况下,每增加一单位的农业总产值,货运总量相应的增加12.333 亿吨;综上得出农业总产值引起货运总量的变化相比于工业总产值较大。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 6 页