运用SPSS建立多元线性回归模型并进行检验_-_副本[1](5页).doc
-运用SPSS建立多元线性回归模型并进行检验_-_副本1-第 5 页计量经济学实验报告一.实验目的:1、 学习和掌握用SPSS做变量间的相关系数矩阵;2、 掌握运用SPSS做多元线性回归的估计;3、 用残差分析检验是否存在异常值和强影响值4、 看懂SPSS估计的多元线性回归方程结果;5、 掌握逐步回归操作;6、 掌握如何估计标准化回归方程7、 根据输出结果书写方程、进行模型检验、解释系数意义和预测;二实验步骤:1、根据所研究的问题提出因变量和自变量,搜集数据。2、绘制散点图和样本相关阵,观察自变量和因变量间的大致 关系。3、如果为线性关系,则建立多元线性回归方程并估计方程。4、运用残差分析检验是否存在异常值点和强影响值点。5、通过t检验进行逐步回归。6、根据spss输出结果写出方程,对方程进行检验(拟合优度检验、F检验和t检验)。7、输出标准化回归结果,写出标准化回归方程。8、如果通过检验,解释方程并应用(预测)。三.实验要求: 研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。详细数据见表: (1)计算出y,x1,x2,x3的相关系数矩阵。 (2)求y关于x1,x2,x3的三元线性回归方程 (3)做残差分析看是否存在异常值。 (4)对所求方程拟合优度检验。 (5)对回归方程进行显著性检验。 (6)对每一个回归系数做显著性检验。 (7)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。 (8)求标准化回归方程。 (9)求当x1=75,x2=42,x3=3.1时y。并给出置性水平为99%的近似预测区间。 (10)结合回归方程对问题进行一些基本分析。四.绘制散点图或样本相关阵相关性货运总量工业总产值农业总产值居民非商品支出货运总量Pearson 相关性1.556.731*.724*显著性(双侧).095.016.018N10101010工业总产值Pearson 相关性.5561.155.444显著性(双侧).095.650.171N10111111农业总产值Pearson 相关性.731*.1551.562显著性(双侧).016.650.072N10111111居民非商品支出Pearson 相关性.724*.444.5621显著性(双侧).018.171.072N10111111*. 在 0.05 水平(双侧)上显著相关。五建立并估计多元线性回归模型:六残差分析找异常值 由上表分析得,残差分析找异常值后其Cook距离不能大于1,Student化已删除的残差的绝对值不能大于3,综上所述删除第六组观测值继续进行如上操作,再未发现异常值。七. 删除异常值继续回归:模型汇总模型RR 方调整 R 方标准 估计的误差1.975a.950.92012.94188a. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。Anovaa模型平方和df均方FSig.1回归15968.09435322.69831.779.001b残差837.4625167.492总计16805.5568a. 因变量: 货运总量b. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-659.510126.833-5.200.003-985.546-333.474工业总产值4.0701.071.4123.802.0131.3186.822农业总产值16.0432.8241.0575.681.0028.78423.301居民非商品支出-14.3599.109-.306-1.576.176-37.7769.057则回归方程为:由上述分析知居民的非商品支出的参数估计量所对应P值为0.176大于=0.05,所以货运总量与居民非商品支出无显著性差异,即剔除变量:居民的非商品支出,继续做回归。此时的回归方程为:八.统计检验:(1)拟合优度检验:由估计结果图表可知,可决系数 =0.962,修正的可决系数=0.925。计算结果表明,估计的样本回归方程较好的拟合了样本观测值。(2)F检验提出检验的原假设为:=0对立假设为:至少有一个 不等于零(i=0,1,2)对于给定的显著性水平=0.05,P=0.000<=0.05,所以否定原假设,总体回归方程是显著的。 (3)t检验提出的原假设为:=0 i=0,1,2由表得,t统计量为所对应的P值为0.002所对应的P值为0.021所对应的P值为0.000对于给定的显著性水平a=0.05,因为 所对应的P值均小于=0.05,所以货运总量与工业总产值和农业总产值之间有显著性关系,(4)预测假设X1=75,X2=42试预测货运总量并构造其99%的置信区间将X1=75,X2=42代入估计的回归方程 经计算得Y的置信区间为(237.71840,312.28406.)(5)相关分析 当维持农业总产值不变的情况下,每增加一单位的工业总产值,货运总量相应的增加3,534亿吨;当维持工业总产值不变的情况下,每增加一单位的农业总产值,货运总量相应的增加12.333亿吨;综上得出农业总产值引起货运总量的变化相比于工业总产值较大。