回归分析spss实现.ppt
第九讲第九讲 回归分析的回归分析的SPSSSPSS实现实现线性回归分析线性回归分析被解释变量和各个解释变量各对应一个spss变量一元线性回归和多元线性回归分析的功能菜单是集成到一起的数据:高校科研研究.data一、描绘散点交互图一、描绘散点交互图基本步骤Graphs-interactive-ScatterplotAssign Variable-y=课题数;x=高级职称人数Fit-Method-选择RegressionOK二、用Linear Regression分析Analyze-Regression-Linear选择被解释变量进入选择被解释变量进入Dependent框框-课题数课题数选择一个或多个解释变量进入选择一个或多个解释变量进入Independent(s)框框METHOD-Enter;stepwise;-单击单击Statistics,选择全部核选框选择全部核选框单击单击Plots,选择选择”Histogram”核选框和核选框和”Normal probality plot”选择选择”ZPRED”输入到输入到”Y”;选择选择”SRESID”输入到输入到”X”;OK(一)立项课题数多元线性回归分析结果(enter策略)结果一:模型综述表 结果说明:1)调整后的R2=0.939,因此模型的拟和优度较高;模型的F检验达到了0.00的极显著水平.说明模型的线性关系较显著,具有较强的解释能力2)D.W值=1.838接近于2,说明模型的序列相关性不强.结果二:模型方差分析表 结果说明结果说明:模型的模型的F检验值检验值=61.532,对应的概率值对应的概率值P=0.00,远小于远小于0.01的极显著水平的极显著水平,应该拒绝回归系数为零的原假设应该拒绝回归系数为零的原假设,即认为回归即认为回归系数不同时为零系数不同时为零,被解释变量与解释变量全体的线性关系是被解释变量与解释变量全体的线性关系是显著的显著的,可以建立线性模型可以建立线性模型.结果三:系数分析表结果说明:1)由于回归方程:课题立项数=-35.313+0.698投入人年数+-2)变量的显著性检验:只有“投入人年数”达到了0.003的极显著水平,其他变量都不显著,说明除了“投入人年数”外,其他变量都与课题立项数没有显著的线性关系。3)多重共线性检验:容忍度(tolerance)越接近于0,多重共线性越强;方差膨胀因子(VIF)越大,一般大于等于10时,说明解释变量Xi 与其余解释变量之间有较强的多重共线性。4)结论:由于模型保留了一些不应保留的变量,该模型不可用;从容忍度和方差膨胀因子看,“投入高级职称人数”与其他解释变量之间多重共线性严重。再重新建模,应考虑提出该变量。结果四:相关系数矩阵表结果五:多重共线性检验表 结果说明:1)特征根是诊断解释变量间是否存在多重共线性的另一种有效的方法.2)如果某一个特征根能够刻画某解释变量方差的较大部分比例,(0.7以上),同时有刻画了另一个变量的方差的较大部分,则表明这两个解释变量之间存在较强的线性相关关系.3)第 7个特征根既能解释“投入人年数”方差的84%,又能解释“投入高级职称人数”方差的98%,同时还能解释专著数“的44%,因此有理由认为这三个变量间存在多重共线性。4)因此应重新建立回归模型(一)立项课题数多元线性回归分析结果(backward策略)结果一:模型综述表方差分析回归系数多重共线性检验剔除的变量曲线估计常见的曲线模型:二次曲线;对数曲线(logarithmic);复合函数(compound);幂函数(Power)等例如:人均消费支出和教育.data要求:分析教育支出和消费支出的关系常见的曲线模型二次曲线(Quadratic):y=0+1x+2x2复合曲线(Compound):y=01x增长曲线(Growth):y=e0+1x对数曲线(Logarithmic):y=0+1ln(x)指数曲线(Exponential):y=0e1x幂函数(Power):y=0 x1逆函数(Inverse):y=0+1/x基本步骤1)Analyze-Regression-Curve estimation2)选择被解释变量进入)选择被解释变量进入Dependent框框-教育支出教育支出3)选择消费支出进入)选择消费支出进入Independent(s)框;如果选择框;如果选择time参数,则表示解释变量为时间参数,则表示解释变量为时间4)Models-选择几种模型选择几种模型 复合函数、幂函数等复合函数、幂函数等5)选择)选择 Plots models选项绘制回归线;选择选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和回归系数的显输出各个模型的方差分析表和回归系数的显著性检验著性检验MODEL:MOD_2.Dependent variable.x5 Method.CUBICListwise Deletion of Missing DataMultiple R .99711R Square .99422Adjusted R Square .99230Standard Error 32.23848 Analysis of Variance:DF Sum of Squares Mean SquareRegression 3 1610303.3 536767.78Residuals 9 9353.9 1039.32F=516.46087 Signif F=.0000-Variables in the Equation-Variable B SE B Beta T Sig Tx2 .075378 .069194 .579897 1.089 .3043x2*2 -1.987684665861E-05 1.3446E-05 -1.685204 -1.478 .1734x2*3 2.596263004613E-09 7.7924E-10 2.112252 .(Constant)-41.313805 97.204131 -.425 .6808Dependent variable.x5 Method.POWERListwise Deletion of Missing DataMultiple R .97687R Square .95428Adjusted R Square .95012Standard Error .26578 Analysis of Variance:DF Sum of Squares Mean SquareRegression 1 16.217387 16.217387Residuals 11 .777033 .070639F=229.58009 Signif F=.0000-Variables in the Equation-Variable B SE B Beta T Sig Tx2 1.845988 .121832 .976871 15.152 .0000(Constant)3.5781705054E-05 3.7164E-05 .963 .3563复合函数的拟和效果更好。因此应选择复合函数练习人均消费支出和教育.data要求:1)分析教育支出和人均可支配收入的关系2)分析在外就餐支出和人均可支配收入的关系练习数据:温度与产卵数 要求:找出一个较佳的回归函数,并做简要的分析