《SPSS回归分析》PPT课件.ppt
《《SPSS回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《SPSS回归分析》PPT课件.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归分析介绍:介绍:1、回归分析的概念和模型、回归分析的概念和模型 2、回归分析的过程、回归分析的过程回归分析的概念寻求有关联(相关)的变量之间的关系寻求有关联(相关)的变量之间的关系主要内容:主要内容:n从一组样本数据出发,确定这些变量间的定量关系式从一组样本数据出发,确定这些变量间的定量关系式n对这些关系式的可信度进行各种统计检验对这些关系式的可信度进行各种统计检验n从影响某一变量的诸多变量中,判断哪些变量的影响从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著显著,哪些不显著n利用求得的关系式进行预测和控制利用求得的关系式进行预测和控制回归分析的模型按是否线性分:线性回归模型
2、和非线性回归模型按是否线性分:线性回归模型和非线性回归模型按自变量个数分:简单的一元回归,多元回归按自变量个数分:简单的一元回归,多元回归基本的步骤:利用基本的步骤:利用SPSS得到模型关系式,是否是得到模型关系式,是否是我们所要的,要看回归方程的显著性检验(我们所要的,要看回归方程的显著性检验(F检验)检验)和回归系数和回归系数b的显著性检验的显著性检验(T检验检验),还要看拟合程,还要看拟合程度度R2(相关系数的平方相关系数的平方,一元回归用一元回归用R Square,多,多元回归用元回归用Adjusted R Square)回归分析的过程在回归过程中包括:在回归过程中包括:nLiner:
3、线性回归:线性回归nCurve Estimation:曲线估计:曲线估计nBinary Logistic:二分变量逻辑回归二分变量逻辑回归nMultinomial Logistic:多分变量逻辑回归:多分变量逻辑回归nOrdinal 序回归序回归nProbit:概率单位回归:概率单位回归nNonlinear:非线性回归:非线性回归nWeight Estimation:加权估计:加权估计n2-Stage Least squares:二段最小平方法:二段最小平方法nOptimal Scaling 最优编码回归最优编码回归我们只讲前面我们只讲前面3个简单的(一般教科书的讲法)个简单的(一般教科书的讲
4、法)1 线性回归(Liner)一元线性回归方程一元线性回归方程:y=a+bxna称为截距称为截距nb为回归直线的斜率为回归直线的斜率n用用R2判定系数判定系数判定一个线性回归直线的拟合程度:用来说明用自判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)变量解释因变量变异的程度(所占比例)多元线性回归方程多元线性回归方程:y=b0+b1x1+b2x2+bnxnnb0为常数项为常数项nb1、b2、bn称为称为y对应于对应于x1、x2、xn的偏回归系数的偏回归系数n用用Adjusted R2调整判定系数调整判定系数判定一个多元线性回归方程的拟合程判定一个多元线性回归方程
5、的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)度:用来说明用自变量解释因变量变异的程度(所占比例)一元线性回归模型的确定一元线性回归模型的确定:一般先做散点图一般先做散点图(Graphs-Scatter-Simple),以便进行简单地观测(如:以便进行简单地观测(如:Salary与与Salbegin的关系的关系)若散点图的趋势大概呈线性关系,可以建立线性方程,若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较若不呈线性分布,可建立其它方程模型,并比较R2(-1)来确定一种最佳方程式(曲线估计)来确定一种最佳方程式(曲线估计)多元线性回归一般
6、采用逐步回归方法多元线性回归一般采用逐步回归方法-Stepwise 逐步回归方法的基本思想对全部的自变量对全部的自变量x1,x2,.,xp,按它们对按它们对Y贡献的大小进行比较,贡献的大小进行比较,并通过并通过F检验法,选择偏回归平方和显著的变量进入回归方程,检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个偏回归方程。每一步只引入一个变量,同时建立一个偏回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方他们的偏回归平方和。如果由于引入新的变
7、量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除。程的变量变为不显著时,则及时从偏回归方程中剔除。在引入了两个自变量以后,便开始考虑是否有需要剔除的变量。在引入了两个自变量以后,便开始考虑是否有需要剔除的变量。只有当回归方程中的所有自变量对只有当回归方程中的所有自变量对Y都有显著影响而不需要剔都有显著影响而不需要剔除时,在考虑从未选入方程的自变量中,挑选对除时,在考虑从未选入方程的自变量中,挑选对Y有显著影响有显著影响的新的变量进入方程。的新的变量进入方程。不论引入还是剔除一个变量都称为一步。不断重复这一过程,不论引入还是剔除一个变量都称为一步。不断重复这一过程,直至无法剔除已引
8、入的变量,也无法再引入新的自变量时,逐直至无法剔除已引入的变量,也无法再引入新的自变量时,逐步回归过程结束。步回归过程结束。线性回归分析实例实例:实例:Data07-03 建立一个以初始工资建立一个以初始工资Salbegin、工作经验、工作经验prevexp、工、工作时间作时间jobtime、工作种类、工作种类jobcat、受教育年限、受教育年限edcu等为自变量,当前工等为自变量,当前工资资Salary为因变量的回归模型。为因变量的回归模型。1.先做数据散点图先做数据散点图,观测因变量观测因变量Salary与与自变量自变量Salbegin之间关系是否有之间关系是否有线性特点线性特点nGrap
9、hs-Scatter-SimplenX Axis:SalbeginnY Axis:Salary2.若散点图的趋势大概呈线性关系,可以建立线性回归模型若散点图的趋势大概呈线性关系,可以建立线性回归模型wAnalyze-Regression-LinearwDependent:SalarywIndependents:Salbegin,prevexp,jobtime,jobcat,edcu等变量等变量wMethod:Stepwisew比较有用的结果:比较有用的结果:n拟合程度拟合程度Adjusted R2:越接近越接近1拟合程度越好拟合程度越好n回归方程的显著性检验回归方程的显著性检验Sign回归系数
10、表回归系数表Coefficients的的Model最后一个中的回归系数最后一个中的回归系数B和显著性检验和显著性检验Sign得模型:得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu2 曲线估计(Curve Estimation)对于对于一元回归一元回归,若散点图的趋势若散点图的趋势不呈线性分布,不呈线性分布,可以利用曲线估可以利用曲线估计方便地进行线计方便地进行线性拟合性拟合(liner)、二次拟合二次拟合(Quadratic)、三次拟合三次拟合(Cubic)等。采等。采用
11、哪种拟合方式用哪种拟合方式主要取决于各种主要取决于各种拟合模型对数据拟合模型对数据的充分描述的充分描述(看看修正修正Adjusted R2-1)不同模型的表示不同模型的表示模型名称模型名称回归方程回归方程相应的线性回归方程相应的线性回归方程Linear(线性线性)Y=b0+b1tQuadratic(二次二次)Y=b0+b1t+b2t2Compound(复合复合)Y=b0(b1t)Ln(Y)=ln(b0)+ln(b1)tGrowth(生长生长)Y=eb0+b1tLn(Y)=b0+b1tLogarithmic(对对数数)Y=b0+b1ln(t)Cubic(三次三次)Y=b0+b1t+b2t2+b3
12、t3SY=eb0+b1/tLn(Y)=b0+b1/tExponential(指数指数)Y=b0*eb1*tLn(Y)=ln(b0)+b1tInverse(逆逆)Y=b0+b1/tPower(幂幂)Y=b0(tb1)Ln(Y)=ln(b0)+b1ln(t)Logistic(逻辑逻辑)Y=1/(1/u+b0b1t)Ln(1/Y-1/u)=ln(b0+ln(b1)t)曲线估计(Curve Estimation)分析实例实例实例Data11-01:汽车数据,:汽车数据,mpg(每加仑汽油行驶里程每加仑汽油行驶里程)与与weight(车重车重)的关的关系系n先做散点图先做散点图(Graphs-Scatt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS回归分析 SPSS 回归 分析 PPT 课件
限制150内