第9章SPSS线性回归分析.ppt
《第9章SPSS线性回归分析.ppt》由会员分享,可在线阅读,更多相关《第9章SPSS线性回归分析.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第9章 SPSS的线性回归分析,9.1 回归分析概述 9.2 线性回归分析和线性回归模型 9.3 回归方程的统计检验 9.4 多元回归分析中的其他问题 9.5 线性回归分析的基本操作 9.6 线性回归分析的应用举例,学习的内容与目标,掌握线性回归分析的主要指标,了解最小二乘法的基本思想 熟练掌握线性回归分析的具体操作,读懂分析结果;掌握计算结果之间的数量关系,写出回归方程,对回归方程进行各种统计检验 了解多元回归分析中自变量筛选的策略,以及对应结果的分析 了解SPSS残差分析和多重共线检测的基本操作,并能分析结果,9.1回归分析概述,9.1.1什么是回归分析 “回归”一词最初源于英国统计学家F
2、.Galton(高尔顿)描述父亲的身高和其成年儿子身高之间的关系,发现成年儿子的身高会趋向于子辈身高的平均值,F.Galton称这种现象为“回归”。 用于分析事物之间的统计关系,并通过回归方程的形式描述变量间的数量变化规律,帮助人们准确把握变量受一个或多个变量的影响程度,进而为预测提供依据。,回归分析和相关分析,1.相关分析 变量性质:都是随机变量且关系对等 分析方法:图表法(散点图)和相关系数 分析目的:判定变量之间相关方向和关系的密切程度 2.回归分析 变量性质:自变量(确定型变量)和因变量(随机变量)的关系且不对等 分析方法:建立回归模型 分析目的:研究变量间数量依存关系,9.1.2如何
3、得到回归线,函数拟合 首先,通过散点图观察变量之间的统计关系,得到对回归线的感性认知,并据之确定最简洁的数学函数(回归模型); 其次,利用样本数据在一定的拟合准则下,估计回归模型中各个参数,得到确定的回归方程; 最后,由于回归参数是在样本数据的基础上得到的,存在随机性。因此需要进行各种检验。,9.1.3回归分析的一般步骤,确定回归方程中的解释变量(父亲身高x)和被解释变量(儿子身高y) 确定回归模型(线性与非线性) 建立回归方程,并估计出模型中的参数 对回归方程进行各种检验 利用方程进行预测,9.2 线性回归分析和线性回归模型,观察被解释变量y和一个或多个解释变量xi的散点图,当发现y与xi之
4、间呈现出显著的线性关系时,应采用线性回归分析的方法,建立y关于xi的线性回归模型。 线性回归模型可分为: 一元线性回归模型 多元线性回归模型,9.2.1一元线性回归模型(只有1个解释变量),数学模型为: y=0+1x+ 上式表明:y的变化可由两部分解释:第一,由解释变量x的变化引起的y的线性变化部分,即y=0+1x;第二,由其他随机因素引起的y的变化部分,即。 0 、1 都是模型中的未知参数,0为回归常数,1为y对x回归系数(即x每变动一个单位所引起的y的平均变动) 。 称为随机误差。且满足:E()=0,Var()=2 。,一元线性回归方程: E(y)=0+1x 表明x和y之间的统计关系是在平
5、均意义下表述的。 估计的一元线性回归方程: 估计方程是平面上的一条直线,即回归直线。 参数分别代表回归直线的截距和斜率。,9.2.2多元线性回归模型,多元数学模型: y=0+1x 1+2x 2 .+px p + 多元线性回归方程: E(y)=0+1x 1+2x 2 .+px p 估计多元线性回归方程: y=0+1x 1 +2x 2 . +px p,9.2.3回归参数的最小二乘估计 (ordinary least square estimation ,OLSE),估计思想: 使每个样本点(xi , yi)与回归线上的对应点( xi , E(yi )在垂直方向上偏差距离的二次方总和达到最小的原则来
6、估计参数 即,( yi - E(yi )2 =最小 一元二乘估计: 多元二乘估计(略),9.3回归方程的统计检验,拟合优度检验 回归方程的显著性检验 回归系数的显著性检验 残差分析,9.3.1回归方程的拟合优度检验,用于检验样本数据点聚集在回归线周围的密集程度,从而评价回归线对样本数据的代表程度。 思想:因变量y(儿子身高)取值的变化受两个因素的影响:自变量x(父亲身高)不同取值的影响,其他因素(环境、饮食等)的影响。 可表示如下: 因变量总变差 = 自变量引起的 + 其他因素引起的 即因变量总变差= 回归方程可解释的+不可解释的 即,因变量总离差平方和SST =回归平方和 SSA + 剩余平
7、方和SSE,图示:,一、一元线性回归方程,拟合优度的检验采用R2统计量,称为判定系数 R2=SSA/SST=1-SSE/SST. R2体现了回归方程所能解释的因变量变差的比例;1-R2体现了回归方程所无法解释的变差比例。,R2越接近于1,则说明回归平方和占了绝大部分比例,因变量y的变差主要由自变量x的取值造成,回归方程对样本数据点拟合得好 在一元线性回归中,判定系数R2=相关系数r2; 因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。,说明,二、多元线性回归方程,多元线性回归方程的拟合优度检验采用统计量 ,称为调整的判定系数 调整的判定系数:判定系数受解
8、释变量X的个数p的影响,在p的个数不同的模型之间进行比较时,判定系数必须进行调整。,9.3.2回归方程的显著性检验,用于检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当,即检验模型对总体的近似程度。 SST =回归平方和 SSA + 剩余平方和SSE 回归方程的显著性检验中采用方差分析的方法,研究在SST中SSA相对于SSE来说是否占有较大比例。如果比例较大,表明y与x全体的线性关系明显,则利用线性模型反映y与x的关系是恰当的;反之,不恰当。,原假设H0: 1 =0 .即:回归系数与0无显著差异 利用F检验,构造F统计量: FF(1,n-2) 判断:若
9、 pa,则拒绝H0 ,模型的线性关系是显著的;反之,模型的线性关系不显著.,一、一元线性回归方程显著性检验,原假设H0: 1 = 2=. =p = 0 .即:各个回归系数同时与0无显著差异 利用F检验,构造F统计量: FF(p,n-p-1) 判断:若 pa,则拒绝H0 ,模型的线性关系是显著的;反之,模型的线性关系不显著.,二、多元线性回归方程的显著性检验,R2检验与F检验的关系,F是R2的单调增函数,F与 一一对应。,图1 F统计量与R2的关系,9.3.3回归系数的显著性检验,主要目的是研究回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系。 即研究每个解释变量能否有效的反映被解释
10、变量的线性变化,它们能否保留在线性回归方程中。 回归系数的显著性检验是围绕回归系数估计值的抽样分布展开的,构造统计量,并进行检验。,一、一元线性回归方程显著性检验,回归系数的显著性检验:t检验 H0:1=0 ,即:回归系数与0无显著差异,利用t检验:,若 pa,不能拒绝H0, y和x线性关系不显著。 一元线性回归方程的检验和回归系数的检验是等效的。,需要对回归系数是否为零逐一进行检验。 原假设H0:i=0 ,即:第i个偏回归系数与0无显著差异 利用t检验统计量(略) 若与t统计量的概率伴随p a,则拒绝H0 多元线性回归中回归系数的检验与整体回归方程的检验不能相互替代。,二、多元线性方程回归系
11、数的检验,9.3.4残差分析,残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中i 的估计值: 回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。,一、残差均值为零的正态分析,可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。,二、残差的独立性分析(非自相关),残差是独立的,则残差序列应满足cov(i , j)=0(ij),表示残差序列前期和后期之间不存在相关关系,即不存在自相关。独立性检验方式: 第一、绘制残差序列图(下图残差随时间的推移,呈有规律变化,表明残差序列存在一定的正或负
12、自相关),自相关系数用于测定序列自相关强弱,其取值范围-1+1,接近1表明序列存在正自相关,第二、计算残差的自相关系数,DW检验用于推断小样本序列是否存在自相关的方法。其原假设为:总体自相关系数与零无显著差异。采用统计量为: DW取值在04之间: =(-1,0)时,DW=(2,4)残差序列负自相关 =0时, DW=2,残差序列无自相关 = (0,1)时,DW=(0,2)残差序列正自相关 残差存在自相关表明遗漏了解释变量,或变量取值存在滞后性,或线性模型不适合,第三、DW(durbin-watson)检验,三、残差异方差分析,回归分析要求残差的方差相等,如果存在异方差,则参数的最小二乘估计不再是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 线性 回归 分析
限制150内