线性回归分析讲稿.ppt
《线性回归分析讲稿.ppt》由会员分享,可在线阅读,更多相关《线性回归分析讲稿.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于线性回归分析第一页,讲稿共五十七页哦学习的内容与目标掌握线性回归分析的主要指标,了解最小二乘法的基本思想熟练掌握线性回归分析的具体操作,读懂分析结果;掌握计算结果之间的数量关系,写出回归方程,对回归方程进行各种统计检验了解多元回归分析中自变量筛选的策略,以及对应结果的分析了解SPSS残差分析和多重共线检测的基本操作,并能分析结果第二页,讲稿共五十七页哦9.19.1回归分析概述回归分析概述9.1.1什么是回归分析什么是回归分析“回归回归”一词最初源于英国统计学家一词最初源于英国统计学家F.Galton(高(高尔顿)描述父亲的身高和其成年儿子身高之间的关系,尔顿)描述父亲的身高和其成年儿子身高
2、之间的关系,发现成年儿子的身高会趋向于子辈身高的平均值,发现成年儿子的身高会趋向于子辈身高的平均值,F.Galton称这种现象为称这种现象为“回归回归”。用于分析事物之间的统计关系,并通过回归方程的形用于分析事物之间的统计关系,并通过回归方程的形式描述变量间的数量变化规律,帮助人们准确把握式描述变量间的数量变化规律,帮助人们准确把握变量受一个或多个变量的影响程度,进而为预测提变量受一个或多个变量的影响程度,进而为预测提供依据。供依据。第三页,讲稿共五十七页哦回归分析和相关分析回归分析和相关分析1.相关分析相关分析变量性质:都是随机变量且关系对等变量性质:都是随机变量且关系对等分析方法:图表法(
3、散点图)和相关系数分析方法:图表法(散点图)和相关系数分析目的:判定变量之间相关方向和关系的密切程度分析目的:判定变量之间相关方向和关系的密切程度2.回归分析回归分析变变量量性性质质:自自变变量量(确确定定型型变变量量)和和因因变变量量(随随机机变变量量)的关系且不对等的关系且不对等分析方法:建立回归模型分析方法:建立回归模型分析目的:研究变量间数量依存关系分析目的:研究变量间数量依存关系第四页,讲稿共五十七页哦9.1.29.1.2如何得到回归线如何得到回归线函数拟合函数拟合首先,通过散点图观察变量之间的统计关系,得到对回首先,通过散点图观察变量之间的统计关系,得到对回归线的感性认知,并据之确
4、定最简洁的数学函数(回归归线的感性认知,并据之确定最简洁的数学函数(回归模型);模型);其次,利用样本数据在一定的拟合准则下,估计回归模其次,利用样本数据在一定的拟合准则下,估计回归模型中各个参数,得到确定的回归方程;型中各个参数,得到确定的回归方程;最后,由于回归参数是在样本数据的基础上得到的,存最后,由于回归参数是在样本数据的基础上得到的,存在随机性。因此需要进行各种检验。在随机性。因此需要进行各种检验。第五页,讲稿共五十七页哦9.1.39.1.3回归分析的一般步骤回归分析的一般步骤确定回归方程中的解释变量(父亲身高确定回归方程中的解释变量(父亲身高x)和被解释)和被解释变量(儿子身高变量
5、(儿子身高y)确定回归模型(线性与非线性)确定回归模型(线性与非线性)建立回归方程,并估计出模型中的参数建立回归方程,并估计出模型中的参数对回归方程进行各种检验对回归方程进行各种检验利用方程进行预测利用方程进行预测第六页,讲稿共五十七页哦9.2 9.2 线性回归分析和线性回归模型线性回归分析和线性回归模型 观察被解释变量观察被解释变量y和一个或多个解释变量和一个或多个解释变量xi的散点的散点图,当发现图,当发现y与与xi之间呈现出显著的线性关系时,之间呈现出显著的线性关系时,应采用线性回归分析的方法,建立应采用线性回归分析的方法,建立y关于关于xi的线性的线性回归模型。回归模型。线性回归模型可
6、分为:线性回归模型可分为:一元线性回归模型一元线性回归模型 多元线性回归模型多元线性回归模型第七页,讲稿共五十七页哦9.2.19.2.1一元线性回归模型(只有一元线性回归模型(只有1 1个解释变量)个解释变量)数学模型为:数学模型为:y=0+1x+上式表明:上式表明:y的变化可由的变化可由两部分解释两部分解释:第一,由解释变:第一,由解释变量量x的变化引起的的变化引起的y的线性变化部分,即的线性变化部分,即y=0+1x;第;第二,由其他随机因素引起的二,由其他随机因素引起的y的变化部分,即的变化部分,即。0、1 都是模型中的未知参数,都是模型中的未知参数,0为回归常数,为回归常数,1为为y对对
7、x回归系数(即回归系数(即x每变动一个单位所引起的每变动一个单位所引起的y的平均变的平均变动)动)。称为随机误差。且满足:称为随机误差。且满足:E()=0,Var()=2。第八页,讲稿共五十七页哦一元线性回归方程:一元线性回归方程:E(y)=0+1x 表明表明x和和y之间的统计关系是在平均意义下表述之间的统计关系是在平均意义下表述的。的。估计的一元线性回归方程:估计的一元线性回归方程:估计方程是平面上的一条直线,即回归直线。估计方程是平面上的一条直线,即回归直线。参数分别代表回归直线的截距和斜率。参数分别代表回归直线的截距和斜率。cbb10+=y第九页,讲稿共五十七页哦9.2.29.2.2多元
8、线性回归模型多元线性回归模型多元数学模型:多元数学模型:y=0+1x 1+2x 2 .+px p +多元线性回归方程:多元线性回归方程:E(y)=0+1x 1+2x 2 .+px p估计估计多元线性回归方程多元线性回归方程:y=0+1x 1+2x 2 .+px p第十页,讲稿共五十七页哦9.2.39.2.3回归参数的最小二乘估计回归参数的最小二乘估计 (ordinary least square estimation,OLSEordinary least square estimation,OLSE)p估计思想:估计思想:使每个样本点(使每个样本点(xi,yi)与回归线上的对应点()与回归线上
9、的对应点(xi,E(yi)在垂直方向上偏差距离的二次方总和达到最小的)在垂直方向上偏差距离的二次方总和达到最小的原则来估计参数原则来估计参数 即,即,(yi -E(yi)2=最小最小p一元二乘估计一元二乘估计:p多元二乘估计(略)多元二乘估计(略)第十一页,讲稿共五十七页哦9.3回归方程的统计检验拟合优度检验拟合优度检验回归方程的显著性检验回归方程的显著性检验回归系数的显著性检验回归系数的显著性检验残差分析第十二页,讲稿共五十七页哦9.3.1回归方程的拟合优度检验 用于检验样本数据点聚集在回归线周围的密集程度,从而评价回归线对样本数据的代表程度。思想:因变量y(儿子身高)取值的变化受两个因素的
10、影响:自变量x(父亲身高)不同取值的影响,其他因素(环境、饮食等)的影响。可表示如下:因变量总变差 =自变量引起的自变量引起的 +其他因素引起的即因变量总变差=回归方程可解释的回归方程可解释的+不可解释的即,因变量总离差平方和SST=回归平方和回归平方和 SSA +剩余平方和SSE第十三页,讲稿共五十七页哦Yi图示:第十四页,讲稿共五十七页哦第十五页,讲稿共五十七页哦一、一元线性回归方程拟合优度的检验采用R2统计量,称为判定系数R2=SSA/SST=1-SSE/SST.R2体现了回归方程所能解释的因变量变差的比例;1-R2体现了回归方程所无法解释的变差比例。第十六页,讲稿共五十七页哦R2越接近
11、于1,则说明回归平方和占了绝大部分比例,因变量y的变差主要由自变量x的取值造成,回归方程对样本数据点拟合得好在一元线性回归中,判定系数R2=相关系数r2;因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。说明说明第十七页,讲稿共五十七页哦二、多元线性回归方程多元线性回归方程的拟合优度检验采用统计量 ,称为调整的判定系数调整的判定系数:判定系数受解释变量X的个数p的影响,在p的个数不同的模型之间进行比较时,判定系数必须进行调整。第十八页,讲稿共五十七页哦9.3.2回归方程的显著性检验 用于检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它
12、们之间的关系是否恰当,即检验模型对总体的近似程度检验模型对总体的近似程度。SST=回归平方和回归平方和 SSA +剩余平方和剩余平方和SSE回归方程的显著性检验中采用方差分析的方法,研究在SST中SSA相对于SSE来说是否占有较大比例。如果比例较大,表明y与x全体的线性关系明显,则利用线性模型反映y与x的关系是恰当的;反之,不恰当。第十九页,讲稿共五十七页哦u原假设H0:1=0.即:回归系数与0无显著差异u利用F检验,构造F统计量:uFF(1,n-2)u判断:若 pa,则拒绝H0,模型的线性关系是显著的;反之,模型的线性关系不显著.一、一元线性回归方程显著性检验第二十页,讲稿共五十七页哦u原假
13、设H0:1=2=.=p=0.即:各个回归系数同时与0无显著差异u利用F检验,构造F统计量:uFF(p,n-p-1)u判断:若 pa,则拒绝H0,模型的线性关系是显著的;反之,模型的线性关系不显著.二、多元线性回归方程的显著性检验第二十一页,讲稿共五十七页哦R2检验与F检验的关系 F是R2的单调增函数,F与 一一对应。R2FF图图1 F1 F统计量与统计量与R R2 2的关系的关系第二十二页,讲稿共五十七页哦9.3.3回归系数的显著性检验主要目的是研究回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系。即研究每个解释变量能否有效的反映被解释变量的线性变化,它们能否保留在线性回归方程中。
14、回归系数的显著性检验是围绕回归系数估计值的抽样分布展开的,构造统计量,并进行检验。第二十三页,讲稿共五十七页哦一、一元线性回归方程显著性检验回归系数的显著性检验系数的显著性检验:t检验检验H0:1=0,即:回归系数与0无显著差异,利用t检验:第二十四页,讲稿共五十七页哦 若 pa,不能拒绝H0,y和x线性关系不显著。一元线性回归方程的检验和回归系数的检验是一元线性回归方程的检验和回归系数的检验是等效的等效的。第二十五页,讲稿共五十七页哦需要对回归系数是否为零逐一进行检验。原假设H0:i=0,即:第i个偏回归系数与0无显著差异利用t检验统计量(略)若与t统计量的概率伴随p a,则拒绝H0多元线性
15、回归中回归系数的检验与整体回归方程的检验不能相互替代。二、多元线性方程回归系数的检验第二十六页,讲稿共五十七页哦9.3.4残差分析 残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中i 的估计值:回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。第二十七页,讲稿共五十七页哦一、残差均值为零的正态分析可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。第二十八页,讲稿共五十七页哦二、残差的独立性分析(非自相关)残差是独立的,则残差序列应满足cov(i,j)=0(ij),表示残差序列前期和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析 讲稿
限制150内