回归预测法.ppt
《回归预测法.ppt》由会员分享,可在线阅读,更多相关《回归预测法.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归预测法现在学习的是第1页,共88页3 回回 归归 预预 测测 法法二、基本要求:回归分析方法是一种应用非常广泛地分析方法。通过本章学习,要了解一元线性回归模型估计的基本原理、多元线性回归模型预测、非线性回归模型预测以及滞后变量模型预测,掌握一元线性回归模型的建立、应用和回归参数的检验方法,并能够根据模型进行预测。三、教学重点和难点:重点:重点是一元线性回归模型预测。难点:难点是多元线性回归模型预测和非线性回归模型预测。现在学习的是第2页,共88页回归探源【小知识3-1】“回归”这个概念,是1877年美国遗传学家高尔顿(FGaolton)提出来的。他是在研究了人类身高的遗传性时,发现父母身高
2、在子女身高遗传上有回归现象。在在1889年发表的著作年发表的著作自然的遗传自然的遗传中,中,高尔顿发现,虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。此后,回归的含义被进一步扩大,回归的现代涵义与过回归的现代涵义与过去大不相同。去大不相同。现被广泛应用于变量间的数量关系分析。一般说一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。目的在于根据已知自变量来估计和预测因变量的总平均值。(资料来源:杭
3、中茂:职业教育观,中国商业出版社1999)现在学习的是第3页,共88页回归的现代解释回归分析是关于研究一个应(因)变量对另一个或几个解释变量(自变量)的)依赖关系,其用意在于通过后者的己知或设定值,去估计和或预测前者的(总体)均值。现在学习的是第4页,共88页变量间的函数关系函数关系是一一对应的确定关系函数关系是一一对应的确定关系 设有两个变量设有两个变量 x 和和 y,变量,变量 y 随变量随变量 x 一起变化,一起变化,并完全依赖于并完全依赖于 x,当变量,当变量 x 取某个数值时,取某个数值时,y 依确定的依确定的关系取相应的值,则关系取相应的值,则称称 y 是是 x 的函数,记为的函数
4、,记为 y=f(x),其中,其中 x 称为自变量,称为自变量,y 称为因变量。称为因变量。各观测点各观测点(x,y)落在一条线上落在一条线上.x xy y现在学习的是第5页,共88页变量间的相关关系变量间关系不能用函数关系精确表达变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定一个变量的取值不能由另一个变量唯一确定,当变量当变量 x 取某个值时,变量取某个值时,变量 y 的取值可能有几个的取值可能有几个各观测点分布在某曲线周围各观测点分布在某曲线周围 x xy y现在学习的是第6页,共88页回归的基本思想与回归模型具有相关关系的变量,虽然不能用函数式准确表达其关系,但可
5、以通过大量的实验数据(或调查数据等)的统计分析,找出各相关因素的内在规律,可用某一函数式近似地描述其依存关系。回归分析是对具有相关关系的变量之间的数量变化规律进行测定,研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动关系,建立变量间的数量关系近似表达的函数方程,并进行参数估计和显著性检验以后,运用回归方程式对因变量进行估计和预测的分析方法。由回归由回归分析求出的关系式,分析求出的关系式,称为回归模型。称为回归模型。现在学习的是第7页,共88页回归模型回归模型 分类分类(1)根据自变量的多少:)根据自变量的多少:一元回归模型和多元回归模型一元回归模型和多元回归模型。(2
6、)根据回归模型的形式线性与否:)根据回归模型的形式线性与否:线性回归模型和非线性回归模型。线性回归模型和非线性回归模型。(3)根据回归模型所含的变量是否有虚拟变量:)根据回归模型所含的变量是否有虚拟变量:普通回归模型和带虚拟变量的回归模型。普通回归模型和带虚拟变量的回归模型。(4)根据回归模型是否用滞后的因变量作自变量:)根据回归模型是否用滞后的因变量作自变量:无自回归现象的回归模型和自回归模型。无自回归现象的回归模型和自回归模型。现在学习的是第8页,共88页回归分析预测法的具体步骤1、选定预测的变量及主要的影响因素(原因变量自变量);2、收集历史数据(或通过市场调查);3、分析变量间的关系建
7、立回归模型;4、参数估计:最小二乘法;5、回归预测模型的显著性检验;6、利用回归模型进行预测。现在学习的是第9页,共88页3.1 一元线性回归预测法一元线性回归预测法一、概念 是指成对的两个变量数据分布大体上呈直线趋 势时,运用合适的参数估计方法,求出一元线 性回归模型,然后根据自变量与因变量之间的 关系,预测因变量的趋势。回总目录回本章目录现在学习的是第10页,共88页 很多社会经济现象之间都存在相关关系,因 此,一元线性回归预测有很广泛的应用。进 行一元线性回归预测时,必须选用合适的统 计方法估计模型参数,并对模型及其参数进 行统计检验。回总目录回本章目录现在学习的是第11页,共88页 二
8、、一元线性回归分析预测法的基本步骤二、一元线性回归分析预测法的基本步骤 全面分析影响预测对象的相关因素,确定自变量 1、首先对所有影响因素进行分析 2、比较相关因素,找出最主要的影响因素选择回归预测模型,确定模型参数检验预测模型和预测结果的可靠性程度实际预测现在学习的是第12页,共88页1.一元线性回归模型:其中,是未知参数,为剩余残差项或称随机扰动项。,回总目录回本章目录三、一元线性回归模型及其误差因素与假设现在学习的是第13页,共88页2.随机误差项的影响因素随机误差项的影响因素三、一元线性回归模型及其误差因素与假设随机随机随机随机误误差差差差项项的影响因素的影响因素的影响因素的影响因素回
9、回归模型中模型中省略的省略的变量量测量量误差差建立的数学模型的建立的数学模型的形式不形式不够完善完善人人们的随机行的随机行为经济变量之量之间的的合并合并误差差3421现在学习的是第14页,共88页 用最小二乘法进行模型参数的估计时,要求满足一定的假设条件:(1)是一个随机变量;(2)的均值为零,即(3)在每一个时期中,的方差为常量,即(4)各个 相互独立;(5)与自变量无关。3.回归模型的五个基本假定回归模型的五个基本假定回总目录回本章目录现在学习的是第15页,共88页 设已知设已知n组数据(组数据(x1 1,y1 1),(),(x2 2,y2 2)(xn,yn),),模型:模型:误差误差ui
10、=误差的平方和误差的平方和由求得四、用最小二乘法进行参数估计现在学习的是第16页,共88页 用最小二乘法进行参数估计,得到的估计表达式为:回总目录回本章目录四、用最小二乘法进行参数估计进一步,现在学习的是第17页,共88页回归模型检验的必要性:回归模型检验的必要性:在线性回归模型的过程中,为进一步分析回归模型所反映的在线性回归模型的过程中,为进一步分析回归模型所反映的变量之间的关系是否符合客观实际变量之间的关系是否符合客观实际,引入的影响因素是否有效引入的影响因素是否有效,同,同样需要对回归模型进行样需要对回归模型进行检验检验。模型估计式的检验就是利用一定的定性与定量的标准对模型估计式的检验就
11、是利用一定的定性与定量的标准对模型的函数模型的函数形式形式,变量的选择及参数估计的正确性进行评价变量的选择及参数估计的正确性进行评价。(1)模型解释变量选择的正确性需要证明(主观随意性,解释)模型解释变量选择的正确性需要证明(主观随意性,解释变量的种类与多少由人为主观决定)变量的种类与多少由人为主观决定)(2)模型函数形式的正确性需要验证。解释变量与被解释变量)模型函数形式的正确性需要验证。解释变量与被解释变量的关系选择具有唯一性,很多情况下并非线性。的关系选择具有唯一性,很多情况下并非线性。(3)模型估计的可靠性需要评价。估计式来源于样本,对总体)模型估计的可靠性需要评价。估计式来源于样本,
12、对总体是否适合需要检验。(估计式的可靠性、稳定性)是否适合需要检验。(估计式的可靠性、稳定性)五、回归模型的统计检验五、回归模型的统计检验现在学习的是第18页,共88页1.标准误差:估计值与因变量值间的平方误差。其计算公式为:五、回归模型的统计检验五、回归模型的统计检验反映各实际点在直线周围的散布情况,越小越好。一般用标准差与均值之比。现在学习的是第19页,共88页五、五、回归模型的统计检验回归模型的统计检验 所所谓谓拟拟合合优优度度是是指指由由回回归归直直线线拟拟合合统统计计数数据据的的优优劣劣程度程度。2.2.可决系数可决系数r2 2:是反映拟合优度的数量指标:是反映拟合优度的数量指标(1
13、)其计算公式为:(2)可决系数含义可决系数含义由推证可得:由推证可得:即 总离差平方和(TSS)=回归偏差平方和(ESS)+剩余残差平方和(RSS)现在学习的是第20页,共88页TSS=ESS+RSS Y的观测值围绕其均值的总离差总离差(total variation)可分解为两部分:一一部分来自回归线部分来自回归线(ESS),另一部分则来自随机势力,另一部分则来自随机势力(RSS)。在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此拟合优度拟合优度:回归平方和:回归平方和ESS/YESS/Y的总离差的总离差TSSTSS可决系数公式即为可决系数公式即
14、为可决系数可决系数是衡量自变量与因变量关系密切程度的指标,表示自变量解释了因变量变动的百分比。现在学习的是第21页,共88页2.可决系数公式可决系数公式(1)可决系数是回归平方和占总离差平方和的比例可决系数是回归平方和占总离差平方和的比例(2)反映回归直线的拟合程度反映回归直线的拟合程度(3)可决系数取值范围在可决系数取值范围在 0,1 之间,并取决于回之间,并取决于回归模型所解释的归模型所解释的 y y 方差的百分比。方差的百分比。方差的百分比。方差的百分比。(4)(4)r r2 1,说明回归方程拟合的越好;,说明回归方程拟合的越好;r r20,说明回,说明回归方程拟合的越差归方程拟合的越差
15、;在预测实践中,在预测实践中,r2常用于模型的常用于模型的比较,人们往往采纳比较,人们往往采纳r2最高的模型,这是因为最高的模型,这是因为r r2 2高,高,就意味着该模型把就意味着该模型把y的变动解释得好。的变动解释得好。的变动解释得好。的变动解释得好。(5)可决系数等于相关系数的平方,即可决系数等于相关系数的平方,即r2(r)2现在学习的是第22页,共88页3.3.相关系数相关系数r相相关关系系数数r:是是另另一一个个被被广广泛泛用用来来测测定定拟拟合合优优度度的的指指标标;是是描描述述变变量量x与与y之之间间线线性性相相关关关关系系密密切切程程度度的一个数量指标。的一个数量指标。它的计算
16、公式为:它的计算公式为:由公式可见,可决系数是相关系数的平方。相关系数越接近+1或-1,因变量与自变量的拟合程度就越好。现在学习的是第23页,共88页相关系数的取值范围现在学习的是第24页,共88页和和 都都是是相相互互对对称称的的随随机机变变量量,x与与y和和y与与x的的相相关关系系数相等。数相等。线线性性相关系数只反映变量间的线性相关程度,不相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。能说明非线性相关关系。样本相关系数是总体相关系数的样本估计值,由样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统于抽样波动,样本相关系数是个随机变量,其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 预测
限制150内