经济预测的方法与模型(1).pptx
经济预测的方法与模型经济预测的方法与模型 第一节第一节 回归分析预测法回归分析预测法第二节第二节 时间序列预测法时间序列预测法第三节第三节 宏观计量经济模型宏观计量经济模型学习目标经济预测的方法与模型是一种常用的统计分经济预测的方法与模型是一种常用的统计分析方法。通过本章的学习要求了解有关经济析方法。通过本章的学习要求了解有关经济预测的方法与模型,掌握相应的测定方法,预测的方法与模型,掌握相应的测定方法,学会简单回归分析方法。本章节计划课时大学会简单回归分析方法。本章节计划课时大约为约为6小时。小时。第一节第一节 回归分析预测法回归分析预测法一一.回归分析及其步骤回归分析及其步骤二二.一元线性回归模型一元线性回归模型三三.多元线性回归模型与非线性回归模型多元线性回归模型与非线性回归模型 经济预测主要是运用统计和数学的方法,对实际的数据或信息资料进行分析处理,以探讨经济现象的内在规律,并科学地预计未来可能出现的发展趋势或所能达到的水平。经济预测主要采取定量分析的方法,通过严密的逻辑推理和数学模型来发现未来,获得结论。是否可以预测经济,不同经济学家有不同的观点。有些经济学家认为经济学是科学,经济现象具有规律性,可以预测。一些则认为经济事件是独特的,不可重复,只能理解,不能预测。也有经济学家认为经济学是边缘科学,既具有一定科学性,又具有很强的经验性,虽可以预测,但预测的准确性很有限。不论经济学家的观点如何不一致,经济预测终究在不断发展,而且应用也越来越广泛,越来越深入,经济预测的方法也越来越多。篇幅所限,本章只能简要介绍几种典型的经济预测定量方法:回归分析法,时间序列法和宏观经济计量模型预测法。一、回归分析及其步骤一、回归分析及其步骤(一)回归分析的概念(一)回归分析的概念回归这个词来自生物学,是英国科学家高尔顿在研究子女和父母身高关系时用来描述遗传变化现象的,后来被广泛用来表示变量之间的数量关系。回归分析预测法是一种因果关系预测法,是通过分析事物间的因果关系和相互影响的程度,建立适当的计量模型进行预测的方法。现实经济中,许多经济变量之间存在着固有关系,其中一些变量受另一些变量或因素的支配。我们把前一类变量称为因变量或被解释变量,后一类变量称为自变量或解释变量。回归分析模型就是反映被解释变量与解释变量之间的因果关系的分析式。比如说,要研究城市家用空调器的销售量,我们可以找到若干影响空调器销售量的因素:该城市的人口规模,收人水平,还有该地区的气温状况;销售量是被解释变量,其他可作为解释变量。回归分析建立在数据的基础上,是用数学的分析模型或关系式来拟合实际数据,以反映数据中潜在的规律性。因而这种方法有其精确性的一面,也有其可能偏离实际的一面。也就是说,回归分析预测只是一种近似的预测。这有模型本身的原因:模型是现实经济系统的简化和抽象,我们在建立模型时不可能把所有的因素都考虑在内,这是运用回归分析进行预测的一个先天不足。而且,用统计的方法建立模型也不可能避免抽样误差的存在。同时也有模型外的原因,比如说数据的不准确以及外部经济环境的变化。因此,用回归分析来进行经济预测只能提供一个粗略的发展趋势,只能用作参考值。什么是回归分析?(内容)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度回归分析与相关分析的区别1.相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化2.相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归回归模型与回归方程回归模型1.回答“变量之间是什么样的关系?”2.方程中运用1 个数字的因变量(响应变量)被预测的变量1 个或多个数字的或分类的自变量(解释变量)用于预测的变量3.主要用于预测和估计一元线性回归模型(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归2.对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型一元线性回归模型(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为 y=0 0+1 1 x+e e模型中,y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数一元线性回归模型(基本假定)1.误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=0+1 x2.对于所有的 x 值,的方差2 都相同3.误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关回归方程(概念要点)1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2.简单线性回归方程的形式如下3.E(y)=0+1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y 轴轴上上的的截截距距,是是当当 x x=0=0 时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值估计(经验)的回归方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值,也表示值,也表示 x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计参数 0 和 1 的最小二乘估计最小二乘法(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小最小二乘法(图示)x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i最小二乘法(和 的计算公式)根据最小二乘法的要求,可得求解 和 的标准方程如下估计方程的求法(实例)【例例】根据例10.1中的数据,配合人均消费金额对人均国民收入的回归方程 根据 和 的求解公式得估计(经验)方程 人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638 x 估计方程的求法(Excel的输出结果)回归方程的显著性检验离差平方和的分解1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示离差平方和的分解(图示)x xy yy y 离差分解图离差分解图离差平方和的分解(三个平方和的关系)2.两端平方后求和有1.从图上看有SST=SSR+SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)离差平方和的分解(三个平方和的意义)1.总平方和总平方和(SST)反映因变量的 n 个观察值与其均值的总离差2.回归平方和回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和样本决定系数(判定系数 r2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度3.取值范围在 0,1 之间4.r2 1,说明回归方程拟合的越好;r20,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即r2(r)2回归方程的显著性检验(线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系回归方程的显著性检验(检验的步骤)1.提出假设H0:线性关系不显著2.计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF,拒绝H0;若F t t,拒绝,拒绝H H0 0;t t =65.0758t t=2.201=2.201,拒拒绝绝H H0 0,表表明明人人均均收收入入与人均消费之间有线性关系与人均消费之间有线性关系对前例的回归系数进行显著性检验(0.05)回归系数的显著性检验(Excel输出的结果)预测及应用利用回归方程进行估计和预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计y 的个别值的预测区间估计利用回归方程进行估计和预测(点估计)2.点估计值有n ny y 的平均值的点估计的平均值的点估计n ny y 的个别值的点估计的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同1.对于自变量 x 的一个给定值x0,根据回归方程得到因变量 y 的一个估计值利用回归方程进行估计和预测(点估计)y 的平均值的点估计的平均值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值的一个估计值E(y0),就是平均值的点估计2.在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得利用回归方程进行估计和预测(点估计)y 的个别值的点估计的个别值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计2.比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得利用回归方程进行估计和预测(区间估计)1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间3.区间估计有两种类型置信区间估计预测区间估计利用回归方程进行估计和预测(置信区间估计)y 的平均值的的平均值的置信区间置信区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值E(y0)的估计区间,这一估计区间称为置信区间置信区间2.E(y0)在1-置信水平下的置信区间为式式中中:S Sy y为为估估计标准误差计标准误差利用回归方程进行估计和预测(置信区间估计:算例)【例例】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间 解:根据前面的计算结果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信区间为712.57712.57 10.26510.265人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间利用回归方程进行估计和预测(预测区间估计)y 的个别值的的个别值的预测区间预测区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间 2.y0在1-置信水平下的预测区间为注意!注意!利用回归方程进行估计和预测(置预测区间估计:算例)【例例】根据前例,求出1990年人均国民收入为1250.7元时,人均消费金额的95%的预测区间 解:根据前面的计算结果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信区间为712.57712.57 34.46934.469人人均均消消费费金金额额95%95%的的预预测测区区间间为为678.101678.101元元 747.039747.039元之间元之间影响区间宽度的因素1.置信水平(1-)区间宽度随置信水平的增大而增大2.数据的离散程度(s)区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用于预测的 xp与x的差异程度区间宽度随 xp与x 的差异程度的增大而增大置信区间、预测区间、回归方程xp pyx x预测上限置信上限预测下限置信下限多元线性回归模型多元线性回归模型(概念要点)1.一个因变量与两个及两个以上自变量之间的回归2.描述因变量 y 如何依赖于自变量 x1,x2,xp 和误差项 的方程称为多元线性回归模型多元线性回归模型3.涉及 p 个自变量的多元线性回归模型可表示为 0 0 ,1 1,p p是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2 ,x xp p 的线性函数加上误差项的线性函数加上误差项 说说明明了了包包含含在在y y里里面面但但不不能能被被p p个个自自变变量量的的线线性关系所解释的变异性性关系所解释的变异性多元线性回归模型(概念要点)对于 n 组实际观察数据(yi;xi1,,xi2,xip),(i=1,2,n),多元线性回归模型可表示为y1=0 0+1 1 x11+2 2 x12+px1p+e e1 1y2=0 0+1 1 x21+2 2 x22+px2p+e e2 2 yn=0 0+1 1 xn1+2 2 xn2+pxnp+e en 多元线性回归模型(基本假定)1.自变量 x1,x2,xp是确定性变量,不是随机变量2.随机误差项的期望值为0,且方差2 都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型几种常见的非线性模型 指数函数2.线性化方法两端取对数得:两端取对数得:lnlny y =ln=ln +x x令:令:y y =ln=lny y,则有,则有y y =lnln +x x1.基本形式:3.图像 几种常见的非线性模型 幂函数2.线性化方法两端取对数得:两端取对数得:lg lg y y=lg=lg +lglg x x令:令:y y =lg=lgy y,x x=lg=lg x x,则则y y =lglg +x x 1.基本形式:3.图像00 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 几种常见的非线性模型 双曲线函数2.线性化方法令:令:y y =1/=1/y y,x x=1/=1/x x,则有则有y y =+x x 1.基本形式:3.图像 0 0 0几种常见的非线性模型 对数函数2.线性化方法x x=lg=lgx x,则有则有y y =+x x 1.基本形式:3.图像 0 0 0 0 几种常见的非线性模型 S 型曲线2.线性化方法令:令:y y =1/=1/y y,x x=e=e-x x,则有则有y y =+x x 1.基本形式:3.图像非线性回归(实例)【例例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。废品率与生产率的关系废品率与生产率的关系生产率(周生产率(周/单位单位)x1000200030003500 4000 4500 5000废品率(废品率(%)y5.26.56.88.110.210.313.0非线性回归(实例)生产率与废品率的散点图非线性回归(实例)1.用线性模型:y=01x+,有2.y=2.671+0.0018x2.用指数模型:y=x ,有3.y=4.05(1.0002)x3.比较4.直线的残差平方和5.3371指数模型的残差平方和6.11。直线模型略好于指数模型