欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    ets3 双变量线性回归模型.ppt

    • 资源ID:69347524       资源大小:871.50KB        全文页数:107页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    ets3 双变量线性回归模型.ppt

    第三章第三章 双变量线性回归模型双变量线性回归模型 (简单线性回归模型)(Simple Linear Regression Model)第一节第一节 双变量线性回归模型的估计双变量线性回归模型的估计第二节第二节 最小二乘估计量的性质最小二乘估计量的性质第三节第三节 拟合优度的测度拟合优度的测度第四节第四节 双变量回归中的区间估计和假设检验双变量回归中的区间估计和假设检验第五节第五节 预测预测第六节第六节 有关最小二乘法的进一步讨论有关最小二乘法的进一步讨论 这意味着这意味着 Y=+X (1)我们写出计量经济模型我们写出计量经济模型 如下如下 Y=+X+u (2)其中其中 u=扰动项或扰动项或 误差项误差项 Y为因变量或被解释变量为因变量或被解释变量,X为自变量或解释变量。为自变量或解释变量。和和 为未知参数。为未知参数。第一节第一节 双变量线性回归模型的估计双变量线性回归模型的估计一、一、双变量线性回归模型的概念双变量线性回归模型的概念XY图1*设设 Y=消费消费,X=收入收入,我们根据数据画出散点图如我们根据数据画出散点图如下下 (3)式称为式称为双变量线性回归模型双变量线性回归模型或或简单线性回归模型简单线性回归模型或或一元线性回归模型一元线性回归模型。其中。其中 和和 为未知的总体参数,为未知的总体参数,也也称为称为回归模型的系数(回归模型的系数(coefficients)。)。下标下标 i是是观测值的序号。观测值的序号。设我们有设我们有Y和和X的的n对观测值数据,则根据对观测值数据,则根据(2)式,变式,变量量Y的每个观测值应由下式决定:的每个观测值应由下式决定:Yi=+Xi+ui,i=1,2,.,n (3)当数据为时间序列时,往往用当数据为时间序列时,往往用下标下标 t来表示来表示观测值的观测值的序号,从而(序号,从而(3)式变成)式变成 Yt=+Xt+ut,t=1,2,.,n (3*)为何要在模型中包括扰动项为何要在模型中包括扰动项u 我我们们在在上上一一章章中中已已初初步步介介绍绍了了为为什什么么要要在在模模型型中中包包括扰动项括扰动项u,下面进一步说明之:下面进一步说明之:(1)真真正正的的关关系系是是Y=f(X1,X2,),但但X2,X3,相对不重要,用相对不重要,用u代表之。代表之。(2)两两变变量量之之间间的的关关系系可可能能不不是是严严格格线线性性的的,u反反映了与直线的偏差。映了与直线的偏差。(3)经济行为是随机的,我们能够用)经济行为是随机的,我们能够用 Y=+X 解释解释“典型典型”的行为,而用的行为,而用u来表示个体偏差。来表示个体偏差。(4)总总会会出出现现测测量量误误差差,使使得得任任何何精精确确的的关关系系不不可能存在可能存在。(一)关于最小二乘法的历史回顾(一)关于最小二乘法的历史回顾 最小二乘法最早称为回归分析法。由著名的英国最小二乘法最早称为回归分析法。由著名的英国生物学家、统计学家道尔顿(生物学家、统计学家道尔顿(F.Gallton,18221911)-达尔文的表弟所创达尔文的表弟所创。早年,道尔顿致力于化。早年,道尔顿致力于化学和遗传学领域的研究。道尔顿研究英国男子中父亲学和遗传学领域的研究。道尔顿研究英国男子中父亲们的身高与儿子们的身高之间的关系时,创立了回归们的身高与儿子们的身高之间的关系时,创立了回归分析法。分析法。二、二、普通最小二乘法普通最小二乘法(OLS法法,Ordinary Least squares)1.F.Gallton关于父亲们的身高与儿子们的身高之间关于父亲们的身高与儿子们的身高之间关系的研究关系的研究 1889年年F.Gallton和和他的学生、现代统计学的奠基者他的学生、现代统计学的奠基者之一之一K.PearsonK.Pearson(1856185619111911)收集了收集了10781078个家庭的身个家庭的身高、臂长和腿长的记录。企图寻找出儿子们身高与父亲们高、臂长和腿长的记录。企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式。在观看散点图时,发现近身高之间关系的具体表现形式。在观看散点图时,发现近乎于一条直线。计算出的回归直线方程为:乎于一条直线。计算出的回归直线方程为:这种趋势及回归方程表明父母平均身高这种趋势及回归方程表明父母平均身高x每增加一每增加一个单位时,其成年儿子的身高个单位时,其成年儿子的身高y也平均增加也平均增加0.516个单个单位。位。这个结果表明,虽然高个子父辈确有生高个子儿这个结果表明,虽然高个子父辈确有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。平均说来,一群高个子父辈的增加半个单位左右。平均说来,一群高个子父辈的儿子们的平均高度要低于他们父辈的平均高度。儿子们的平均高度要低于他们父辈的平均高度。低个子父辈的儿子们虽然仍为低儿子,平均身高低个子父辈的儿子们虽然仍为低儿子,平均身高却比他们的父辈增加了,也就是说,子代的平均身却比他们的父辈增加了,也就是说,子代的平均身高没有比他们的父辈更低。高没有比他们的父辈更低。正是因为子代的身高有回归到父辈平均身高的这正是因为子代的身高有回归到父辈平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高其子女更高,父辈个子低其子没有出现父辈个子高其子女更高,父辈个子低其子女更低的两极化现象。女更低的两极化现象。这个例子生动地说明了生物学中这个例子生动地说明了生物学中“种种”的概念的概念的稳定性。正是为了描述这种有趣的现象,的稳定性。正是为了描述这种有趣的现象,Galton引进了引进了“回归回归”这个名词来描述父辈身高这个名词来描述父辈身高x与子代身高与子代身高y的关系。的关系。尽管尽管“回归回归”这个名称的由来具有特定的含义,这个名称的由来具有特定的含义,人们在研究大量的问题中变量人们在研究大量的问题中变量x与与y之间的关系并之间的关系并不具有这种不具有这种“回归回归”的含义,但借用这个名词把的含义,但借用这个名词把研究变量研究变量x与与y之间统计关系的数学方法称为之间统计关系的数学方法称为“回回归归”分析。分析。2.最小二乘法的地位与作用最小二乘法的地位与作用(1 1)现在回归分析法已远非道尔顿的本意(儿子身现在回归分析法已远非道尔顿的本意(儿子身高向平均身高回归,以保持种族身高的稳定性),已高向平均身高回归,以保持种族身高的稳定性),已经成为探索变量之间关系最重要的方法,用以找出变经成为探索变量之间关系最重要的方法,用以找出变量之间关系的具体表现形式。量之间关系的具体表现形式。(2)后来,回归分析法从其方法的数学原理后来,回归分析法从其方法的数学原理残残差平方和最小(平方乃二乘也)出发,改称为最小二差平方和最小(平方乃二乘也)出发,改称为最小二乘法。乘法。(二)二)最小二乘法的思路最小二乘法的思路 1为了精确地描述为了精确地描述Y与与X之间的关系,必须使用这两之间的关系,必须使用这两个变量的每一对观察值,才不至于以个变量的每一对观察值,才不至于以“点点”概面(作到概面(作到同步与全面)。同步与全面)。2Y与与X之间是否是直线关系(用协方差或相关系数之间是否是直线关系(用协方差或相关系数衡量)?若是,将用一条直线描述它们之间的关系。衡量)?若是,将用一条直线描述它们之间的关系。3 3在在Y Y与与X X的散点图上的散点图上找出一条能够最好地描述找出一条能够最好地描述Y与与X(代表所有点)之间关系的直线。代表所有点)之间关系的直线。4 4什么是最好?什么是最好?找出判断找出判断“最好最好”的原则。的原则。最好指的是找这么一条直线,使得所有点到该直线的最好指的是找这么一条直线,使得所有点到该直线的纵向距离的和(平方和)最小。纵向距离的和(平方和)最小。我们的模型是:我们的模型是:Yt=+Xt+ut,t=1,2,.,n 这里这里 和和 为未知总体参数,下一步的任务是应用为未知总体参数,下一步的任务是应用统计学的方法,由统计学的方法,由Y和和X的观测值(即样本数据)来的观测值(即样本数据)来估计估计 和和 的总体值,常用的估计方法就是的总体值,常用的估计方法就是最小二乘最小二乘法。为了应用最小二乘法,得到好的估计量,法。为了应用最小二乘法,得到好的估计量,双变双变量线性回归模型需要满足一些统计假设条件,这些量线性回归模型需要满足一些统计假设条件,这些统计假设是:统计假设是:1.双变量线性回归模型的统计假设双变量线性回归模型的统计假设(三)最小二乘法原理三)最小二乘法原理 (1)E(ut)=0,t=1,2,.,n 即各期扰动项的均值即各期扰动项的均值(期望值期望值)为为0.(2)COV(ui,uj)=E(uiuj)=0 i j 即各期扰动项互不相关即各期扰动项互不相关.(3)Var(ut)=E(ut2)=2 ,t=1,2,.,n 即各期扰动项方差是一常数即各期扰动项方差是一常数.(4)解释变量解释变量Xt 为非随机量为非随机量 即即Xt的取值是确定的的取值是确定的,而不是随机的而不是随机的.(5)ut N(0,2),t=1,2,.,n 即各期扰动项服从正态分布即各期扰动项服从正态分布.满足条件满足条件(1)-(4)的线性回归模型称为古典线性回归的线性回归模型称为古典线性回归模型模型 (CLR模型模型)双变量线性回归模型的统计假设双变量线性回归模型的统计假设下面简单讨论一下上述假设条件。下面简单讨论一下上述假设条件。(1)E(ut)=0,t=1,2,n 即各期扰动项的均值(期望值)均为即各期扰动项的均值(期望值)均为0。均均值值为为0的的假假设设反反映映了了这这样样一一个个事事实实:扰扰动动项项被被假假定定为为对对因因变变量量的的那那些些不不能能列列为为模模型型主主要要部部分分的的微微小小影影响响。没没有有理理由由相相信信这这样样一一些些影影响响会会以以一一种种系系统统的的方方式式使使因因变变量量增增加加或或减减小小。因因此此扰扰动动项项均均值值为为0的的假假设设是是合理的。合理的。(2)E(uiuj)=0,ij 即即各各期期扰扰动动项项互互不不相相关关。也也就就是是假假定定它它们们之之间间无无自相关或无序列相关。自相关或无序列相关。实际上该假设等同于:实际上该假设等同于:cov(ui,uj)=0,ij这是因为:这是因为:cov(ui,uj)=Eui-E(ui)uj-E(uj)=E(uiuj)根据假设(根据假设(1)(3)E(ut2)=2,t=1,2,n 即即各各期期扰扰动动项项的的方方差差是是一一常常数数,也也就就是是假假定定各各扰扰动项具有同方差性。动项具有同方差性。实际上该假设等同于:实际上该假设等同于:Var(ut)=2,t=1,2,n这是因为:这是因为:Var(ut)=Eut-E(ut)2=E(ut2)根根据据假假设设(1)(4)Xt为非随机量为非随机量 即即Xt的取值是确定的的取值是确定的,而不是随机的。而不是随机的。事事实实上上,我我们们后后面面证证明明无无偏偏性性和和时时仅仅需需要要解解释释变变量量X与与扰扰动动项项u不不相相关关,但但不不容容易易验验证证之之,因因而而通通常常采采用非用非随机量的假设随机量的假设。(5)ut N(0,2),t=1,2,.,n 即扰动项服从正态分布。即扰动项服从正态分布。满满足足条条件件(1)(4)的的线线性性回回归归模模型型称称为为古古典典线线性回归模型(性回归模型(CLR模型)。模型)。我们的任务是,我们的任务是,在给定在给定X和和Y的一组观测值的一组观测值 (X1,Y1),(X2,Y2),.,(Xn,Yn)的情况下的情况下,如何求出如何求出 Yt=+Xt+ut 中中 和和 的估计值的估计值,使得拟使得拟合的直线为最佳合的直线为最佳。2.2.最小二乘原理最小二乘原理 直观上看,也就是要求在直观上看,也就是要求在X和和Y的散点图上穿过的散点图上穿过各观测点画出一条各观测点画出一条“最佳最佳”直线,如下图所示。直线,如下图所示。*et *YXXt 图图 2 YtYt 拟合的直线拟合的直线 称为称为拟合的回归线拟合的回归线.对于任何数据点对于任何数据点(Xt,Yt),此直线将此直线将Yt 的总值的总值 分成两部分。分成两部分。第一部分是第一部分是Yt的的拟合拟合值或预测值值或预测值 :,t=1,2,n 第二部分,第二部分,et 代表观测点对于回归线的误差,称代表观测点对于回归线的误差,称为为拟合拟合或预测的残差或预测的残差(residuals):):t=1,2,n 即即 t=1,2,n残差残差 我们的目标是使拟合出来的直线在某种意我们的目标是使拟合出来的直线在某种意义上是最佳的,直观地看,也就是要求估计义上是最佳的,直观地看,也就是要求估计直线尽可能地靠近各观测点,这意味着应使直线尽可能地靠近各观测点,这意味着应使各残差尽可能地小。要做到这一点,就必须各残差尽可能地小。要做到这一点,就必须用某种方法将每个点相应的残差加在一起,用某种方法将每个点相应的残差加在一起,使其达到最小。理想的测度是残差平方和,使其达到最小。理想的测度是残差平方和,即即 如何决定估计值如何决定估计值 和和?残差平方和残差平方和 最小二乘法就是选择一条直线,使其残差平方和最小二乘法就是选择一条直线,使其残差平方和达到最小值的方法。即选择达到最小值的方法。即选择 和和 ,使得,使得达到最小值。达到最小值。运用微积分知识,使上式达到最小值的必要条件为:运用微积分知识,使上式达到最小值的必要条件为:即即整理,得:整理,得:此二式称为正规方程。解此二方程,得:此二式称为正规方程。解此二方程,得:.其中:其中:离差离差样本均值样本均值估计量估计量(5)式和()式和(6)式给出了)式给出了OLS法计算法计算 和和 的的公式,公式,和和 称为线性回归模型称为线性回归模型 Yt=+Xt+ut 的参数的参数 和和 的普通最小二乘估计量的普通最小二乘估计量(OLS estimators)。)。这两个公式可用于任意一组观测值数据,以求出这两个公式可用于任意一组观测值数据,以求出截距和斜率的截距和斜率的OLS估计值(估计值(estimates),估计值是估计值是从一组具体观测值用公式计算出的数值。从一组具体观测值用公式计算出的数值。一般说来,好的估计量所产生的估计值将相当接一般说来,好的估计量所产生的估计值将相当接近参数的真值,即好的估计值。可以证明,对于近参数的真值,即好的估计值。可以证明,对于CLR模型,普通最小二乘估计量正是这样一个好模型,普通最小二乘估计量正是这样一个好估计量。估计量。拟合直线的性质拟合直线的性质1.1.残差和为零残差和为零 2.Y Y的真实值和拟合值有共同的均值的真实值和拟合值有共同的均值3.残差与自变量不相关残差与自变量不相关4.残差与拟合值不相关残差与拟合值不相关3 例子例子 例例1 对于第一段中的消费函数,若根据数据对于第一段中的消费函数,若根据数据得到:得到:n=10,=23,=20 则有则有因而因而例例2 设设Y和和X的的5期观测值如下表所示,试估计方程期观测值如下表所示,试估计方程 Yt=+Xt+ut 序号 1 2 3 4 5 Yt 14 18 23 25 30 Xt 10 20 30 40 50 解:我们采用列表法计算。计算过程如下:解:我们采用列表法计算。计算过程如下:序号序号YtXtyt=Yt-xt=Xt-xt ytxt211410-8-2016040021820-4-1040100323301000425403103010053050820160400n=5110150003901000表表31估计方程为:估计方程为:又解又解表表32序号序号Yttt tt211410140100218203604003233069090042540100016005305015002500n=511015036905500Eviews创建工作文件,输入数据并进行回归:Create u 1 5data x yls y c x 对于满足统计假设条件对于满足统计假设条件(1)-(4)的线性回归模型的线性回归模型 Yt=+Xt+ut ,,普通最小二乘估计量普通最小二乘估计量 (OLS估估计量计量)是最佳线性无偏估计量(是最佳线性无偏估计量(BLUE)。)。或或 对于古典线性回归模型(对于古典线性回归模型(CLR模型)模型)Yt=+Xt,普通最小二乘估计量(普通最小二乘估计量(OLS估计量)是最佳线性无估计量)是最佳线性无偏估计量(偏估计量(BLUE)。)。3.高斯高斯-马尔柯夫定理马尔柯夫定理(Gauss-Markov Theorem)我们已在前面证明了无偏性,此外,由于:我们已在前面证明了无偏性,此外,由于:由上段结果,由上段结果,=其中其中 这这表表明明,是是诸诸样样本本观观测测值值Yt(t=1,2,n)的的线线性性函函数数,故故 是线性估计量。是线性估计量。剩剩下下的的就就是是最最佳佳性性了了,即即 的的方方差差小小于于等等于于的的其其他他任任何何线线性性无无偏偏估估计计量量的的方方差差,我我们们可可以以证证明明这这一一点点,但但由由于于时时间间关关系系,从从略略。有有兴兴趣趣的的同同学学请请参参见见教教科科书书(P46-47)我们在前面列出的假设条件(我们在前面列出的假设条件(5)表明,)表明,ut N(0,2),t=1,2,.,n 即各期扰动项服从均值为即各期扰动项服从均值为0、方差为、方差为 2的正态分布。的正态分布。考虑到假设条件(考虑到假设条件(4),即),即Xt为非随机量,则由前面结果:为非随机量,则由前面结果:=其中,其中,4.和和 的分布的分布 这这表表明明,是是N个个正正态态分分布布变变量量u1,u2,,un的的线线性函数,因而亦为正态分布变量,即性函数,因而亦为正态分布变量,即 类似的有:类似的有:用最小二乘法得到的回归直线用最小二乘法得到的回归直线 至至少少从从残残差差平平方方和和为为最最小小这这一一意意义义上上来来说说是是所所有有可可能能直直线线中中最最佳佳的的拟拟合合线线。它它是是对对Y和和X之之间间关关系系的的一一种种描描述述,但但该该直直线线是是不不是是Y和和X之之间间关关系系的的一一种种恰恰当当的的描描述述呢呢?如如果果各各观观测测点点紧紧密密地地聚聚集集在在这这条条直直线线的的周周围围,则则表表明明该该直直线线对对Y和和X之之间间关关系系的的描描述述是是好好的的;否否则则,用用直直线线来来描描述述这这两两个个变变量量之之间间的的关关系系就就未未必必恰当,如下图所示:恰当,如下图所示:四、拟合优度的测度四、拟合优度的测度1.拟合优度拟合优度(Goodness of fit)的概念的概念 (a)恰当描述恰当描述 (b)不恰当描述不恰当描述 图图2-3 应应该该指指出出,对对于于任任意意两两个个变变量量的的一一组组观观测测值值,我我们们总总是是可可以以运运用用最最小小二二乘乘法法得得到到一一条条直直线线,问问题题是是该该直直线线能能否否较较好好地地拟拟合合所所给给定定的的观观测测值值,这这就就是是拟拟合合优优度度问问题题。拟拟合合优优度度是是两两变变量量之之间间关关系系强强度度的的测测度度。在在这这里里,指指的的是是两两变变量量间间线线性性关关系系强强度度的的测测度。度。让我们来考察一下让我们来考察一下Y的变差的组成情况。我们的变差的组成情况。我们有有Y的的N个观测值,个观测值,Y的总变差的一个测度是的总变差的一个测度是 ,Y的变差(的变差()中有一部分是可)中有一部分是可以由以由X的取值变动所解释的的取值变动所解释的,还有一部分是不能由还有一部分是不能由X所解释的变差所解释的变差:Y的变差自变量的变差自变量X引起引起Y的变动部分除的变动部分除X以外以外的因素引起的因素引起Y的变动部分的变动部分2.Y的变差(离差)的组成的变差(离差)的组成如下图所示:如下图所示:对于第对于第t个观测值,有:个观测值,有:由于由于对于全部对于全部N项观测值平方求和,有:项观测值平方求和,有:其中,ESSExplained Sum of Squares RSSResidual Sum of Squares TSSTotal Sum of Squares :总变差(:总变差(TSS),),度量度量Y自身的差异程自身的差异程度。度。TSS除以除以自由度自由度n-1因变量的方差。因变量的方差。:回归变差(解释变差:回归变差(解释变差ESS),),度量度量Y的的拟合值拟合值自身的差异程度自身的差异程度,ESS除以除以自由度自由度k k(自自变量个数)变量个数)=回归方差,回归方差,度量由自变量的变化引度量由自变量的变化引起的因变量变化部分。起的因变量变化部分。:度量实际值与拟合值之间的差异程度,度量实际值与拟合值之间的差异程度,称为残差变差。称为残差变差。RSS除以除以自由度(自由度(n-k k-1)=残差残差(误差)方差,(误差)方差,度量由非自变量的变化引起的因度量由非自变量的变化引起的因变量变化部分。变量变化部分。(1)决定系数)决定系数R2 决决定定系系数数是是反反映映估估计计的的回回归归曲曲线线对对观观测测的的数数据据的解释能力或者说是反映两者拟合优度的尺度。的解释能力或者说是反映两者拟合优度的尺度。我我们们将将(8)式式两两端端都都除除以以总总变变差差 ,得:得:3.拟合优度的测度拟合优度的测度用符号表示为:用符号表示为:决决定定系系数数 R2 计计量量了了Y的的总总变变差差中中可可以以归归因因于于X和和Y之之间间关关系系的的比比例例,或或者者说说Y的的变变动动中中可可以以由由X的的变变动动来来解解释释的的比比例例。它它是是回回归归线线对对各各观观测测点点拟拟合合紧紧密密程程度的测度。度的测度。我们有:我们有:R2=1:完全拟合,完全拟合,R2=0:X与与Y完全不存在线性关系,完全不存在线性关系,=R2的的值值越越高高,拟拟合合得得越越好好。但但什什么么是是高高?回回归归中中使用时间序列数据使用时间序列数据还是横截面数据有不同的标准。还是横截面数据有不同的标准。(4)相关系数相关系数 r 由由 R2 很很容容易易联联想想到到我我们们在在统统计计中中学学过过的的相相关关系系数数。相相关关系系数数r与与决决定定系系数数的的关关系系为为:R2=(r2),相相关关系系数数的的计计算算公公式为:式为:相关系数相关系数r也是拟合优度的测度,其符号取决于也是拟合优度的测度,其符号取决于的符号(即的符号(即 的符号)的符号)我们有:我们有:-1 r 1 r=1:完全正相关完全正相关 r=-1:完全负相关完全负相关 r=0:无线性关系无线性关系 相相关关系系数数和和决决定定系系数数的的计计算算很很简简单单,事事实实上上,我我们们只只要要在在原原列列表表计计算算 的的表表格格中中加加上上一一个个计计算算 的的栏栏目目就就行行了了。对于我们前面的例子,列表计算得:对于我们前面的例子,列表计算得:=154,因此:,因此:r =R2 =(0.9938)2 =0.9876 它它表表明明,在在我我们们的的例例子子中中,X与与Y存存在在着着很很强强的的线线性性关关系系,拟拟合合甚甚佳佳,但但由由于于观观测测点点很很少少(5个个),因因而而对对此此结结论应持谨慎态度。论应持谨慎态度。我们在上一节中已得出,在我们在上一节中已得出,在5条假设条件成立的情况下,有条假设条件成立的情况下,有 与估计量相联系的概率分布的标准差,通常称为标准误差,用与估计量相联系的概率分布的标准差,通常称为标准误差,用Se表示。表示。的标准误差为:的标准误差为:Se()=如如果果为为已已知知,则则我我们们可可以以立立即即给给出出总总体体参参数数的的95%的的置置信信区区间为:间为:1.96 或或 1.96 Se()2 双变量回归中的区间估计和假设检验双变量回归中的区间估计和假设检验一、一、的置信区间的置信区间 但但实实际际上上,我我们们一一般般无无法法知知道道扰扰动动项项分分布布的的方方差差 2,而而必必须须根根据据样样本本数数据据估估计计出出 2,然然后后再再来来考考虑虑的的置置信信区区间间的的计算问题。计算问题。1.2 的估计的估计我们可以用残差来估计扰动项我们可以用残差来估计扰动项 ut 的方差的方差 2:可以证明,可以证明,是是 2的无偏估计量的无偏估计量.为了计算为了计算 ,我们可以直接从残差的定义式,我们可以直接从残差的定义式 得到,也可以通过下面的公式求出:得到,也可以通过下面的公式求出:=我们重新定义标准误差为:我们重新定义标准误差为:Se()=则检验统计量则检验统计量 t=t(n-2)故故的置信区间为:的置信区间为:即即 2.的置信区间的置信区间 即为即为0.10至至1.06。也就是说,我们有。也就是说,我们有95%的把握说的把握说在在0.10至至1.06之间。之间。1.假设检验的方法假设检验的方法有了上一段的重要结果有了上一段的重要结果 t=t(n-2)我们进行有关总体参数我们进行有关总体参数的假设检验就很容易了。的假设检验就很容易了。假设检验的步骤:假设检验的步骤:(1)建立关于总体的原假设和备择假设)建立关于总体的原假设和备择假设;(2)计算检验统计量,检验原假设(是否出现小概率事件计算检验统计量,检验原假设(是否出现小概率事件);(3)得出关于原假设是否合理的结论)得出关于原假设是否合理的结论.二、假设检验二、假设检验例例1:仍用上一段例中的数据,我们要检验的是:仍用上一段例中的数据,我们要检验的是:原假设:原假设:H0:=0.8 备择假设:备择假设:H1:0.8 这是一个单侧检验的问题。这是一个单侧检验的问题。我们有:我们有:t =-1.05 用用=n-2=10-2=8查查t表,截断左侧表,截断左侧5%面积的面积的 t 临界值临界值 tc =-1.86 t=-1.05 -1.86 故接受原假设故接受原假设H0,即,即=0.8图2.5 在在假假设设检检验验中中,有有关关是是否否为为0 的的假假设设检检验验特特别别重重要要。如如果果通通过过检检验验,接接受受=0的的原原假假设设,则则表表明明X和和Y没没有有关关系系,即即X对对Y的的变变动动没没有有影影响响。在在这这种种情情况下,就应从模型中剔除况下,就应从模型中剔除X,寻找其他解释变量。寻找其他解释变量。这类检验称为这类检验称为系数的显著性检验系数的显著性检验。2.系数的显著性检验系数的显著性检验图2-6准则准则 当当p值小于显著性水平值小于显著性水平 时,系数在显著性时,系数在显著性水平水平 下是显著的;下是显著的;当当p值大于显著性水平值大于显著性水平 时,系数在显著性时,系数在显著性水平水平 下是不显著的。下是不显著的。我们已得到原假设我们已得到原假设H0:=0的的t值:值:t=2.76同样可得出原假设同样可得出原假设H0:=0的的t值:值:t=1.381.回归结果提供回归结果提供提供回归分析结果一般有两种方式:提供回归分析结果一般有两种方式:(1)=6.70 +0.58X R2=0.49 (1.38)()(2.76)这里这里6.70和和0.58分别为分别为和和的估计值的估计值 和和 。括号中数字是括号中数字是H0:=0和和H0 :=0 为真时的为真时的 t 值。值。三、回归结果的提供和分析三、回归结果的提供和分析2.回归结果的分析回归结果的分析 结果的分析主要包括以下内容:结果的分析主要包括以下内容:(1)系系数数的的说说明明。首首先先是是说说明明系系数数的的符符号号是是否否正正确确,是是否否符符合合经经济济理理论论和和常常识识。其其次次是是说说明明系系数数的的含含义义,斜斜率率系系数数为为0.58,表表明明X增增加加一一个个单单位位,Y增增加加0.58个个单单位位(如如收收入入X增增加加1元元,消消费费Y增增加加0.58元元);截截距距6.70的的含含义义是是X为为0时时Y的值。截距项有时有经济意义,大多数情况下无。的值。截距项有时有经济意义,大多数情况下无。(2)拟拟合合情情况况。R2不不高高,作作为为时时间间序序列列数数据据,拟拟合合不不理想。理想。(3)系系数数的的显显著著性性。斜斜率率系系数数的的t值值为为2.76,表表明明该该系系数显著异于数显著异于0,X对对Y有影响。有影响。(2)=6.70+0.58X R2 =0.49 (4.86)(0.21)括号中提供的是括号中提供的是 和和 的标准误差。的标准误差。我们用我们用OLS法对双变量模型的参数进行了估计之后,法对双变量模型的参数进行了估计之后,如果结果理想(拟合得较好,且系数估计值符合经济理论如果结果理想(拟合得较好,且系数估计值符合经济理论和常识),则可用估计好的模型进行预测。和常识),则可用估计好的模型进行预测。一、预测的概念一、预测的概念 预预测测通通常常指指利利用用现现有有信信息息预预测测未未来来。在在这这里里,预预测测指指的的是是对对自自变变量量的的某某一一具具体体值值X0,来来预预测测与与它它相相对对应应的的因因变变量量值值Y0。它它既既可可以以指指对对未未来来某某个个时时期期因因变变量量值值的的预预测测,也也可可以以是是对对未未包包括括在在横横截截面面样样本本之之中中的的某某个个实实体体数数值值的的预测。预测。通通常常情情况况下下,我我们们要要预预测测的的是是与与样样本本观观测测值值范范围围之之外外的的X值值对对应应的的Y值值,如如观观测测值值为为1985-2000年年,预预测测2001,2002年的居民消费。但年的居民消费。但X0也可以在样本也可以在样本X值的范围内。值的范围内。3 预测预测 要要进进行行预预测测,有有一一个个假假设设前前提提应应当当满满足足。即即对对于于样样本本观观测测值值数数据据成成立立的的X和和Y之之间间的的关关系系对对于于新新的的观测值也成立。即若双变量模型的原设定是:观测值也成立。即若双变量模型的原设定是:Yt =+Xt+ut,t=1,2,n 则要使此模型可以用来作为预测的依据,还应则要使此模型可以用来作为预测的依据,还应 有:有:Y0=+X0+u0 也成立。也成立。二、二、预测的隐含假设预测的隐含假设 我我们们可可以以得得到到两两种种类类型型的的预预测测值值:点点预预测测值值和和区区间间预预测测值值。在在实实践践中中,如如果果没没有有某某种种精精度度指指标标的的话话,点点预预测测值值是是没没有有多多大大用用处处的的。所所以以,我我们们必必须须提提供供点点预预测测值值的预测误差。的预测误差。点预测值由与点预测值由与X0对应的回归值给出,即对应的回归值给出,即 而预测期的实际而预测期的实际Y值由下式给出:值由下式给出:其中其中 u0 是从预测期的扰动项分布中所取的值。是从预测期的扰动项分布中所取的值。三、三、预测的误差预测的误差 由此不难看出,预测误差产生于两个来源:由此不难看出,预测误差产生于两个来源:(1)(1)模型中包含扰动项,点预测值是假定预测期扰模型中包含扰动项,点预测值是假定预测期扰 动项动项 u0 为为 0,而实际上一般不为,而实际上一般不为0 0。(2)(2)点预测值公式中用的是点预测值公式中用的是 和和 的估计值的估计值 和和 ,样本估计值和一般不等于总体参数样本估计值和一般不等于总体参数 和和。预测误差的来源预测误差的来源 预测误差的方差为:预测误差的方差为:其其它它两两项项协协方方差差等等于于0。这这是是因因为为u0独独立立于于u1,u2,un,而而 和和 均均为为 u1,u2,un,的的线线性性函数,因此它们与函数,因此它们与u0的协方差均为的协方差均为0。将将我我们们在在前前面面得得到到的的 和和 的的方方差差及及协协方方差差代代入上式,得:入上式,得:从从e 0 的定义的定义 可可看看出出,e 0为为正正态态变变量量的的线线性性函函数数,因因此此,它它本本身身也也服服从从正正态分布。故态分布。故 N(0,1)由于由于 是未知的,我们用其估计值是未知的,我们用其估计值 代替它,有代替它,有四、四、Y0的置信区间的置信区间 0 X0 X Y影响预测精度的因素:影响预测精度的因素:扰动项的方差越大,预测误差也就越大;扰动项的方差越大,预测误差也就越大;n样本容量越大,预测误差越小;样本容量越大,预测误差越小;X的的方差越大,预测误差越小;方差越大,预测误差越小;X0 X0与与X的平均值越近,预测误差越小。的平均值越近,预测误差越小。即即15.24至至21.76,也就是说,我们有,也就是说,我们有95%的把握预测的把握预测Y0 将位于将位于15.24至至21.76之间。之间。例例2 且且 现有一对新观测值,现有一对新观测值,试问它们是否可试问它们是否可能来自产生样本数据的同一总体?能来自产生样本数据的同一总体?解:解:问题可化为问题可化为“预测误差是否显著地大?预测误差是否显著地大?”当当 时,时,预测误差预测误差 原假设原假设:H0:备择假设备择假设:H1:检验:检验:若若H0为真,则为真,则 对于对于n-2=8个自由度,查表得个自由度,查表得5%显著性水平检验的显著性水平检验的t临界值为:临界值为:即即结论:结论:由于由于 故故接接受受原原假假设设,即即新新观观测测值值与与样样本本观观测测值值来来自自同一总体。同一总体。上上例例的的意意义义在在于于,我我们们可可以以通通过过从从估估计计模模型型用用的的一一组组观观测测值值中中剔剔除除最最近近期期的的一一两两对对观观测测值值,用用它它们们来来检检验验模模型型的的预预测测功功效效。如如果果我我们们在在上上述述检检验验中中拒拒绝绝了了原原假假设设,则则不不管管是是什什么么原原因因,我我们们都都要要认认真真对对待,回过头来检查模型的设定是否正确。待,回过头来检查模型的设定是否正确。例3 书P61例3.7第六节第六节 有关最小二乘法的进一步讨论有关最小二乘法的进一步讨论一、一、有关应用最小二乘法的前提的进一步讨论有关应用最小二乘法的前提的进一步讨论 运运用用普普通通最最小小二二乘乘法法,我我们们得得到到双双变变量量线线性性模模型型系系数数和和的最小二乘估计量的最小二乘估计量 和和 。我我们们已已经经证证明明在在一一定定的的假假设设条条件件下下,它它们们是是最最佳佳线线性性无无偏偏估估计计量量(BLUE)。这这样样一一种种估估计计量量,是是我我们们从从样样本本数数据据(观观测测值值)推推断断总总体体(参参数数)所所能能得得到到的的最最佳佳结结果果。换换句句话话说,我们不能得到比最小二乘估计量更理想的估计量了。说,我们不能得到比最小二乘估计量更理想的估计量了。可可是是,不不应应忘忘记记,我我们们得得到到这这一一理理想想的的结结果果是是有有条条件件的的,我们在导出最小二乘估计量之前所规定的五个假设条件是:我们在导出最小二乘估计量之前所规定的五个假设条件是:(1)E(ut)=0,t=1,2,n 即各期扰动项的均值(期望值)均为即各期扰动项的均值(期望值)均为0。(2)E(uiuj)=0,ij 即各期扰动项互不相关。即各期扰动项互不相关。(3)E(ut2)=,t=1,2,n 即各期扰动项的方差是一常数。即各期扰动项的方差是一常数。(4)为非随机量,为非随机量,t=1,2,n(5)ut N(0,),t=1,2,n 即各期扰动项服从正态分布。即各期扰动项服从正态分布。我我们们现现在在需需要要考考虑虑的的是是,如如果果假假设设条条件件中中的的某某些些条条件件不不成成立立,会会有有什什么么情情况况?在在比比较较弱弱的的情情况况下下,估估计计量量的的上上述述统统计计性性质质能能否否成成立立?如如果果不不成成立立,能能否得到一些比较弱的统计性质?否得到一些比较弱的统计性质?这这些些问问题题,如如出出现现异异方方差差性性(第第(3)个个条条件件不不成成立立)和和自自相相关关(第第(2)个个条条件件不不成成立立)的的情情形形,我们将在后面的教学内容中予以讨论。我们将在后面的教学内容中予以讨论。我我们们这这里里提提出出这这样样一一些些问问题题,目目的的是是使使

    注意事项

    本文(ets3 双变量线性回归模型.ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开