第三章 双变量线性回归模型教学课件 计量经济学.pptx
《第三章 双变量线性回归模型教学课件 计量经济学.pptx》由会员分享,可在线阅读,更多相关《第三章 双变量线性回归模型教学课件 计量经济学.pptx(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章双变量线性回归模型教学课件计量经济学第三章 双变量线性回归模型 (简单线性回归模型)(Simple Linear Regression Model)第一节第一节 双变量线性回归模型的估计双变量线性回归模型的估计第二节第二节 最小二乘估计量的性质最小二乘估计量的性质第三节第三节 拟合优度的测度拟合优度的测度第四节第四节 双变量回归中的区间估计和假设检验双变量回归中的区间估计和假设检验第五节第五节 预测预测第一节第一节 双变量线性回归模型的估计双变量线性回归模型的估计一、一、双变量线性回归模型的概念双变量线性回归模型的概念 我们在上一章给出的需求函数的例子我们在上一章给出的需求函数的例子 Q
2、=+P+u (1)是一个双变量线性回归模型,模型中是一个双变量线性回归模型,模型中只有两个变量,只有两个变量,一个因变量,一个解释变量一个因变量,一个解释变量,由解释变量的变动来解,由解释变量的变动来解释因变量的变动,或者说用因变量对解释变量进行线释因变量的变动,或者说用因变量对解释变量进行线性回归,因而称为性回归,因而称为双变量线性回归模型双变量线性回归模型,亦称,亦称简单线简单线性回归模型性回归模型或是或是一元线性回归模型一元线性回归模型。(3)式称为式称为双变量线性回归模型双变量线性回归模型或或简单线性回归模型简单线性回归模型或或一元线性回归模型一元线性回归模型。其中。其中 和和 为未知
3、的总体参数,为未知的总体参数,也也称为称为回归模型的系数(回归模型的系数(coefficients)。)。下标下标 i是是观测值的序号。观测值的序号。设我们有设我们有Y和和X的的n对观测值数据,则根据对观测值数据,则根据(1)式,变式,变量量Y的每个观测值应由下式决定:的每个观测值应由下式决定:Yi=+Xi+ui,i=1,2,.,n (3)当数据为时间序列时,往往用当数据为时间序列时,往往用下标下标 t来表示来表示观测值的观测值的序号,从而(序号,从而(3)式变成)式变成 Yt=+Xt+ut,t=1,2,.,n (3*)为何要在模型中包括扰动项为何要在模型中包括扰动项u 我我们们在在上上一一章
4、章中中已已初初步步介介绍绍了了为为什什么么要要在在模模型型中中包包括扰动项括扰动项u,下面进一步说明之:,下面进一步说明之:(1)真真正正的的关关系系是是Y=f(X1,X2,),但但X2,X3,相对不重要,用相对不重要,用u代表之。代表之。(2)两两变变量量之之间间的的关关系系可可能能不不是是严严格格线线性性的的,u反反映了与直线的偏差。映了与直线的偏差。(3)经济行为是随机的,我们能够用)经济行为是随机的,我们能够用 Y=+X 解释解释“典型典型”的行为,而用的行为,而用u来表示个体偏差。来表示个体偏差。(4)总总会会出出现现测测量量误误差差,使使得得任任何何精精确确的的关关系系不不可能存在
5、可能存在。(一)双变量线性回归模型的统计假设(一)双变量线性回归模型的统计假设 我们的模型是:Yt=+Xt+ut,t=1,2,.,n 这里 和 为未知总体参数,下一步的任务是应用统计学的方法,由Y和X的观测值(即样本数据)来估计和 的总体值,常用的估计方法就是最小二乘法。为了应用最小二乘法,得到好的估计量,双变量线性回归模型需要满足一些统计假设条件。二、二、普通最小二乘法普通最小二乘法(OLS法法,Ordinary Least squares)(1)E(ut)=0,t=1,2,.,n 即各期扰动项的均值即各期扰动项的均值(期望值期望值)为为0.(2)COV(ui,uj)=E(uiuj)=0 i
6、 j 即各期扰动项互不相关即各期扰动项互不相关.(3)Var(ut)=E(ut2)=2 ,t=1,2,.,n 即各期扰动项方差是一常数即各期扰动项方差是一常数.双变量线性回归模型的统计假设双变量线性回归模型的统计假设 (4)解释变量解释变量Xt 为非随机量为非随机量 即即Xt的取值是确定的的取值是确定的,而不是随机的而不是随机的.(5)ut N(0,2),t=1,2,.,n 即各期扰动项服从正态分布即各期扰动项服从正态分布.满足条件满足条件(1)-(4)的线性回归模型称为的线性回归模型称为古典线性古典线性(或是经典线性)回归模型(或是经典线性)回归模型 (CLR模型模型)下面简单讨论一下上述假
7、设条件。下面简单讨论一下上述假设条件。(1)E(ut)=0,t=1,2,n 即各期扰动项的均值(期望值)均为即各期扰动项的均值(期望值)均为0。均均值值为为0的的假假设设反反映映了了这这样样一一个个事事实实:扰扰动动项项被被假假定定为为对对因因变变量量的的那那些些不不能能列列为为模模型型主主要要部部分分的的微微小小影影响响。没没有有理理由由相相信信这这样样一一些些影影响响会会以以一一种种系系统统的的方方式式使使因因变变量量增增加加或或减减小小。因因此此扰扰动动项项均均值值为为0的的假假设设是是合理的。合理的。(2)E(uiuj)=0,ij 即即各各期期扰扰动动项项互互不不相相关关。也也就就是是
8、假假定定它它们们之之间间无无自相关或无序列相关。自相关或无序列相关。实际上该假设等同于:实际上该假设等同于:cov(ui,uj)=0,ij这是因为:这是因为:cov(ui,uj)=Eui-E(ui)uj-E(uj)=E(uiuj)根据假设(根据假设(1)(3)E(ut2)=2,t=1,2,n 即即各各期期扰扰动动项项的的方方差差是是一一常常数数,也也就就是是假假定定各各扰扰动项具有同方差性。动项具有同方差性。实际上该假设等同于:实际上该假设等同于:Var(ut)=2,t=1,2,n这是因为:这是因为:Var(ut)=Eut-E(ut)2=E(ut2)根据假设(根据假设(1)(4)Xt为非随机量
9、为非随机量 即即Xt的取值是确定的的取值是确定的,而不是随机的。而不是随机的。事事实实上上,我我们们后后面面证证明明无无偏偏性性和和时时仅仅需需要要解解释释变变量量X与与扰扰动动项项u不不相相关关,但但不不容容易易验验证证之之,因因而而通通常常采采用非用非随机量的假设随机量的假设。(5)ut N(0,2),t=1,2,.,n 即扰动项服从正态分布。即扰动项服从正态分布。(二)普通最小二乘法原理(二)普通最小二乘法原理 通常真实的回归直线是观测不到的。收集样本通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。的目的就是要对这条真实的回归直线做出估计。我们的任务是,
10、我们的任务是,在给定在给定X和和Y的一组观测值的一组观测值(X1,Y1),(X2,Y2),.,(Xn,Yn)的情况下的情况下,求出求出 Yt=+Xt+ut 中中 和和 的估计值的估计值 和和 ,使得拟合的直线使得拟合的直线为最佳。为最佳。直观上看,也就是要求在直观上看,也就是要求在X和和Y的散点图上穿过各观的散点图上穿过各观测点画出一条测点画出一条“最佳最佳”直线,如下图所示。直线,如下图所示。*et *YXXt 图图 1 YtYt残差残差拟合的回归线拟合的回归线拟合方程或估拟合方程或估计方程计方程 拟合的直线拟合的直线 称为称为拟合的回归线拟合的回归线.对于任何数据点对于任何数据点(Xt,Y
11、t),此直线将此直线将Yt 的总值的总值 分分成两部分。成两部分。第一部分是第一部分是Yt的的拟合拟合值或预测值值或预测值 :,t=1,2,n 第二部分,第二部分,et 代表观测点对于回归线的误差,称代表观测点对于回归线的误差,称为为拟合拟合或预测的残差或预测的残差(residuals):):t=1,2,n 即即 t=1,2,n残差残差残差平方和残差平方和 我们的目标是使拟合出来的直线在某种意义上是我们的目标是使拟合出来的直线在某种意义上是最佳的,直观地看,也就是最佳的,直观地看,也就是要求估计直线尽可能地靠要求估计直线尽可能地靠近各观测点,这意味着应使残差近各观测点,这意味着应使残差总体上总
12、体上尽可能地小。尽可能地小。要做到这一点,就必须用某种方法将每个点相应要做到这一点,就必须用某种方法将每个点相应的残差加在一起,使其达到最小。理想的测度是的残差加在一起,使其达到最小。理想的测度是残差残差平方和平方和,即,即 最小二乘法就是选择一条直线,使其残差平方和最小二乘法就是选择一条直线,使其残差平方和达到最小值的方法。即选择达到最小值的方法。即选择 和和 ,使得,使得达到最小值。达到最小值。运用微积分知识,使上式达到最小值的必要条件为:运用微积分知识,使上式达到最小值的必要条件为:即即整理,得:整理,得:此二式称为正规方程。解此二方程,得:此二式称为正规方程。解此二方程,得:.其中:其
13、中:离差离差样本均值样本均值估计量估计量 (5)式和()式和(6)式给出了)式给出了OLS法计算法计算 和和 的的公式,公式,和和 称为线性回归模型称为线性回归模型 Yt=+Xt+ut 的参数的参数 和和 的普通最小二乘估计量的普通最小二乘估计量(OLS estimators)。)。这两个公式可用于任意一组观测值数据,以求这两个公式可用于任意一组观测值数据,以求出截距和斜率的出截距和斜率的OLS估计值(估计值(estimates),估计值估计值是从一组具体观测值用公式计算出的数值。是从一组具体观测值用公式计算出的数值。一般说来,好的估计量所产生的估计值将相当一般说来,好的估计量所产生的估计值将
14、相当接近参数的真值,即好的估计值。可以证明,对接近参数的真值,即好的估计值。可以证明,对于于CLR模型,普通最小二乘估计量正是这样一个模型,普通最小二乘估计量正是这样一个好估计量。好估计量。例例1 设设Y和和X的的5期观测值如下表所示,试估计方程期观测值如下表所示,试估计方程 Yt=+Xt+ut 序号 1 2 3 4 5 Yt 14 18 23 25 30 Xt 10 20 30 40 50 解:我们采用列表法计算。计算过程如下:解:我们采用列表法计算。计算过程如下:(三)(三)例子例子序号序号YtXtyt=Yt-xt=Xt-xt ytxt211410-8-2016040021820-4-10
15、40100323301000425403103010053050820160400n=5110150003901000表表3154估计方程为:估计方程为:Eviews创建工作文件,输入数据并进行回归:Create u 1 5data x yls y c xobsobsCUCUYUYUPUPUCUCUYUYUPUPU19851985673.2673.2739.1739.1100100199719974185.644185.645160.35160.3359.1359.119861986798.96798.96899.6899.6107107199819984331.614331.615425.1
16、5425.1356.9356.919871987884.4884.41002.21002.2116.4116.4199919994614.914614.9158545854352.3352.3198819881103.981103.981181.41181.4140.5140.5200020004998499862806280355.1355.1198919891210.951210.951375.71375.7163.3163.3200120015309.015309.016859.66859.6357.6357.6199019901278.891278.891510.21510.2165.
17、4165.4200220026029.886029.887702.87702.8354354199119911453.811453.811700.61700.6173.8173.8200320036510.946510.948472.28472.2357.2357.2199219921671.731671.732026.62026.6188.8188.8200420047182.17182.19421.69421.6369.0015369.0015199319932110.812110.812577.42577.4219.2219.2200520057942.887942.8810493104
18、93374.8882374.8882199419942851.342851.343496.23496.2274.1274.1200620068696.558696.5511759.511759.5380.4769380.4769199519953537.573537.5742834283320.1320.1200720079997.479997.4713785.813785.8397.6155397.6155199619963919.473919.474838.94838.9348.3348.3例例2 1985-2007中国城镇居民家庭人均生活消费支中国城镇居民家庭人均生活消费支出(出(cu)
19、与人均可支配收入()与人均可支配收入(yu)Eviews创建工作文件,输入数据并进行回归:创建工作文件,输入数据并进行回归:步骤:步骤:(1)建立)建立workfileCreate a 1985 2007(2)输入和编辑数据)输入和编辑数据data cu yu puGenr cup=cu/pu*100Genr yup=yu/pu*100(3)建立cup与yup的散点图 scat yup cup(4)回归)回归 输入命令:输入命令:Ls cup c yup 查看统计结果,检验模型。查看统计结果,检验模型。对于满足统计假设条件对于满足统计假设条件(1)-(4)的线性回归模型的线性回归模型 Yt=+
20、Xt+ut ,,普通最小二乘估计量,普通最小二乘估计量 (OLS估估计量计量)是是最佳线性无偏估计量(最佳线性无偏估计量(BLUE)。或或 对于古典线性回归模型(对于古典线性回归模型(CLR模型)模型)Yt=+Xt,普通最小二乘估计量(普通最小二乘估计量(OLS估计量)是估计量)是最佳线性无最佳线性无偏估计量偏估计量(BLUE)。)。3.最小二乘估计量的特性:高斯最小二乘估计量的特性:高斯-马尔柯夫定理马尔柯夫定理(Gauss-Markov Theorem)1.无偏性无偏性(已证明)(已证明)2.线性线性 这这表表明明,是是诸诸样样本本观观测测值值Yt的的线线性性函函数数,故故 是是线线性性估
21、估计量。计量。3.最佳性最佳性 即即 的的方方差差在在所所有有线线性性无无偏偏估估计计量量中中是是最最小小的的。有有兴兴趣的同学请参见教科书(趣的同学请参见教科书(P39-40)我们在前面列出的假设条件(我们在前面列出的假设条件(5)表明,)表明,ut N(0,2),t=1,2,.,n 即各期扰动项服从均值为即各期扰动项服从均值为0、方差为、方差为 2的正态分布。的正态分布。考虑到假设条件(考虑到假设条件(4),即),即Xt为非随机量,则由前面结果:为非随机量,则由前面结果:=其中,其中,4.和和 的分布的分布 这这表表明明,是是N个个正正态态分分布布变变量量u1,u2,,un的的线线性函数,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三章 双变量线性回归模型教学课件 计量经济学 第三 变量 线性 回归 模型 教学 课件 计量 经济学
限制150内