计量经济学课件3.pptx
1本章主要介绍以下内容:第一节双变量线性回归模型的估计第二节最小二乘法估计量的性质第三节拟合优度的测度第四节双变量回归中的区间估计和假设检验第五节预测第六节有关最小二乘法的进一步讨论第1页/共113页2第一节 双变量线性回归模型的估计 一.双变量线性回归模型的概念 1.双变量线性回归模型的形式 总体线性回归模型(方程)(直线)需求函数Q=Pu(3.1)凯恩斯消费函数C=Du(3.2)双变量总体线性回归模型的一般形式为:Y=Xu(3.3)第2页/共113页3 设Y表示消费,X表示收入,则凯恩斯消费函数计量经济模型为 Y=Xu 其中 u 为扰动项或误差项,Y为因变量或被解释变量,X为自变量或解释变量。和为未知参数。第3页/共113页4 设有Y和X的n对观测值数据,则根据(3.3)式,变量Y的每个观测值由下式决定:Yi=+Xi+ui,i=1,2,.,n (3.4)在实践中,(3.4)式称为双变量线性总体回归模型或简单线性总体回归模型。其中 和 为未知的总体参数,也称为回归模型的系数(coefficients),下标 i是观测值的序号。当数据为时间序列时,用下标 t来表示观测值的序号,从而(3.4)式变成 Yt=+Xt+ut,t=1,2,.,n (3.5)第4页/共113页5下面对总体线性回归模型Yi=+Xi+ui,i=1,2,.,n (3.4)作进一步分析:Xi为非随机变量,ui、Yi为随机变量;若对每个给定的Xi值反复观测Yi,可得一系列与给定的Xi相关的Yi值,ui服从正态分布,故Yi也服从正态分布,期望值记为E(Yi),方差记为Var(Yi)。第5页/共113页6在各个给定Xi值条件下Yi的期望值轨迹也称为总体回归模型(方程)。即E(Yi)=+Xi。此模型也可通过对(3.4)两边取期望得到,即E(Yi)=E(+Xi+ui)=+Xi+E(ui)=+Xi (E(ui)=0),图示如下:第6页/共113页70 x1 x2 x3 xn-1 xn xYE(Yi)E(Yi)=+XiY3E(Y3)u3 ui=Yi-E(Yi)总体回归模型图示第7页/共113页8样本线性回归模型(方程)(直线)给出了总体回归方程E(Yi)=+Xi,希望能求出总体回归参数和,但对Yi进行足够多次反复观测不现实,故Yi的总体分布未知,E(Yi)未知,从而和的真值不可能求出。第8页/共113页9但对于每一个Xi,可随机抽取一个样本值Yi(作一次观测),可得n对样本观测值(Xi,Yi)(i=1,2,.,n)。使用某种估计方法寻找一条与样本观测值拟合最好的直线去近似地代替总体回归直线,这条直线就称为样本回归直线。相应的估计方程称为样本回归方程,即 第9页/共113页10式中 ,为样本回归参数,是总体参数和的估计,为因变量的估计值或者说拟合值,也可以说预测值,Yi与 的差称为残差,记为 故样本回归模型也可表达成ei可作为ui的估计.图示如下第10页/共113页110 x1 x2 x3 xn-1 xn xYE(Yi)E(Yi)=+XiY1E(Y1)u2 ui=Yi-E(Yi)=Yi-Xi总体、样本回归模型图示Yn第11页/共113页122.为何要在模型中包括扰动项u 在前面已初步作了阐述,下面进一步说明:(1)模型省略了变量变量间真正的关系是Y=f(X1,X2,),但X2,X3,相对不重要,用u代表之。(2)数学模型形式的误差两变量之间的关系可能不是严格线性的,u反映了与直线的偏差。第12页/共113页13 (3)经济现象的随机性质经济行为是随机的,用Y=+X解释“平均、典型”的行为,而用u来表示个体偏差。(4)测量与归并误差总会出现测量与归并误差,使得任何精确的关系不可能存在。即 其中 ,是消费和收入的真实值,而实际测量的消费和收入值为Y和X,则模型应为 Y=+X+u第13页/共113页14 二.普通最小二乘法(OLS法,Ordinary Least squares)1.1.双变量线性回归模型的双变量线性回归模型的统计假设统计假设模型:模型:Y Yt t=+X Xt t+u+ut t,t=1,2,.,n,t=1,2,.,n由由Y Y和和X X的观测值(即的观测值(即样本数据样本数据)来估计)来估计 和和 的的值值,常用的估计方法就是,常用的估计方法就是最小二乘最小二乘法法。应用最小二乘法,应用最小二乘法,要得到好的估计量要得到好的估计量,模型需要满足一些统计假设条件。模型需要满足一些统计假设条件。第14页/共113页15双变量线性回归模型的统计假设 (1)(1)E(uE(ut t)=0)=0,t=1,2,.,n,t=1,2,.,n 即各期扰动项的均值即各期扰动项的均值(期望值期望值)为为0.0.(2)Cov(u2)Cov(ui i,u,uj j)=E(u)=E(ui iu uj j)=0 i)=0 i j j 即各期扰动项互不相关即各期扰动项互不相关.(3)(3)Var(uVar(ut t)=E(u)=E(ut t2 2)=)=2 2 ,t=1,2,.,n t=1,2,.,n 即各期扰动项方差是一常数即各期扰动项方差是一常数.(4)(4)解释变量解释变量X Xt t 为非随机变量为非随机变量,即即X Xt t的取值是确定的的取值是确定的,或或Cov(XCov(Xt tu ut t)=0,t=1,2,.,n)=0,t=1,2,.,n (5)(5)u ut t N(0,N(0,2 2),t=1,2,.,n,t=1,2,.,n 即各期扰动项服从正态分布即各期扰动项服从正态分布.第15页/共113页16下面简单讨论一下上述假设条件。(1)E(ut)=0,t=1,2,n扰动项被认为是对因变量产生微小影响的多种次要因素的总和。平均来看,给定Xt值,ut随机取值,有正有负,有相互抵消的趋势,因此扰动项均值为0的假设是合理的。第16页/共113页17(2)Cov(ui,uj)=0 i j假定各期扰动项之间无自相关或无序列相关。实际上该假设等同于:E(uiuj)=0 i j这是因为:cov(ui,uj)=Eui-E(ui)uj-E(uj)=E(uiuj)根据假设(1)(3)Var(ut)=E(ut2)=2,t=1,2,n假定各期扰动项的方差是一常数,各扰动项具有同方差性。Var(ut)=Eut-E(ut)2=E(ut2)根据假设(1)第17页/共113页18(4)Xt为非随机变量 即Xt的取值是确定的,而不是随机的。有的书上采用弱一些的条件:Cov(Xtut)=E(Xt-E(Xt)(ut-E(ut)=E(Xtut)=0,t=1,2,n 即解释变量X与扰动项u不相关。(5)ut N(0,2),t=1,2,.,n 即扰动项服从正态分布。因为ut代表了所有未列入模型的那些次要因素的综合影响,由中心极限定理,只要这些次要因素相互独立,且数量足够多,则ut趋于正态分布。第18页/共113页19 满足条件(1)(4)的线性回归模型称为古典线性回归模型(CLR模型)。为什么要有这些条件?如果不满足,会出现什么情况?将在后面讨论。第19页/共113页202.最小二乘原理总体模型为Yt=+Xt+ut,若有X和Y的一组观测值(X1,Y1),(X2,Y2),.,(Xn,Yn),如何求出和 的估计值 和 ,使得估计结果最佳。直观上看,也就是要求在X和Y的散点图上根据各观测点画出一条“最佳”直线,如下图所示。第20页/共113页21 *YXXt 图 2 Yt0et第21页/共113页22第一部分是Yt的拟合值或预测值 :,t=1,2,n第二部分是et,代表观测点对于回归线的误差,称为拟合或预测的残差residuals:,t=1,2,n即 ,t=1,2,n拟合的直线 称为拟合的回归线.对于任何数据点(Xt,Yt),此直线将Yt 的总值 分成两部分。第22页/共113页23如何决定估计值 和?最小二乘法就是选择一条直线,使其残差平方和达到最小值的方法。即选择 和 ,使得直观地看,要求估计的直线尽可能地靠近各观测点,这意味着应使各残差尽可能地小。要做到这一点,就必须用某种方法将每个点相应的残差加在一起,使其达到最小。理想的测度是残差平方和,即第23页/共113页24 运用微积分知识,使上式达到最小值的必要条件为:即达到最小值。第24页/共113页25整理,得:此二式称为正规方程。解此二方程,得:第25页/共113页26其中:样本均值 离差第26页/共113页27(5)式和(6)式称为线性回归模型 Yt=+Xt+ut 的参数 和 的普通最小二乘估计量(OLS estimators)。估计值是从一组具体观测值用公式计算出的数值。一般说来,好的估计量所产生的估计值将相当接近参数的真值,即好的估计值。可以证明,对于CLR模型,普通最小二乘估计量正是这样一个好估计量。第27页/共113页283.例子 例1 对于前面的凯恩斯消费函数,若根据数据得到:则有因而第28页/共113页29例2 设Y和X的5期观测值如下表所示,试估计方程 Yt=+Xt+ut 序号 1 2 3 4 5 Yt 14 18 23 25 30 Xt 10 20 30 40 50 解:采用列表法计算。计算过程如下:第29页/共113页30序号序号YtXtyt=Yt-xt=Xt-xtyt11410-8-2016040021820-4-1040100323301000425403103010053050820160400n=5 Yt=110 Xt=150 yt=0 xt=0 xtyt=390 =1000第30页/共113页31估计方程为第31页/共113页32实例:有一个由美国212个家庭组成的随机样本,根据OLS法得到的回归方程如下:其中,Y表示家庭支付的联邦收入税,X表示家庭收入,它们均以千美元度量。第32页/共113页33大多数情况,截距没有明显的经济含义。本例从字面上解释截距就是家庭收入为零时的税赋,即家庭收入为零时的税赋为-1924美元,实际上就是政府付给家庭1924美元。回归结果表明:在其他条件不变的情况下,家庭收入每增加1000美元,平均而言,税收将增加190美元。第33页/共113页34实例:布鲁金斯学会主席,美国前总统经济顾问委员会主席奥肯根据美国1947-1960年的数据,得到如下回归方程,称之为奥肯定律:其中Y表示失业率的变动百分数,X表示实际产出的增长率百分数,用实际GNP度量,2.5是对美国历史观察得到的长期产出增长率。第34页/共113页35本例中,截距为零,斜率为-0.4。奥肯定律的含义是实际GNP的增长每超过2.5一个百分点,失业率将降低0.4个百分点。奥肯定律被用来预测为使失业率减少到一定的百分点而所需的实际GNP的增长率。因此,实际GNP的增长率为5时,将使失业率减少一个百分点,若要使实际GNP的增长率达到7.5,则需减少失业率2个百分点。第35页/共113页36实例:名义汇率与相对价格之间的关系下表给出了德国马克与美元之间的汇率 一美元兑换多少德国马克,以及两个国家的消费者价格指数。第36页/共113页37年份年份GM/$美国美国CPI德国德国CPI年份年份 GM/$美国美国CPI德国德国CPI19801.8175 82.486.71988 1.7570 118.3106.319812.2632 90.992.21989 1.8808 124.0109.219822.4281 96.597.11990 1.6166 130.7112.219832.5539 99.6100.31991 1.6610 136.2116.219842.8455 103.0102.71992 1.5618 140.3120.919852.9420 107.6104.81993 1.6545 144.5125.219862.1705 109.6104.71994 1.6216 148.2128.619871.7981 113.6104.9第37页/共113页38令Y代表德国马克对美元的汇率,X代表美国与德国的消费者价格指数之比,即X表示了两个国家的相对价格。得到如下回归方程:在这个回归方程中,斜率为-4.318,表明在1980-1994年期间,相对价格每上升一单位,平均而言,马克对美元的汇率下降4.318个单位,即美元将会贬值,因为一美元将兑换更少的德国马克。第38页/共113页39斜率的经济含义是:如果价格在美国上涨得比在德国上涨得快,则美国国内的消费者将转向消费德国产品,因此对马克的需求上升;从而导致马克的增值。这就是购买力平价理论的实质。截距6.682表示若相对价格为零,则马克对美元汇率的均值为6.682,即1美元可以兑换6.682德国马克。但这种解释并没有什么经济意义。第39页/共113页40第二节 最小二乘法估计量的性质一.和 的均值第40页/共113页41即第41页/共113页42两边取期望值,有:假设(4)=假设(1)这表明,是的无偏估计量。在证明 无偏性的过程中,仅用到(1)和(4)两条假设条件。第42页/共113页43即即 是是 的无偏估计量。的无偏估计量。由 ,我们有:第43页/共113页44二二.和和 的方差的方差 Var()=E -E()2 根据定义 =E(-)2 由无偏性E()=由上段结果:即 第44页/共113页45两边取期望值,得:第45页/共113页46由于E()=2,t=1,2,n 根据假设(3)E(ui uj)=0,ij 根据假设(2)所以即与此类似,可得出:第46页/共113页47三三.高斯高斯-马尔柯夫定理马尔柯夫定理(Gauss-Markov Theorem)对于满足统计假设条件(1)-(4)的线性回归模型Yt=+Xt+ut,普通最小二乘估计量 (OLS估计量)是最佳线性无偏估计量(BLUE,The Best Linear Unbiased Estimator)。或者说对于古典线性回归模型(CLR模型)Yt=+Xt+ut,普通最小二乘估计量(OLS估计量)是最佳线性无偏估计量(BLUE)。第47页/共113页48下面以估计量 为例加以说明:1.无偏性根据第一段的结果E()=可知 具有无偏性2.线性性根据第一段的结果有这表明,是诸样本观测值Yt(t=1,2,n)的线性函数,故 是线性估计量。3.最佳性,即 的方差小于等于的其他任何线性无偏估计量的方差,可以证明这一点。有兴趣的同学请参见教科书。第48页/共113页49四、和 的分布前面的假设条件(5)ut N(0,2),t=1,2,.,n表明各期ut服从均值为0、方差为2的正态分布。由假设条件(4),Xt为非随机量,再由前面结果:第49页/共113页50这表明,是N个正态分布变量u1,u2,,un的线性函数,因而亦为正态分布变量,即类似的有:第50页/共113页51如果各观测点紧密地聚集在这条直线的周围,则表明该直线对Y和X之间关系的描述是好的;否则,用直线来描述这两个变量之间的关系就未必恰当,如下图所示:第三节 拟合优度的测度一、拟合优度(Goodness of fit)的概念OLS法得到的回归直线从残差平方和为最小这一意义上来说是所有可能直线中最佳的拟合线。但该直线是不是Y和X之间关系的一种恰当的描述呢?第51页/共113页52图3-3(a)恰当描述(b)不恰当描述 第52页/共113页53对于任意两个变量的一组观测值,总可以用OLS法得到一条直线,但该直线能否较好地拟合所给定的观测值,这就是拟合优度问题。拟合优度是变量之间相关关系强度的测度。在这里,指的是两变量间线性关系强度的测度。如果所有观测值都落在回归直线上,则称为“完全拟合”,这种情况是罕见的。在一般情况下,总会出现正负残差et,通过对这些残差的分析,有助于衡量回归直线拟合样本数据点的程度。第53页/共113页54二、Y的变差(离差)的组成有Y的N个观测值,Y的总变差的一个测度是 ,Y的变差()中有一部分是可以由X的取值变动所解释的。还有一部分是不能由X所解释的变差,如下图所示:第54页/共113页55(Y的变差)图3-40第55页/共113页56对于第t个观测值,有:对于全部n项观测值平方求和,有:(7)由于所以第56页/共113页57(7)式中最后一项变为:由(1)式、(2)式和残差的定义,显然有:和因此,(7)式中最后一项为0,得到如下结果:(8)即 总变差 =由X解释的变差+未解释变差第57页/共113页58三.拟合优度的测度1.决定系数不难看出,总变差中由X解释的变差比例越大,则 就越小,各观测值聚集在回归直线周围的紧密程度就越大,说明直线与观测值的拟合越好。将(8)式两端都除以总变差 ,得:并定义决定系数 为:第58页/共113页59用符号表示为:其中,ESSExplained Sum of Squares RSSResidual Sum of Squares TSSTotal Sum of Squares决定系数决定系数 R2 计量了Y的总变差中可以由X的变动来解释的比例。它是回归线对各观测点拟合紧密程度的测度。第59页/共113页60R2=1:完全拟合,R2=0:X与Y完全不存在线性关系,R2的值越高,拟合得越好。但什么是高?回归中使用时间序列数据还是横截面数据有不同的标准。对时间序列数据来说,R2 的值在0.8、0.9 以上是很常见的事,而在横截面数据的情况下,0.4、0.5的 R2 值也不能算低。第60页/共113页612.相关系数 r 相关系数r与决定系数R2的关系为:R2=r2,相关系数的计算公式为:相关系数r也是拟合优度的测度,其符号取决于 的符号(即 的符号)-1 r 1,r=1:完全正相关 r=-1:完全负相关 r=0:无线性关系第61页/共113页62第四节 双变量回归中的区间估计和假设检验一、的置信区间上一节中已得出,在5条假设条件成立的情况下,有估计量的标准差(standard deviation),通常称为标准误差(standard error),用Se或SE表示。第62页/共113页63的标准误差为:Se()=如果为已知,则总体参数的95%的置信区间为:第63页/共113页64一般无法知道ut的方差2,要用样本数据估计出2。1、2 的估计可以用残差来估计扰动项 ut 的方差2:可以证明,是2的无偏估计量.上式中的 ,我们可以直接从残差的定义式 得到,也可以通过下面的公式求出:第64页/共113页65推导如下:因而由et的定义及 的计算公式,有:第65页/共113页66将 代入栝号中,得:因此有:第66页/共113页672、的置信区间我们重新定义 的标准误差为:Se()=则估计统计量 t(n-2)故的置信区间为:即 第67页/共113页68且 =64,=37,=44,n=10求的95%置信区间例:设回归方程为:解:的95%置信区间为:=0.582.3060.21 即为0.10至1.06。也就是说,有95%的把握说在0.10至1.06之间。第68页/共113页69二、假设检验1、假设检验的方法进行假设检验要使用重要结果 t=t(n-2)假设检验的步骤:(1)建立关于总体的原假设和备择假设;(2)计算检验统计量,检验原假设(是否出现小概率事件);(3)得出关于原假设是否合理的结论.第69页/共113页70例例3.33.3:仍用上例3.2的数据,要检验的是:原假设:H0:=0.8 备择假设:H1:0.8解:这是一个单侧检验的问题。有:用=n-2=10-2=8查t表,截断左侧5%面积的 t 临界值 tc=-1.86因为t=-1.05-1.86故接受原假设H0,即=0.8第70页/共113页71图3.5第71页/共113页722、系数的显著性检验 在假设检验中,有关是否为0的假设检验特别重要。如果通过检验,接受=0的原假设,则表明X和Y没有关系,即X对Y的变动没有影响。在这种情况下,就应从模型中剔除X,寻找其他解释变量。这类检验称为系数的显著性检验。第72页/共113页73例3.4 仍用例3.2数据进行的显著性检验。原假设:H0:=0 备择假设:H1:0解:查t表,tc=t0.025(8)=2.306 因为t=2.76 tc=2.306故拒绝原假设H0。结论:显著异于0,X对Y有影响。第73页/共113页74图3-6第74页/共113页75三、回归结果的提供和分析同样可得出原假设H0:=0的t值:1、回归结果的提供提供回归分析结果一般有两种方式:1)=6.70 +0.58X R2=0.49 (1.38)(2.76)我们已得到原假设H0:=0的t值:这里6.70和0.58分别为和的估计值 和 。括号中数字是H0:=0和H0 :=0 为真时的 t 值。第75页/共113页762、回归结果的分析结果的分析主要包括以下内容:(1)系数的说明。首先是说明系数的符号是否正确,是否符合经济理论和常识。其次是说明系数的含义,斜率系数为0.58,表明X增加一个单位,Y增加0.58个单位(如收入X增加1元,消费Y增加0.58元);(2)=6.70+0.58X R2 =0.49 (4.86)(0.21)括号中提供的是 和 的标准误差第76页/共113页77截距6.70的含义是X为0时Y的值。截距项有时有经济意义,大多数情况下无。(2)拟合情况。R2不高,作为时间序列数据,拟合不理想。(3)系数的显著性。斜率系数的t值为2.76,表明该系数显著异于0,X对Y有影响。(4)根据DW检验值说明是否存在扰动项的自相关。第77页/共113页78实例:关于前面名义汇率与相对价格之间的关系一例,其完整回归结果如下:P值是把由样本观测值计算的t检验值作为临界值查表所得的概率,它是拒绝原假设的最低显著性水平。第78页/共113页79从上面的回归结果可以看出:截距和斜率都显著不为0,因为P值都很小。若给定显著性水平为0.01,则t的P值小于0.01,故拒绝=0的原假设,犯第一类错误的概率非常小,约为0.002。R2值为0.5828,表示两个国家的相对价格解释了马克对美元的汇率变动的53%.第79页/共113页80第五节 预测 用OLS法对双变量模型的参数进行了估计之后,如果结果理想,则可用估计好的模型进行预测。第80页/共113页81一、预测的概念预测通常指利用现有信息预测未来。在这里,预测指的是对自变量的某一具体值X0,来预测与它相对应的因变量值Y0。它既可以指对未来某个时期因变量值的预测,也可以是对未包括在横截面样本之中的某个实体数值的预测。第81页/共113页82二、预测的隐含假设对于样本观测值数据成立的X和Y之间的关系对于新的观测值也成立。即若双变量模型的原设定是:Yt =+Xt+ut,t=1,2,n要使此模型可以用来作为预测的依据,还应有:Y0=+X0+u0 也成立。第82页/共113页83三.预测的误差 有两种类型的预测值:点预测值和区间预测值。点预测值由与X0对应的回归值给出,即而预测期的实际Y值由下式给出:其中 u0 是从预测期的扰动项分布中所取的值。Y的点预测值与实际值一般不相等,会存在误差。第83页/共113页84预测误差的来源 (1)模型中包含扰动项,点预测值是假定预测期扰动项u0为 0,而实际上一般不为0。(2)点预测值公式中用的是和的估计值 和 ,样本估计值 和 一般不等于总体参数和。第84页/共113页85预测误差可定义为:两边取期望值,得因此,OLS 预测量 是一个无偏预测量。第85页/共113页86 预测误差的方差为:其它两项协方差等于0。这是因为u0独立于u1,u2,un,而 和 均为 u1,u2,un 的线性函数,因此它们与u0的协方差均为0。将我们在前面得到的 和 的方差及协方差代入上式,得:第86页/共113页87注:第一个等号用到 第87页/共113页88由于 是未知的,用其估计值 代替它,有四、Y0的置信区间 从e0的定义可看出,e0为正态变量的线性函数,因此,它本身也服从正态分布。故 N(0,1)第88页/共113页89 t(n-2)则 的95%置信区间为:(其中,)这一置信区间的宽度从样本均值 处向两边对称地增加,如下图所示:第89页/共113页90 0 X0 X Y图3-7第90页/共113页91第91页/共113页92即15.24至21.76,也就是说,有95%的把握预测Y0 将位于15.24至21.76之间。解:对于 点预测值 =1+1.7510=18.5 Y0的95%置信区间为:第92页/共113页93例3.6且 ,现有一对新观测值,试问它们是否可能来自产生样本数据的同一总体?解:问题可化为“预测误差是否显著地大?”当 时,预测误差第93页/共113页94原假设 H0:备择假设H1:检验:若H0为真,则对于n-2=8个自由度,查表得5%显著性水平检验的t临界值为:即第94页/共113页95结论:由于 故接受原假设,即新观测值与样本观测值来自同一总体 上例的意义在于,可以通过从估计模型用的一组观测值中剔除最近期的一两对观测值,用它们来检验模型的预测功效。如果在上述检验中拒绝了原假设,则不管是什么原因,都要认真对待,回过头来检查模型的设定是否正确。例3 书P61例3.7第95页/共113页96*第六节 有关最小二乘法的进一步讨论一有关应用最小二乘法的前提的进一步讨论在一定的假设条件下,运用普通最小二乘法,可得到双变量线性模型系数和的最小二乘估计量 和 。它们是最佳线性无偏估计量(BLUE)。第96页/共113页97双变量线性回归模型的假设 (1)E(ut)=0,t=1,2,.,n 即各期扰动项的均值(期望值)为0.(2)Cov(ui,uj)=E(uiuj)=0 i j 即各期扰动项互不相关.(3)Var(ut)=E(ut2)=2 ,t=1,2,.,n 即各期扰动项方差是一常数.(4)解释变量Xt 为非随机变量,即Xt的取值是确定的,或Cov(Xtut)=0,t=1,2,.,n (5)ut N(0,2),t=1,2,.,n 即各期扰动项服从正态分布.第97页/共113页98 如果某些假设条件不能满足,就要考虑采用其它估计方法,不能生搬硬套OLS法。尽管因此而得不到一个具备OLS估计量那么理想的统计性质的估计量,但比起硬套普通最小二乘法而得到一个统计性质很差的估计量来说,要好得多。第98页/共113页99二渐近性质 下面简单讨论一下第(4)条假设,即Xt为非随机量的假设不成立的情况。第(4)条假设是一个比较强的假设,它表明解释变量的观测值Xt是非随机的,因而与各期扰动项无关。由此,证明了OLS估计量的无偏性,也不难证明OLS估计量的一致性。由统计学得知,一致性(即估计量 是一致估计量)的充分条件是:第99页/共113页100对于OLS估计量,我们有 对于任何n成立,并且当n趋向无穷时,有因此,的一致估计量,即也就是说,如果满足第(4)条假设,即Xt为非随机的,则OLS估计量既是无偏的,又是一致的。第100页/共113页101当假设条件(4)有所减弱时情况会怎样呢?可以证明:(1)即使解释变量是随机的,只要每一个Xt都独立于所有的扰动项ut(t=1,2,n),则我们在证明无偏性时所用的式子 ,t=1,2,n中的权数kt将独立于相应的扰动项ut,因而无偏性和一致性仍将成立。第101页/共113页102 (2)如果再减弱一点,只有Xt独立于相应的扰动项ut(即解释变量与扰动项同期无关),则无偏性不再成立,但一致性仍将成立。因此,根据具体情况,有时不得不满足于所得到的模型参数的估计量仅仅是一致估计量这一差强人意的结果。在后面介绍分布滞后模型和联立方程模型时,将作进一步讨论。第102页/共113页103 此外,假如仅仅是第(5)条假设,即ut服从正态分布的假设不成立,则虽然仍可证明OLS估计量为BLUE,但不可能再证明OLS估计量服从正态分布。在这种情况下,只有转而求助于渐近正态性,即只要观测值的数目足够多,我们仍可假定OLS估计量近似地服从正态分布。第103页/共113页104第三章 小结本章主要结果:一、最小二乘法 若双变量线性模型 Yt+Xt+ut 满足下列统计假设(1)E(ut)=0 扰动项均值为0(2)E(uiuj)=0,i j扰动项相互独立(3)E(ut2)=2 常数方差(4)X是非随机的(5)ut服从正态分布第104页/共113页105第105页/共113页106二、拟合优度决定系数和相关系数 为最小二乘回归线拟合优度的测度,即回归线对各观测点拟合紧密程度的测度,且R2=(r)2。第106页/共113页107第107页/共113页108四、预测 假设我们有一组样本观测值Xt和Yt,我们用最小二乘法对双变量模型的参数进行了估计。现要对自变量的一具体值X0来预测与X0相应的因变量值Y0。若原模型设定 Yt=+Xt+ut对预测期也成立,即 Y0=+X0+u0 则因变量的点预测值为:第108页/共113页109其方差为 我们有 t(n-2)Y0的95%的置信区间为 第109页/共113页110第三章 习题1、设有10个工人的数据如下:X 10 7 10 5 8 8 6 7 9 10 Y 11 10 12 6 10 7 9 10 11 10其中 X为劳动工时,Y为产量1)试估计Y=+X+u2)提供回归分析结果(按标准格式)并适当说明3)检验原假设=1.0 第110页/共113页111 2、用12对观测值估计出的消费函数为Y=10.0+0.90X,且已知 =0.01,=200,=4000,试预测当X=250时Y的值,并求Y的95%置信区间。第111页/共113页1123、请对下列说法进行判断,答案为下列二者之一:对,错。(1)若线性回归模型满足假设条件(1)-(4),但扰动项不服从正态分布,则尽管OLS估计量不再是BLUE,但仍为无偏估计量。(2)最小二乘斜率系数的假设检验所依据的是t分布,要求的抽样分布是正态分布。第112页/共113页113感谢您的观看!第113页/共113页