第五讲异方差和自相关课件.ppt
第五讲异方差和自相关第1页,此课件共43页哦对于经典计量模型,我们的基本假设有:对于经典计量模型,我们的基本假设有:假设假设 对于解释变量的所有观测值,随机误差项有相对于解释变量的所有观测值,随机误差项有相同的方差。同的方差。第2页,此课件共43页哦此时可得:此时可得:在存在异方差的情况下:在存在异方差的情况下:因此,估计结果无偏,但不是有效的(随机误差项因此,估计结果无偏,但不是有效的(随机误差项方差变大)。方差变大)。第3页,此课件共43页哦误差项存在异方差:误差项存在异方差:U的方差的方差-协方差矩阵协方差矩阵Var(u)主对角线上的元素不相等主对角线上的元素不相等。第4页,此课件共43页哦异方差是违背了球型扰动项假设的一种情形。异方差是违背了球型扰动项假设的一种情形。在存在异方差的情况下:在存在异方差的情况下:(1)OLS 估计量依然是无偏、一致且渐近正估计量依然是无偏、一致且渐近正态的。态的。(2)估计量方差)估计量方差Var(b|X)的表达式不再是的表达式不再是2(XX)1,因为,因为Var(|X)2I。(3)Gauss-Markov 定理不再成立,即定理不再成立,即OLS不再是最佳线性无偏估计(不再是最佳线性无偏估计(BLUE)。)。第5页,此课件共43页哦一般截面数据容易产生异方差一般截面数据容易产生异方差而时间序列数据容易产生自相关而时间序列数据容易产生自相关第6页,此课件共43页哦异方差的检验异方差的检验1。残差图。残差图2。怀特检验。怀特检验3。Breusch-Pagan(BP)检验)检验4。G-Q 检验检验(Goldfeld-Quandt,1965)5。Szroeters 秩检验秩检验(Szreter,1978)后两种现在已经基本不用。后两种现在已经基本不用。第7页,此课件共43页哦1。画图:散点图和残差图。画图:散点图和残差图。第8页,此课件共43页哦1。残差图:。残差图:rvfplot(residual-versus-fitted plot)rvpplot varname(residual-versus-predictor plot)作图命令一定要在回归完成之后进行作图命令一定要在回归完成之后进行rvfplot yline(0)第9页,此课件共43页哦2。怀特检验:。怀特检验:第10页,此课件共43页哦第11页,此课件共43页哦第12页,此课件共43页哦2。怀特检验命令:。怀特检验命令:做完回归后,使用命令:做完回归后,使用命令:estat imtest,white第13页,此课件共43页哦Breusch and Pagan 检验检验根据异方差检验的基本思路,根据异方差检验的基本思路,Breusch and Pagan(1979)和)和Cook and Weisberg(1983)主要思路:用主要思路:用 ei2/avg(ei2)对一系列可能导致异方对一系列可能导致异方差的变量作回归。差的变量作回归。第14页,此课件共43页哦H0:a1=a2=.=0 (不存在)(不存在)H1:a1,a2.不全为不全为0 (存在)(存在)Step1:估计原方程,提取残差,并求其平方:估计原方程,提取残差,并求其平方ei2。Step2:计算残差平方和的均值:计算残差平方和的均值avg(ei2)。Step3:估计方程,被解释变量为:估计方程,被解释变量为ei2/avg(ei2),解解释变量依然为原解释变量。释变量依然为原解释变量。Step4:构造统计量:构造统计量Score=0.5*RSS服从自由度为服从自由度为k的的卡方分布。查表检验整个方程的显著性。卡方分布。查表检验整个方程的显著性。注意:在第注意:在第3步中,方便起见也可以用被解释变量的拟合值步中,方便起见也可以用被解释变量的拟合值作为解释变量。作为解释变量。第15页,此课件共43页哦3。BP 检验:做完回归后,使用命令:检验:做完回归后,使用命令:estat hettest,normal(使用拟合值(使用拟合值y)estat hettest,rhs(使用方程右边的解释变量,而不是(使用方程右边的解释变量,而不是y)最初的最初的BP 检验假设扰动项服从正态分布,有一定局限检验假设扰动项服从正态分布,有一定局限性。性。Koenker(1981)将此假定放松为)将此假定放松为iid,在实际中较,在实际中较多采用,其命令为:多采用,其命令为:estat hettest,iidestat hettest,rhs iid第16页,此课件共43页哦1.sysuse auto,clear reg price weight length mpg检查是否具有异方差。检查是否具有异方差。2。reg weight length mpg检查是否具有异方差。检查是否具有异方差。3。use production,clear reg lny lnk lnl检查是否具有异方差检查是否具有异方差第17页,此课件共43页哦4。use nerlove,clearreg lntc lnq lnpl lnpf lnpk检验是否具有异方差检验是否具有异方差第18页,此课件共43页哦异方差的处理异方差的处理1。使用。使用“OLS+异方差稳健标准误异方差稳健标准误”(robust standard error):这是最简单,也是目前比较流行的):这是最简单,也是目前比较流行的方法。只要样本容量较大,即使在异方差的情况下,只方法。只要样本容量较大,即使在异方差的情况下,只要使用稳健标准误,则所有参数估计、假设检验均可照要使用稳健标准误,则所有参数估计、假设检验均可照常进行。常进行。sysuse nlsw88,clear reg wage ttl_exp race age industry hours reg wage ttl_exp race age industry hours,r第19页,此课件共43页哦2。利用广义最小二乘法(。利用广义最小二乘法(GLS)广义最小二乘法是对原模型加权,使之变成一个新的不广义最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其存在异方差性的模型,然后采用普通最小二乘法估计其参数。参数。其含义为其含义为Var(b)=2(XX)-1(XX)(XX)-1 通过加权使得通过加权使得=I因此,因此,GLS和和WLS要求要求已知。已知。第20页,此课件共43页哦加权最小二乘法(加权最小二乘法(WLS):):sysuse auto,clearreg price weight length foreignestat hettest,normal假设异方差由假设异方差由weight引起,即:引起,即:reg price weight length foreign aw=1/lengthestat hettest,normal第21页,此课件共43页哦在本题中,造成异方差的更可能是解释变量的线性组合,例如:在本题中,造成异方差的更可能是解释变量的线性组合,例如:此时需要下载命令此时需要下载命令wls0findit wls0wls0 price weight length foreign,wvar(length foreign)type(e2)estat hettest,normal第22页,此课件共43页哦GLS和和WLS的一个缺点是假设扰动项的协方的一个缺点是假设扰动项的协方差矩阵为已知。这常常是一个不现实的假定。差矩阵为已知。这常常是一个不现实的假定。因此,现代计量经济学多使用因此,现代计量经济学多使用“可行广义最可行广义最小二乘法小二乘法”(FGLS)。)。第23页,此课件共43页哦可行广义最小二乘法可行广义最小二乘法FGLS(1)对原方程用对原方程用OLS进行估计,得到残差项进行估计,得到残差项的估计的估计i,(2)计算计算ln(i2)(3)用用ln(2)对所有可能产生异方差的的解对所有可能产生异方差的的解释变量进行回归,然后得到拟合值释变量进行回归,然后得到拟合值 i(4)计算计算i=exp(i)(5)用用1/i 作为权重作为权重,做做WLS回归。回归。第24页,此课件共43页哦FGLS的步骤的步骤predict u,resgen lnu2=ln(u2)reg lnu2 x1 x2predict g,xbgen h=exp(g)gen invvar=1/hreg y x1 x2aweight=invvar使用使用FGLS方法对方法对nerlove.dta的方程重新进的方程重新进行估计。行估计。第25页,此课件共43页哦结论:结论:1.GLS估计是估计是BLUE的(如果的(如果 矩阵已知且设矩阵已知且设置正确),但置正确),但FGLS不一定是不一定是BLUE的(的(FGLS 估计时要事先估计估计时要事先估计 矩阵的参数,需要做一矩阵的参数,需要做一些假设)。些假设)。2.Robust稳健性估计更加稳健,而稳健性估计更加稳健,而FGLS更更加有效,选择时要在稳健性和有效性之间进行加有效,选择时要在稳健性和有效性之间进行权衡。权衡。第26页,此课件共43页哦在实际应用中,避免异方差的两种方法。其一,使不同在实际应用中,避免异方差的两种方法。其一,使不同变量的测度单位接近。比如,不同国家的收入和消费数变量的测度单位接近。比如,不同国家的收入和消费数据。如果利用总收入和总消费进行分析,由于不同国家据。如果利用总收入和总消费进行分析,由于不同国家的总量相差非常巨大,因此模型中难免出现异方差。如的总量相差非常巨大,因此模型中难免出现异方差。如果利用人均收入和人均消费进行分析,就可以使得减弱果利用人均收入和人均消费进行分析,就可以使得减弱不同国家变量之间的测度差异,从而降低异方差的程度不同国家变量之间的测度差异,从而降低异方差的程度甚至消除异方差。甚至消除异方差。其二,可能的情况下对变量取自然对数。变量取对数降低其二,可能的情况下对变量取自然对数。变量取对数降低了变量的变化程度,因此有助于消除异方差。了变量的变化程度,因此有助于消除异方差。第27页,此课件共43页哦自相关自相关经典假设经典假设 随机误差项彼此之间不相关随机误差项彼此之间不相关如果存在自相关,则:如果存在自相关,则:时间序列数往往存在着自相关,即:时间序列数往往存在着自相关,即:一般时间序列数据中,一般时间序列数据中,i.i.d i.i.d 假设不成立假设不成立第28页,此课件共43页哦如果存在自相关:随机误差项的方差如果存在自相关:随机误差项的方差-协方差协方差矩阵的非主对角线上的元素不为矩阵的非主对角线上的元素不为0。第29页,此课件共43页哦自相关包含一阶自相关和高阶自相关。自相关包含一阶自相关和高阶自相关。一阶自相关:一阶自相关:高阶自相关:高阶自相关:第30页,此课件共43页哦考察英国政府如何根据长期利率(考察英国政府如何根据长期利率(r20)的)的变化来调整短期利率(变化来调整短期利率(rs),数据集为),数据集为ukrates.dta(1)做如下回归:)做如下回归:,其中:,其中:回归方程为:回归方程为:use ukrates,clear tsset month reg D.rs LD.r20 第31页,此课件共43页哦自相关的检验自相关的检验1。图形法:自相关系数和偏自相关系数。图形法:自相关系数和偏自相关系数 predict e1,res ac e1 pac e1 corrgram e1,lag(10)第32页,此课件共43页哦2。t检验和检验和F检验检验(wooldridge)思想:思想:t检验,如果存在一阶自相关,残差项检验,如果存在一阶自相关,残差项与其一阶滞后项回归后系数显著,如果解释变与其一阶滞后项回归后系数显著,如果解释变量非严格外生,回归时可加入解释变量。量非严格外生,回归时可加入解释变量。reg e1 L.e1 reg e1 L.e1 LD.r20 同理,可以用同理,可以用F检验检验是否存在高阶自相关检验检验是否存在高阶自相关 reg e1 L(1/2).e1第33页,此课件共43页哦3。DW检验:只能检验一阶自相关的序列相检验:只能检验一阶自相关的序列相关形式,并且要求解释变量严格外生。关形式,并且要求解释变量严格外生。根据样本个数和自由度查表得到根据样本个数和自由度查表得到DL和和DU,并且构,并且构造不同的区域。造不同的区域。第34页,此课件共43页哦reg D.rs LD.r20dwstat第35页,此课件共43页哦经验上经验上DW值值1.8-2.2之间接受原假设,之间接受原假设,不存在一阶自相关。不存在一阶自相关。DW值接近于值接近于0或者接近于或者接近于4,拒绝原假,拒绝原假设,存在一阶自相关。设,存在一阶自相关。第36页,此课件共43页哦4。Q检验和检验和Bartlett检验检验 reg D.rs LD.r20 predict e2,res wntestq e2 wntestq e2,lag(2)wntestb e2第37页,此课件共43页哦如果不能保证解释变量严格外生,例如解释变量中包含被如果不能保证解释变量严格外生,例如解释变量中包含被解释变量的滞后项,可以用以下方法:解释变量的滞后项,可以用以下方法:5。D-Ws h检验检验 estat durbinalt estat durbinalt,lag(2)第38页,此课件共43页哦6。对于高阶自相关的检验方法:。对于高阶自相关的检验方法:B-G检验检验 bgodfrey bgodfrey,lag(2)第39页,此课件共43页哦自相关的处理自相关的处理1.使用使用OLS+异方差自相关稳健的标准误(异方差自相关稳健的标准误(HAC)方法被称为方法被称为Newey-West估计法(估计法(Newey and West,1987)reg D.rs LD.r20 newey D.rs LD.r20,lag(1)(假设存在一阶自相关)(假设存在一阶自相关)newey D.rs LD.r20,lag(2)(假设存在二阶自(假设存在二阶自相关)相关)系数完全相同,但标准差和系数完全相同,但标准差和t值不同。值不同。第40页,此课件共43页哦可行广义最小二乘法(可行广义最小二乘法(FGLS):广义差分法:):广义差分法:CO-PW方法方法Cochrane-Orcutt(1949)估计估计(舍弃第一期观察值舍弃第一期观察值)Prais-Winsten(1954)估计估计(对第一期观察值对第一期观察值进行处理进行处理 sqrt(1-rho2)*y1)第41页,此课件共43页哦第42页,此课件共43页哦 Cochrane-Orcutt(1949)估计估计(舍弃第一期观察值舍弃第一期观察值)prais D.rs LD.r20,corc prais D.rs LD.r20,rho(dw)corc Prais-Winsten(1954)估计估计(对第一期观察值进行处理对第一期观察值进行处理 sqrt(1-rho2)*y1)prais D.rs LD.r20 prais D.rs LD.r20,rho(dw)时间序列一般样本不会太大,因此不要轻易舍弃。时间序列一般样本不会太大,因此不要轻易舍弃。第43页,此课件共43页哦