计量经济学之线性回归模型的扩展.pptx
第四讲第四讲 线性回归分析的扩展线性回归分析的扩展Linear Regression Analysis: Extension一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设二、多重共线性二、多重共线性三、异方差性三、异方差性四、序列相关四、序列相关五、设定误差五、设定误差一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定的假定(一)关于模型的假定(一)关于模型的假定1. 回归模型对参数而言是线性的回归模型对参数而言是线性的2. 模型是正确设定的模型是正确设定的(二)关于解释变量的假定(二)关于解释变量的假定3. 解释变量解释变量X是确定性变量是确定性变量4. 若若X是随机的,则误差项与是随机的,则误差项与X不相关不相关5. 解释变量的取值有足够变异解释变量的取值有足够变异6. 解释变量之间不存在完全的线性关系解释变量之间不存在完全的线性关系引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定的假定(三)关于误差项的假定(三)关于误差项的假定7. 对于给定的对于给定的X,误差项均值为误差项均值为08. 对于给定的对于给定的X,误差项方差相等误差项方差相等9. 对于给定的对于给定的X,误差项之间不存在序列相关误差项之间不存在序列相关10.误差项服从正态分布误差项服从正态分布引言:放宽经典模型的假设引言:放宽经典模型的假设放宽的假定放宽的假定相应的问题相应的问题假定假定1、2模型设定问题模型设定问题假定假定3、4随机解释变量随机解释变量假定假定5过度决定(微数缺测性)过度决定(微数缺测性)假定假定6多重共线性多重共线性假定假定7误差项均值非零误差项均值非零假定假定8异方差性异方差性假定假定9序列相关序列相关假定假定10误差项非正态分布误差项非正态分布u假定假定3和和4在联立在联立方程模型中讨论方程模型中讨论u对假定对假定5我们做简我们做简单讨论单讨论u假定假定7影响参数估影响参数估计的无偏性,暂不计的无偏性,暂不讨论讨论u假定假定10对于大样对于大样本数据不是必需的本数据不是必需的假定。假定。u本讲主要考虑放本讲主要考虑放宽了其余假定后面宽了其余假定后面临的问题临的问题引言:放宽经典模型的假设引言:放宽经典模型的假设微数缺测性微数缺测性o 从理论上讲,样本容量从理论上讲,样本容量n和解释变量数目和解释变量数目k必须满足必须满足nk+2,才能进行,才能进行OLS估计和假设检验。但事实上,即便估计和假设检验。但事实上,即便n满足满足上述条件,但如果样本很小,那么虽然能够进行估计和检上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过验,也很难通过t检验。检验。越越大大。就就越越小小,即即从从而而的的变变异异性性就就越越小小,如如果果样样本本容容量量越越小小,则则;)(VarTSSX)(Var)(SE)R(TSS)(Varjjjjjjjj 22111. 什么是多重共线性什么是多重共线性2. 多重共线性的影响多重共线性的影响3. 多重共线性的诊断多重共线性的诊断4. 多重共线性的处理多重共线性的处理二、多重共线性二、多重共线性什么是多重共线性什么是多重共线性o 多重共线性(多重共线性(multicollinearity):回归模型中的一些或回归模型中的一些或全部解释变量之间存在一定程度的线性关系全部解释变量之间存在一定程度的线性关系)(eXXXeXXX0.b)(XXXXXX0.auXXXYikikiiikikiikkikiikikiikikikiii010001112121221111121212211122110 或或:令令,、的的不不同同时时为为多多重重共共线线性性:存存在在一一组组或或:令令,、的的不不同同时时为为完完全全共共线线性性:存存在在一一组组对对于于什么是多重共线性什么是多重共线性例题例题4.1其他例题:其他例题:p200X1 X2X3X410555267158075251895973424125129183015515289:低度多重共线性:低度多重共线性:高度多重共线性:高度多重共线性:完全共线性:完全共线性25320995901141312.r.rr 什么是多重共线性什么是多重共线性图形表示:巴伦坦图图形表示:巴伦坦图YX1X2YX1 X2低度多重共线性低度多重共线性高度多重共线性高度多重共线性什么是多重共线性什么是多重共线性产生多重共线性的原因产生多重共线性的原因1) 样本过小样本过小2) 模型设定有误:添加了过多的解释变量模型设定有误:添加了过多的解释变量v 由于样本过小,即便在总体中解释变量之间没有线性关系由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系,也可能在获得的样本中观察到较强的线性关系多重共线性的影响多重共线性的影响存在完全线性关系时的存在完全线性关系时的OLS估计估计o 无法得到无法得到OLS估计量估计量例题:例题:p201-20221010203322033211201021013322110 、已已知知,但但无无法法得得到到、,虽虽然然和和只只能能得得到到估估计计实实际际上上只只有有两两个个,根根据据这这样样,真真正正的的解解释释变变量量则则有有:若若,对对于于OLSuXXuXX)()(YXXuXXXYiiiiiiiiiiiiii 多重共线性的影响多重共线性的影响存在多重共线性关系时的存在多重共线性关系时的OLS估计估计o 可以证明即便存在多重共线性,可以证明即便存在多重共线性,OLS估计量仍然是估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过但系数估计量的方差较大,从而不容易通过t检验,同时预检验,同时预测区间变宽,降低了预测精确度。测区间变宽,降低了预测精确度。 )(VarR)(VarRXTSS)(Var)(SE)R(TSS)(Varjjjjjjjjjjj ,则则特特别别地地,若若越越大大。越越大大,从从而而则则联联程程度度越越强强,与与其其他他自自变变量量的的线线性性关关这这样样,如如果果,和和计计算算出出对对于于给给定定的的样样本本,可可以以;11122222例题:例题:p202-203多重共线性的影响多重共线性的影响影响程度的度量:方差膨胀因子(影响程度的度量:方差膨胀因子(variance-inflation factor)越越大大越越大大,从从而而则则共共线线性性程程度度越越高高,与与其其他他解解释释变变量量的的多多重重易易知知,如如果果定定义义方方差差膨膨胀胀因因子子:,有有对对于于jjjjjjjjVIFRXRVIF),R(TSS)(Vark,j222211111 多重共线性的影响多重共线性的影响例题例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.26 10.26A0.9950.25 50.25A)(Varj jjjjTSSAVIFTSS)(Var 22 )(SEj AA15. 1A40. 2A20. 3A.097多重共线性的诊断多重共线性的诊断简单诊断方法简单诊断方法o R2高而单个系数的高而单个系数的t值小,换言之,值小,换言之,F检验显著,但显著的检验显著,但显著的t值少值少o 任意两个解释变量之间的相关系数较大,比如大于任意两个解释变量之间的相关系数较大,比如大于0.9o 解释变量之间的偏相关系数较大解释变量之间的偏相关系数较大F简单方法一般来说不很精确简单方法一般来说不很精确多重共线性的诊断多重共线性的诊断运用回归分析进行诊断运用回归分析进行诊断o 逐步分析法:先引入经济意义明显,并且在统计上最显著的逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释解释变量,然后逐步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或变量使原有解释变量的系数估计值发生明显变化,或t统计量统计量明显变小,则说明新引入的解释变量与原有解释变量之间存明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量在多重共线性,可以去掉新引入的解释变量o 辅助回归法:做每一个解释变量对其余解释变量的回归,得辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的出相应的F统计值,如果在给定的显著性水平统计值,如果在给定的显著性水平下下F统计值是显统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,著的,说明该解释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(可以去掉该解释变量(p207,p211)多重共线性的诊断多重共线性的诊断运用一些指标进行诊断运用一些指标进行诊断1) 方差膨胀因子:计算每个解释变量的方差膨胀因子方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一一般认为如果般认为如果VIF大于大于10,说明该变量与其他变量存在高度共,说明该变量与其他变量存在高度共线性线性2) 容许度(容许度(tolerance):):定义容许度定义容许度TOL如下,一般认为如如下,一般认为如果果TOL小于小于0.1,说明该变量与其他变量存在高度共线性,说明该变量与其他变量存在高度共线性3) 条件指数(条件指数(condition index, CI):):一般认为,如果条件指一般认为,如果条件指数在数在10到到30之间,存在较强的多重共线性,如果大于之间,存在较强的多重共线性,如果大于30,则,则存在严重的多重共线性存在严重的多重共线性jjjVIFRTOL112 多重共线性的诊断多重共线性的诊断例题例题4.3(p218)YConsumptionX1IncomeX2 Wealth708081065100100990120127395140142511016016331151801876120200205214022022011552402435150260268625.16602. 013.482:9531. 0,9635. 0,9990. 04019.92, 7,10)615. 0()290. 0()008. 0()526. 0()144. 1()669. 3()081. 0()823. 0()752. 6(042. 0942. 0775.242121221221 CITOLTOLVIFVIFsdiagnostictyCollineariRRrFdfnptseXXYiii例题:例题:p209-211多重共线性的诊断多重共线性的诊断几点说明几点说明o 多重共线性是一个程度问题而不是存在与否的问题多重共线性是一个程度问题而不是存在与否的问题o 多重共线性是关于样本的一种特征多重共线性是关于样本的一种特征o 如果研究是为了估计斜率系数和预测,多重共线性不是一个如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大重共线性的危害就很大多重共线性的处理多重共线性的处理1) 剔除共线性变量中不太重要的解释变量剔除共线性变量中不太重要的解释变量2) 补充新数据补充新数据3) 重新设定模型重新设定模型o 练习题:练习题:p216-217,习题,习题10.14-10.19 1. 什么是异方差性什么是异方差性2. 异方差性的影响异方差性的影响3. 异方差性的诊断异方差性的诊断4. 异方差性的处理异方差性的处理三、异方差性三、异方差性什么是异方差性什么是异方差性o 异方差性(异方差性(heteroscedasticity):回归模型误差项的方回归模型误差项的方差不相同差不相同o 同方差性(同方差性(homoscedasticity):回归模型误差项的方差回归模型误差项的方差不相同不相同2212212212221222110 )X,X,X|Y(Var)X,X,X|Y(Var)X,X,X|u(E)u(Var)X,X,X|u(E)u(VaruXXXYkiiiiikiiiikiiiiiikiiiiiikikiii同同方方差差性性:异异方方差差性性:也也即即:同同方方差差性性:异异方方差差性性:对对于于什么是异方差性什么是异方差性同方差性同方差性XY概概率率密密度度X:受教育年限受教育年限Y:工资工资什么是异方差性什么是异方差性异方差异方差性性XY概概率率密密度度X:收入收入Y:消费支出消费支出什么是异方差性什么是异方差性异方差性异方差性XY概概率率密密度度X:时间时间Y:打字错误打字错误例题:例题:p220-224什么是异方差性什么是异方差性产生异方差性的原因产生异方差性的原因原因原因解释变量:收入解释变量:收入被解释变量:消费支出被解释变量:消费支出解释变量与误差项相关解释变量与误差项相关随着收入的增加,支出差异性更大随着收入的增加,支出差异性更大有重要的解释变量未被有重要的解释变量未被包含在回归模型中包含在回归模型中物价也是影响支出的因素,物价上物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大钱来消费,因而支出差异性更大异常值(异常值(outliers)异方差性的影响异方差性的影响1)回归系数回归系数的的OLS估计量虽然是无偏的、一致的,但不再估计量虽然是无偏的、一致的,但不再是有效的是有效的2)回归标准差的估计不再是无偏的回归标准差的估计不再是无偏的3)回归系数回归系数OLS估计量的方差估计不再是无偏的,因而估计量的方差估计不再是无偏的,因而t统计量不再服从统计量不再服从t分布,分布,F统计量不再服从统计量不再服从F分布,从而分布,从而无法进行区间估计和假设检验无法进行区间估计和假设检验4)无法根据回归结果进行预测无法根据回归结果进行预测异方差性的诊断异方差性的诊断1)图解法图解法2)布罗施布罗施-培甘检验(培甘检验(Breusch-Pagan test)3)怀特检验(怀特检验(White test)4)帕克检验(帕克检验(Park test)5)Glesjer test6)戈德菲尔德戈德菲尔德-匡特检验(匡特检验(Goldfeld-Quandt test )异方差性的诊断异方差性的诊断图解法图解法在同方差假定下作回归分析,用残差项平方与解释变量做散点图在同方差假定下作回归分析,用残差项平方与解释变量做散点图 2uX异方差性的诊断异方差性的诊断图解法:简便处理图解法:简便处理o 用残差项平方与因变量拟合值做散点图用残差项平方与因变量拟合值做散点图 2u Y异方差性的诊断异方差性的诊断例题例题4.4(p222)o 1988年美国公司销售额与研发支出的关系年美国公司销售额与研发支出的关系4457. 0,4783. 0,669.14,17,18)001. 0()848. 0()830. 3()195. 0()008. 0()985.990(032. 0993.19222 RRFdfnptsesaleRDii异方差性的诊断异方差性的诊断例题例题4.4SALE3000002000001000000RES1_SQ6000000050000000400000003000000020000000100000000-10000000异方差性的诊断异方差性的诊断布劳殊布劳殊-培干检验(培干检验(Breusch-Pagan test)即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到到的的作作为为因因变变量量做做以以下下模模型型用用方方法法估估计计出出每每个个根根据据模模型型用用假假定定:对对于于pHdknRpcvXXuROLSubuOLSavXXuXXYiuikikiiuiiikikiiikikii222022110222211021101:.)(., 异方差性的诊断异方差性的诊断例题例题4.4 :BP Test方方差差的的假假设设所所以以可可以以拒拒绝绝误误差差项项同同84. 3)1(996. 32220. 0, 1,18)048. 0()842. 0(232.86974469205. 0222 nRRknpsaleuii异方差性的诊断异方差性的诊断怀特检验(怀特检验(White test)即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到到做做以以下下模模型型的的方方法法估估计计出出每每个个根根据据模模型型用用对对于于pHdnRpcvXXXXXXvXXXXXXuROLSbuOLSauXXXYiuiiiiiiiiiiiiuiiiiiiiii222022329318217262524332211022233221101321:.)9(., 异方差性的诊断异方差性的诊断怀特检验的特例怀特检验的特例即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到到做做以以下下模模型型的的和和方方法法估估计计出出每每个个根根据据模模型型用用对对于于pHdnRpcvYYuROLSbYuOLSauXXYiuiiiiuiiikikii22202222102221101:.)2(., 异方差性的诊断异方差性的诊断例题例题4.4 :White Test差差的的假假设设,可可以以拒拒绝绝误误差差项项同同方方如如果果选选定定差差的的假假设设,不不能能拒拒绝绝误误差差项项同同方方如如果果选选定定10. 005. 061. 4)2(375. 599. 5)2(375. 52896. 0, 2,18)251. 0()089. 0()351. 0(0005. 0351.2296219665210. 02205. 02222 nRnRRknpsalesaleuiii异方差性的诊断异方差性的诊断o 在在EViews等计量经济学软件中,直接提供等计量经济学软件中,直接提供White异方差检验的结果,不需要手工计算。异方差检验的结果,不需要手工计算。异方差性的处理异方差性的处理1)加权最小二乘法(加权最小二乘法(Weighted Least Square,WLS)o WLS是广义最小二乘估计(是广义最小二乘估计(Generalize Least Square, GLS)方法中的一种)方法中的一种o 通过通过WLS可以得到可以得到BLUE2)重新设定模型重新设定模型3)怀特一致协方差矩阵估计(怀特一致协方差矩阵估计(White Heteroskedasticity-Consistence Covariance Matrix Estimation )o 得到无偏一致估计量(在大样本情形下适用)得到无偏一致估计量(在大样本情形下适用)异方差性的处理异方差性的处理加权最小二乘估计:误差项方差已知加权最小二乘估计:误差项方差已知)称称为为加加权权最最小小二二乘乘法法(和和,化化经经过过加加权权的的残残差差平平方方因因此此这这种种方方法法要要求求最最小小变变换换之之后后要要求求:要要求求:易易知知,如如果果不不做做变变换换,方方法法估估计计。方方差差条条件件,可可以以使使用用经经过过变变换换的的模模型型满满足足同同即即:已已知知,有有:如如果果对对于于WLS,squaresleastweighteduwuminuminOLSOLSuXXXYu)X()X()(Y,uXXYiiiii*i*kik*i*i*iiiikikiiiiiiikikii 22221100110211011 异方差性的处理异方差性的处理加权最小二乘估计:误差项方差未知加权最小二乘估计:误差项方差未知 iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiYu)YX()Y(YY )E(Y.cXu)XX()X(XYX.bXu)XX()X(XYX.a,uXY1022210222102210111 假假定定足足同同方方差差假假设设:,可可以以证证明明如如下下变变换换满满假假定定足足同同方方差差假假设设:,可可以以证证明明如如下下变变换换满满假假定定对对于于异方差性的处理异方差性的处理例题例题4.4:加权最小二乘估计(:加权最小二乘估计(p233)o 1988年美国公司销售额与研发支出的关系年美国公司销售额与研发支出的关系692. 0)000. 0()527. 0()172. 5()647. 0()007. 0()129.381(037. 068.246222 RptsesaleRDWLSXiiii的的回回归归结结果果为为:,若若假假定定 异方差性的处理异方差性的处理可行的广义最小二乘估计可行的广义最小二乘估计o 在一般情况下,我们并不知道异方差的具体形式,需要在一般情况下,我们并不知道异方差的具体形式,需要对异方差的函数形式做出估计,然后再进行加权最小二对异方差的函数形式做出估计,然后再进行加权最小二乘估计,这种方法属于乘估计,这种方法属于可行的广义最小二乘估计(可行的广义最小二乘估计(Feasible Generalized Least Square, FGLS)(伍德伍德里奇,里奇,2000;赵国庆,;赵国庆,2001)异方差性的处理异方差性的处理可行的广义最小二乘估计可行的广义最小二乘估计iikiikiiiiiiikikiiiikikiiiikikiiikikiihuXhXhhhY:WLS.eeexph.d,XXe)uln(.cvXX)uln(:OLS.buOLS.ahXXexp,uXXY 11021102211022211022110对对原原模模型型做做令令的的估估计计值值计计算算回回归归做做以以下下模模型型的的方方法法估估计计出出每每个个根根据据原原模模型型用用假假定定:对对于于异方差性的处理异方差性的处理例题例题4.5o 1996年中国各省市城镇居民人均收入与人均消费的关系年中国各省市城镇居民人均收入与人均消费的关系998000000770033005914275008872609660130000043600280276139783014311022.R).().(p).().(seincome.consume.R,k,n).().(p).().(seincome.consumeiiii 对对异异方方差差进进行行校校正正后后异方差性的处理异方差性的处理重新设定模型重新设定模型重重新新解解释释回回归归系系数数的的含含义义也也需需要要当当然然,经经过过变变换换之之后后,即即选选择择:小小异异方方差差性性变变量量的的测测量量尺尺度度从从而而减减以以缩缩小小如如果果选选择择对对数数模模型型,可可对对于于iiiiiivXlnYln,uXY 1010 例题:例题:p235异方差性的处理异方差性的处理例题例题4.5o 1996年中国各省市城镇居民人均收入与人均消费的关系年中国各省市城镇居民人均收入与人均消费的关系966013000004360028027613978301431102.R,k,n).().(p).().(seincome.consumeii 96600000532003402870953018202.R).().(p).().(seincomeln.consumelnii 行校正后行校正后用对数变换对异方差进用对数变换对异方差进异方差性的处理异方差性的处理怀特一致协方差矩阵估计怀特一致协方差矩阵估计o 如果存在异方差,则对于通过如果存在异方差,则对于通过OLS得到的估计量不能进行得到的估计量不能进行t检验和检验和F检验。检验。EViews等软件提供怀特一致协方差矩阵估等软件提供怀特一致协方差矩阵估计量(计量(White Heteroskedasticity-Consistence Covariance Matrix Estimator),这种方法提供大样本情),这种方法提供大样本情形下回归标准差和回归系数的一致估计量,可以进行形下回归标准差和回归系数的一致估计量,可以进行t检验检验和和F检验。检验。o 例题:例题:p236异方差性的处理异方差性的处理例题例题4.6:怀特一致协方差矩阵估计:怀特一致协方差矩阵估计o 1998年中国各省市城镇居民人均可支配收入与通讯交通支出年中国各省市城镇居民人均可支配收入与通讯交通支出31768074510130000103527001250227460000001272000650306236058109180562.F,.R,k,n.p.se).().(p).().(seincome.endexpii 1. 什么是序列相关什么是序列相关2. 序列相关的影响序列相关的影响3. 序列相关的诊断序列相关的诊断4. 序列相关的处理序列相关的处理四、序列相关四、序列相关什么是序列相关什么是序列相关o 序列相关(序列相关(serial correlation):回归模型的误差项之间回归模型的误差项之间不完全独立,存在一定程度的相关。也称不完全独立,存在一定程度的相关。也称自相关(自相关(autocorrelation)o 序列相关经常出现在时间序列数据中,但在横截面数据中序列相关经常出现在时间序列数据中,但在横截面数据中也会出现也会出现0022110 )uu(E)uu(E)uu(E)u(Eu)u(EuE)u,u(CovuXXXYmlmlmlmlmlmlikikiii存存在在序序列列相相关关:不不存存在在序序列列相相关关:对对于于 什么是序列相关什么是序列相关o 序列相关图示序列相关图示tut无序列相关无序列相关什么是序列相关什么是序列相关o 序列相关图示序列相关图示Tutut-1utTututut-1正相关正相关负相关负相关什么是序列相关什么是序列相关产生序列相关的原因产生序列相关的原因原因原因实例实例惯性或滞后惯性或滞后经济周期经济周期; ;消费惯性消费惯性有重要的解释变量未被有重要的解释变量未被包含在回归模型中包含在回归模型中在研究总量生产函数时在研究总量生产函数时, ,没有考虑没有考虑政策的影响政策的影响, ,而政策对总产量的影而政策对总产量的影响在每一期都可能是正的或负的响在每一期都可能是正的或负的序列相关的影响序列相关的影响1)回归系数的回归系数的OLS估计量虽然是无偏的、一致的,但不再估计量虽然是无偏的、一致的,但不再是有效的是有效的2)回归系数回归系数OLS估计量的方差估计不再是无偏的,一般而估计量的方差估计不再是无偏的,一般而言会低估实际的方差,从而使得系数的显著性检验容易言会低估实际的方差,从而使得系数的显著性检验容易被通过,而实际上该系数是不显著的被通过,而实际上该系数是不显著的3)t检验和检验和F检验是不准确的检验是不准确的序列相关的影响序列相关的影响序列相关对方差估计的影响:图示序列相关对方差估计的影响:图示总体回归曲线总体回归曲线样本回归曲线样本回归曲线XtYt序列相关的影响序列相关的影响序列相关对方差估计的影响(序列相关对方差估计的影响(1) 2112110102110 xttttttttttttttttttttttttttttxuuxxuxXxx)uX(xYx)YXYXYXYX()YY)(XX()XX()YY)(XX(uXY 对对于于序列相关的影响序列相关的影响序列相关对方差估计的影响(序列相关对方差估计的影响(2)估估计计量量是是无无偏偏的的即即则则存存在在相相关关,但但只只要要可可见见,即即便便误误差差项项之之间间OLS)uE(xx)uE(xx)xux(E)(E0)E(u1tttttttttt 212121111序列相关的影响序列相关的影响序列相关对方差估计的影响(序列相关对方差估计的影响(3))uu(Exx)uu(ExxxTSS)u,u(Covxx)u,u(CovxxxTSS)ux,ux(Cov)ux,ux(Cov)ux,ux(Cov)ux(Var)ux(VarTSS)ux(VarTSS)xux(Var)(VarnnnntXnnnntXnnnnnnXttXttt1121212221121212221133112211112221122122122211 序列相关的影响序列相关的影响序列相关对方差估计的影响(序列相关对方差估计的影响(4) 1112221121221112221121212112222122210110nttnjjttjXXnnntttntttXXnnnnXXtttXtXmlxxTSSTSSxxxxxxTSSTSS)uu(Exx)uu(ExxTSSTSS)(Var|,vuu)(ARTSSxTSS)(Var)uu(E ,即即自自相相关关若若存存在在误误差差项项存存在在一一阶阶若若不不存存在在序序列列相相关关,则则序列相关的影响序列相关的影响序列相关对方差估计的影响(序列相关对方差估计的影响(5)的的估估计计的的方方差差肯肯定定是是有有偏偏还还是是低低估估实实际际方方差差,但但估估计计的的方方差差会会高高估估能能判判定定如如果果存存在在负负相相关关,则则不不方方差差估估计计的的方方差差会会低低估估实实际际因因而而据据里里存存在在正正相相关关,一一般般而而言言,时时间间序序列列数数OLSOLSOLSTSSxxTSSTSS)(VarXnttnjjttjXX2111222120 序列相关的诊断序列相关的诊断1) 图解法:在无序列相关的假定下作回归分析,然后用残差项图解法:在无序列相关的假定下作回归分析,然后用残差项与时间变量做散点图,或者用本期的残差与上一期的残差做与时间变量做散点图,或者用本期的残差与上一期的残差做散点图(散点图(p248)2) 游程检验(游程检验(runs test,p249-250)3) 德宾德宾-沃森检验沃森检验序列相关的诊断序列相关的诊断例题例题4.7:图解法:图解法o 1968-1987年美年美国居民对进口国居民对进口商品的消费支商品的消费支出与可支配收出与可支配收入的关系(数入的关系(数据在据在p116)YEAR1990198019701960Unstandardized Residual6040200-20-40-60序列相关的诊断序列相关的诊断德宾德宾-沃森检验(沃森检验(Durbin-Watson test) nttntttnttnttnttttnttntttttttktkttuuuuuunuuuuuOLSeuu,uXXY122112221221221211110 ,因因此此较较大大时时,当当的的估估计计量量。的的相相关关系系数数和和是是估估计计,可可以以证证明明。对对该该模模型型进进行行即即:假假定定存存在在一一阶阶自自相相关关,对对于于序列相关的诊断序列相关的诊断德宾德宾-沃森检验(沃森检验(Durbin-Watson test) 关关),误误差差项项越越可可能能呈呈正正相相越越接接近近(),误误差差项项越越可可能能不不相相关关越越接接近近(关关),误误差差项项越越可可能能呈呈负负相相越越接接近近(易易知知:较较大大时时,构构造造统统计计量量0dd,2dd,4dd,)(uuudnuuuuuu)uu(dnttntttnttntttnttnttnttnttt01204112222122112212212212221 序列相关的诊断序列相关的诊断德宾德宾-沃森检验(沃森检验(Durbin-Watson test)o 根据根据OLS估计的残差计算出来的估计的残差计算出来的d统计量服从特定的分布统计量服从特定的分布,可根据样本容量,可根据样本容量n和解释变量数目和解释变量数目k查表并判断是否存在查表并判断是否存在序列相关序列相关d的值域的值域序列相关性序列相关性(0, dL)正的序列相关正的序列相关dL, dU无法判定无法判定(dU, 4-dU)无序列相关无序列相关4-dU, 4-dL无法判定无法判定(4-dU, 4)负的序列相关负的序列相关序列相关的诊断序列相关的诊断德宾德宾-沃森检验的步骤沃森检验的步骤a) 对原方程进行对原方程进行OLS估计得到残差估计得到残差b)根据根据d统计量的公式计算统计量的公式计算d值值c) 根据样本容量和解释变量数目查找根据样本容量和解释变量数目查找d的下临界值和上临界值的下临界值和上临界值d)根据决策规则判定是否存在一阶自相关根据决策规则判定是否存在一阶自相关o 统计软件会自动计算统计软件会自动计算d值,因此我们需要做的仅是后两步值,因此我们需要做的仅是后两步序列相关的诊断序列相关的诊断例题例题4.7:德宾:德宾-沃森检验沃森检验o 进口商品消费支出(进口商品消费支出(IMPORT)与可支配收入(与可支配收入(PDI),存存在在正正的的序序列列相相关关,若若取取,存存在在正正的的序序列列相相关关,若若取取LULLULttdddddddddRknpPDIIMPORT 15. 1,95. 001. 041. 1,20. 105. 0595. 0,9388. 0, 1,20)000. 0()000. 0(2452. 009.2612 例题:例题:p252-253序列相关的诊断序列相关的诊断德宾德宾-沃森检验的适用条件沃森检验的适用条件a. 回归模型中有常数项回归模型中有常数项b. 误差项为一阶自相关误差项为一阶自相关c. 不含有因变量的滞后项(不是自回归模型)不含有因变量的滞后项(不是自回归模型)tttteuuu 2211 二二阶阶自自回回归归:归归或或高高阶阶自自回回归归即即误误差差项项不不是是二二阶阶自自回回ttktkttuYXXY 1110 型型含含有有因因变变量量滞滞后后项项的的模模序列相关的诊断序列相关的诊断包含滞后变量(自回归模型)的序列相关诊断包含滞后变量(自回归模型)的序列相关诊断o 对于此类模型,对于此类模型,DW检验是无效的,为此,检验是无效的,为此,Durbin提出可提出可以计算以计算h统计量来进行序列相关诊断(平狄克、鲁宾费尔统计量来进行序列相关诊断(平狄克、鲁宾费尔德,德,1998))(Varnn)d(huXYYtttt 1211定义:定义:序列相关的处理序列相关的处理o 出现序列相关的原因有很多,我们仅仅考虑最简单的情出现序列相关的原因有很多,我们仅仅考虑最简单的情况,即存在一阶自相关时对于序列相关问题的处理况,即存在一阶自相关时对于序列相关问题的处理序列相关的处理序列相关的处理进进行行估估计计性性条条件件,可可以以用用该该模模型型满满足足经经典典正正态态线线有有定定义义:有有:期期:将将原原模模型型的的变变量量滞滞后后一一线线性性的的条条件件。,该该模模型型满满足足经经典典正正态态即即:假假定定存存在在一一阶阶自自相相关关,对对于于OLSeXXY:XXXXXXYYYeXXXXYYuXXYeuuuXXYtktkttktktkttttttttkktktttttktkttttttktktt *11*0*1*111*10*01*1111110111111011110.;)1(;)()()1(, 基本思想基本思想序列相关的处理序列相关的处理估估计计即即可可进进行行对对模模型型,则则若若OLSeXXYXXX.XXXYYYt*ktk*t*tktkt*kttt*t*tt*t 110111110101一阶差分法一阶差分法注意:使用一阶差分法时不含截距项注意:使用一阶差分法时不含截距项序列相关的处理序列相关的处理例题例题4.7:一阶差分法:一阶差分法,无无序序列列相相关关,若若取取,无无序序列列相相关关,若若取取UUULUUULttdddddbdddddadRknpPDIIMPORT 413. 1,93. 001. 0.440. 1,18. 105. 0.875. 1,9388. 0, 1,19)000. 0(3286. 02* 序列相关的处理序列相关的处理估估计计即即可可进进行行对对模模型型所所以以:即即:统统计计量量,有有对对于于原原模模型型的的OLSeXXYXXX.;XXX);(;YYY,d)(ddt*ktk*t*tktkt*kttt*t*tt*t 110111110011