计量经济学之线性回归模型的扩展.pptx
《计量经济学之线性回归模型的扩展.pptx》由会员分享,可在线阅读,更多相关《计量经济学之线性回归模型的扩展.pptx(93页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲第四讲 线性回归分析的扩展线性回归分析的扩展Linear Regression Analysis: Extension一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设二、多重共线性二、多重共线性三、异方差性三、异方差性四、序列相关四、序列相关五、设定误差五、设定误差一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定的假定(一)关于模型的假定(一)关于模型的假定1. 回归模型对参数而言是线性的回归模型对参数而言是线性的2. 模型是正确设定的模型是正确设定的(二)关于解
2、释变量的假定(二)关于解释变量的假定3. 解释变量解释变量X是确定性变量是确定性变量4. 若若X是随机的,则误差项与是随机的,则误差项与X不相关不相关5. 解释变量的取值有足够变异解释变量的取值有足够变异6. 解释变量之间不存在完全的线性关系解释变量之间不存在完全的线性关系引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(经典正态线性回归模型(CNLRM)的假定的假定(三)关于误差项的假定(三)关于误差项的假定7. 对于给定的对于给定的X,误差项均值为误差项均值为08. 对于给定的对于给定的X,误差项方差相等误差项方差相等9. 对于给定的对于给定的X,误差项之间不存在序列相
3、关误差项之间不存在序列相关10.误差项服从正态分布误差项服从正态分布引言:放宽经典模型的假设引言:放宽经典模型的假设放宽的假定放宽的假定相应的问题相应的问题假定假定1、2模型设定问题模型设定问题假定假定3、4随机解释变量随机解释变量假定假定5过度决定(微数缺测性)过度决定(微数缺测性)假定假定6多重共线性多重共线性假定假定7误差项均值非零误差项均值非零假定假定8异方差性异方差性假定假定9序列相关序列相关假定假定10误差项非正态分布误差项非正态分布u假定假定3和和4在联立在联立方程模型中讨论方程模型中讨论u对假定对假定5我们做简我们做简单讨论单讨论u假定假定7影响参数估影响参数估计的无偏性,暂不
4、计的无偏性,暂不讨论讨论u假定假定10对于大样对于大样本数据不是必需的本数据不是必需的假定。假定。u本讲主要考虑放本讲主要考虑放宽了其余假定后面宽了其余假定后面临的问题临的问题引言:放宽经典模型的假设引言:放宽经典模型的假设微数缺测性微数缺测性o 从理论上讲,样本容量从理论上讲,样本容量n和解释变量数目和解释变量数目k必须满足必须满足nk+2,才能进行,才能进行OLS估计和假设检验。但事实上,即便估计和假设检验。但事实上,即便n满足满足上述条件,但如果样本很小,那么虽然能够进行估计和检上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过验,也很难通过t检验。检验。越越大大。就就越越
5、小小,即即从从而而的的变变异异性性就就越越小小,如如果果样样本本容容量量越越小小,则则;)(VarTSSX)(Var)(SE)R(TSS)(Varjjjjjjjj 22111. 什么是多重共线性什么是多重共线性2. 多重共线性的影响多重共线性的影响3. 多重共线性的诊断多重共线性的诊断4. 多重共线性的处理多重共线性的处理二、多重共线性二、多重共线性什么是多重共线性什么是多重共线性o 多重共线性(多重共线性(multicollinearity):回归模型中的一些或回归模型中的一些或全部解释变量之间存在一定程度的线性关系全部解释变量之间存在一定程度的线性关系)(eXXXeXXX0.b)(XXXX
6、XX0.auXXXYikikiiikikiikkikiikikiikikikiii010001112121221111121212211122110 或或:令令,、的的不不同同时时为为多多重重共共线线性性:存存在在一一组组或或:令令,、的的不不同同时时为为完完全全共共线线性性:存存在在一一组组对对于于什么是多重共线性什么是多重共线性例题例题4.1其他例题:其他例题:p200X1 X2X3X410555267158075251895973424125129183015515289:低度多重共线性:低度多重共线性:高度多重共线性:高度多重共线性:完全共线性:完全共线性253209959011413
7、12.r.rr 什么是多重共线性什么是多重共线性图形表示:巴伦坦图图形表示:巴伦坦图YX1X2YX1 X2低度多重共线性低度多重共线性高度多重共线性高度多重共线性什么是多重共线性什么是多重共线性产生多重共线性的原因产生多重共线性的原因1) 样本过小样本过小2) 模型设定有误:添加了过多的解释变量模型设定有误:添加了过多的解释变量v 由于样本过小,即便在总体中解释变量之间没有线性关系由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系,也可能在获得的样本中观察到较强的线性关系多重共线性的影响多重共线性的影响存在完全线性关系时的存在完全线性关系时的OLS估计
8、估计o 无法得到无法得到OLS估计量估计量例题:例题:p201-20221010203322033211201021013322110 、已已知知,但但无无法法得得到到、,虽虽然然和和只只能能得得到到估估计计实实际际上上只只有有两两个个,根根据据这这样样,真真正正的的解解释释变变量量则则有有:若若,对对于于OLSuXXuXX)()(YXXuXXXYiiiiiiiiiiiiii 多重共线性的影响多重共线性的影响存在多重共线性关系时的存在多重共线性关系时的OLS估计估计o 可以证明即便存在多重共线性,可以证明即便存在多重共线性,OLS估计量仍然是估计量仍然是BLUE,但系数估计量的方差较大,从而不
9、容易通过但系数估计量的方差较大,从而不容易通过t检验,同时预检验,同时预测区间变宽,降低了预测精确度。测区间变宽,降低了预测精确度。 )(VarR)(VarRXTSS)(Var)(SE)R(TSS)(Varjjjjjjjjjjj ,则则特特别别地地,若若越越大大。越越大大,从从而而则则联联程程度度越越强强,与与其其他他自自变变量量的的线线性性关关这这样样,如如果果,和和计计算算出出对对于于给给定定的的样样本本,可可以以;11122222例题:例题:p202-203多重共线性的影响多重共线性的影响影响程度的度量:方差膨胀因子(影响程度的度量:方差膨胀因子(variance-inflation f
10、actor)越越大大越越大大,从从而而则则共共线线性性程程度度越越高高,与与其其他他解解释释变变量量的的多多重重易易知知,如如果果定定义义方方差差膨膨胀胀因因子子:,有有对对于于jjjjjjjjVIFRXRVIF),R(TSS)(Vark,j222211111 多重共线性的影响多重共线性的影响例题例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.26 10.26A0.9950.25 50.25A)(Varj jjjjTSSAVIFTSS)(Var 22 )(SEj AA15. 1A40. 2A20. 3A.097多重共线性的诊断多重共线性
11、的诊断简单诊断方法简单诊断方法o R2高而单个系数的高而单个系数的t值小,换言之,值小,换言之,F检验显著,但显著的检验显著,但显著的t值少值少o 任意两个解释变量之间的相关系数较大,比如大于任意两个解释变量之间的相关系数较大,比如大于0.9o 解释变量之间的偏相关系数较大解释变量之间的偏相关系数较大F简单方法一般来说不很精确简单方法一般来说不很精确多重共线性的诊断多重共线性的诊断运用回归分析进行诊断运用回归分析进行诊断o 逐步分析法:先引入经济意义明显,并且在统计上最显著的逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释解释变量,然后逐
12、步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或变量使原有解释变量的系数估计值发生明显变化,或t统计量统计量明显变小,则说明新引入的解释变量与原有解释变量之间存明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量在多重共线性,可以去掉新引入的解释变量o 辅助回归法:做每一个解释变量对其余解释变量的回归,得辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的出相应的F统计值,如果在给定的显著性水平统计值,如果在给定的显著性水平下下F统计值是显统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,著的,说明该解
13、释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(可以去掉该解释变量(p207,p211)多重共线性的诊断多重共线性的诊断运用一些指标进行诊断运用一些指标进行诊断1) 方差膨胀因子:计算每个解释变量的方差膨胀因子方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一一般认为如果般认为如果VIF大于大于10,说明该变量与其他变量存在高度共,说明该变量与其他变量存在高度共线性线性2) 容许度(容许度(tolerance):):定义容许度定义容许度TOL如下,一般认为如如下,一般认为如果果TOL小于小于0.1,说明该变量与其他变量存在高度共线性,说明该变量与其他变量存在高度共线性3) 条件指
14、数(条件指数(condition index, CI):):一般认为,如果条件指一般认为,如果条件指数在数在10到到30之间,存在较强的多重共线性,如果大于之间,存在较强的多重共线性,如果大于30,则,则存在严重的多重共线性存在严重的多重共线性jjjVIFRTOL112 多重共线性的诊断多重共线性的诊断例题例题4.3(p218)YConsumptionX1IncomeX2 Wealth708081065100100990120127395140142511016016331151801876120200205214022022011552402435150260268625.16602. 01
15、3.482:9531. 0,9635. 0,9990. 04019.92, 7,10)615. 0()290. 0()008. 0()526. 0()144. 1()669. 3()081. 0()823. 0()752. 6(042. 0942. 0775.242121221221 CITOLTOLVIFVIFsdiagnostictyCollineariRRrFdfnptseXXYiii例题:例题:p209-211多重共线性的诊断多重共线性的诊断几点说明几点说明o 多重共线性是一个程度问题而不是存在与否的问题多重共线性是一个程度问题而不是存在与否的问题o 多重共线性是关于样本的一种特征多重
16、共线性是关于样本的一种特征o 如果研究是为了估计斜率系数和预测,多重共线性不是一个如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大重共线性的危害就很大多重共线性的处理多重共线性的处理1) 剔除共线性变量中不太重要的解释变量剔除共线性变量中不太重要的解释变量2) 补充新数据补充新数据3) 重新设定模型重新设定模型o 练习题:练习题:p216-217,习题,习题10.14-10.19 1. 什么是异方差性什么是异方差性2. 异方差性的影响异方差性的影响3. 异方差性的诊断
17、异方差性的诊断4. 异方差性的处理异方差性的处理三、异方差性三、异方差性什么是异方差性什么是异方差性o 异方差性(异方差性(heteroscedasticity):回归模型误差项的方回归模型误差项的方差不相同差不相同o 同方差性(同方差性(homoscedasticity):回归模型误差项的方差回归模型误差项的方差不相同不相同2212212212221222110 )X,X,X|Y(Var)X,X,X|Y(Var)X,X,X|u(E)u(Var)X,X,X|u(E)u(VaruXXXYkiiiiikiiiikiiiiiikiiiiiikikiii同同方方差差性性:异异方方差差性性:也也即即:同
18、同方方差差性性:异异方方差差性性:对对于于什么是异方差性什么是异方差性同方差性同方差性XY概概率率密密度度X:受教育年限受教育年限Y:工资工资什么是异方差性什么是异方差性异方差异方差性性XY概概率率密密度度X:收入收入Y:消费支出消费支出什么是异方差性什么是异方差性异方差性异方差性XY概概率率密密度度X:时间时间Y:打字错误打字错误例题:例题:p220-224什么是异方差性什么是异方差性产生异方差性的原因产生异方差性的原因原因原因解释变量:收入解释变量:收入被解释变量:消费支出被解释变量:消费支出解释变量与误差项相关解释变量与误差项相关随着收入的增加,支出差异性更大随着收入的增加,支出差异性更
19、大有重要的解释变量未被有重要的解释变量未被包含在回归模型中包含在回归模型中物价也是影响支出的因素,物价上物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大钱来消费,因而支出差异性更大异常值(异常值(outliers)异方差性的影响异方差性的影响1)回归系数回归系数的的OLS估计量虽然是无偏的、一致的,但不再估计量虽然是无偏的、一致的,但不再是有效的是有效的2)回归标准差的估计不再是无偏的回归标准差的估计不再是无偏的3)回归系数回归系数OLS估计量的方差估计不再是无偏的,因而估计量的方差估计不再是无偏的,因而t统计量不再服从统计
20、量不再服从t分布,分布,F统计量不再服从统计量不再服从F分布,从而分布,从而无法进行区间估计和假设检验无法进行区间估计和假设检验4)无法根据回归结果进行预测无法根据回归结果进行预测异方差性的诊断异方差性的诊断1)图解法图解法2)布罗施布罗施-培甘检验(培甘检验(Breusch-Pagan test)3)怀特检验(怀特检验(White test)4)帕克检验(帕克检验(Park test)5)Glesjer test6)戈德菲尔德戈德菲尔德-匡特检验(匡特检验(Goldfeld-Quandt test )异方差性的诊断异方差性的诊断图解法图解法在同方差假定下作回归分析,用残差项平方与解释变量做散
21、点图在同方差假定下作回归分析,用残差项平方与解释变量做散点图 2uX异方差性的诊断异方差性的诊断图解法:简便处理图解法:简便处理o 用残差项平方与因变量拟合值做散点图用残差项平方与因变量拟合值做散点图 2u Y异方差性的诊断异方差性的诊断例题例题4.4(p222)o 1988年美国公司销售额与研发支出的关系年美国公司销售额与研发支出的关系4457. 0,4783. 0,669.14,17,18)001. 0()848. 0()830. 3()195. 0()008. 0()985.990(032. 0993.19222 RRFdfnptsesaleRDii异方差性的诊断异方差性的诊断例题例题4
22、.4SALE3000002000001000000RES1_SQ6000000050000000400000003000000020000000100000000-10000000异方差性的诊断异方差性的诊断布劳殊布劳殊-培干检验(培干检验(Breusch-Pagan test)即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到到的的作作为为因因变变量量做做以以下下模模型型用用方方法法估估计计出出每每个个根根据据模模型型用用假假定定:对对于于pHdknRpcvXXuROLSubuOLSavXXuX
23、XYiuikikiiuiiikikiiikikii222022110222211021101:.)(., 异方差性的诊断异方差性的诊断例题例题4.4 :BP Test方方差差的的假假设设所所以以可可以以拒拒绝绝误误差差项项同同84. 3)1(996. 32220. 0, 1,18)048. 0()842. 0(232.86974469205. 0222 nRRknpsaleuii异方差性的诊断异方差性的诊断怀特检验(怀特检验(White test)即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到
24、到做做以以下下模模型型的的方方法法估估计计出出每每个个根根据据模模型型用用对对于于pHdnRpcvXXXXXXvXXXXXXuROLSbuOLSauXXXYiuiiiiiiiiiiiiuiiiiiiiii222022329318217262524332211022233221101321:.)9(., 异方差性的诊断异方差性的诊断怀特检验的特例怀特检验的特例即即存存在在异异方方差差性性说说明明可可以以拒拒绝绝原原假假设设,统统计计量量是是显显著著的的,如如果果对对于于构构造造统统计计量量回回归归,得得到到做做以以下下模模型型的的和和方方法法估估计计出出每每个个根根据据模模型型用用对对于于pHd
25、nRpcvYYuROLSbYuOLSauXXYiuiiiiuiiikikii22202222102221101:.)2(., 异方差性的诊断异方差性的诊断例题例题4.4 :White Test差差的的假假设设,可可以以拒拒绝绝误误差差项项同同方方如如果果选选定定差差的的假假设设,不不能能拒拒绝绝误误差差项项同同方方如如果果选选定定10. 005. 061. 4)2(375. 599. 5)2(375. 52896. 0, 2,18)251. 0()089. 0()351. 0(0005. 0351.2296219665210. 02205. 02222 nRnRRknpsalesaleuiii
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 线性 回归 模型 扩展
限制150内