第七章模型选择:标准与检验(新).ppt
《第七章模型选择:标准与检验(新).ppt》由会员分享,可在线阅读,更多相关《第七章模型选择:标准与检验(新).ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二部分实践中的回归分析基本假定违背:基本假定违背:不满足基本假定的情况。(1)模型设定有偏误;所选模型是正确设定的(2)解释变量之间存在多重共线多重共线性;(3)随机误差项序列存在异方差异方差性;(4)随机误差项序列存在序列相关序列相关性。所选模型是正确设定的解释变量之间不存在完全线性关系误差项方差为常数误差项之间不相关基本假定基本假定基本假定基本假定第七章第七章 模型选择:标准与检验模型选择:标准与检验7.1好的好的模型具有的性质模型具有的性质7.2设定误差的类型设定误差的类型7.3遗漏相关解释变量的模型遗漏相关解释变量的模型:过低拟合模型过低拟合模型7.4引入不相关解释变量模型引入不相关
2、解释变量模型:过度拟合模型过度拟合模型7.5不正确的函数形式不正确的函数形式7.6变量的度量误差变量的度量误差 7.7模型设定误差的检验模型设定误差的检验 7.1“好的”模型具有的性质 简约性可识别性拟合优度理论一致性预测能力模型是对现实的抽象,模型应尽可能简洁即能够用少数解释变量能够说明一个被解释变量就不要用多个解释变量每个参数只有一个估计值对样本数据的拟合程度较好参数估计值的符号与经济理论相符预测值与经验值检验模型的有效性,即具有良好的预测能力7.2设定误差的类型:四个 遗漏相关变量采用了错误的函数形式变量的度量误差引入无关变量请注意:实践中的模型设定误差可能源于上述一个或多个原因。对所研
3、究问题的相关理论了解不深未关注本领域前期的研究成果在研究中缺乏相关数据数据测量时有误差设定误差产生的原因 采用遗漏相关变量的模型进行估计而带来的误差称为遗漏相关变量误差遗漏相关变量误差 设正确的模型为 Y=B1+B2X1+B3X2+却错误设定为:Y=A1+A2X1+v7.3遗漏相关变量遗漏相关变量遗漏解释变量将产生如下后果:(1)如如果果漏漏掉掉的的X2与与X1相相关关,使使得得遗遗漏漏变变量量的的模模型型的的最最小小二二乘乘估估计计量量是是有有偏偏的的。即即不不仅仅代代表表了了x1x1对对被被解解释释变变量量的的直直接接影响,还代表了对被解释变量的间接影响(经由影响,还代表了对被解释变量的间
4、接影响(经由x2)x2)。简言之,本应由简言之,本应由x2x2对被解释变量的影响确体现在对被解释变量的影响确体现在x1x1上。上。第第四四章章之之4.9设设定定误误差差,分分析析了了古古钟钟拍拍卖卖价价格格与与钟钟表表年年代代、竞竞标标人人数数的的回回归归,(见见P83)(2 2)错误模型的参数估计量也是不一致的,即参)错误模型的参数估计量也是不一致的,即参数估计值的均值数估计值的均值E(aE(ai i)与其理论值与其理论值A Ai i不相等。不相等。(3)如果如果X2与与X1不相关,则遗漏变量的模型的估计量满足无不相关,则遗漏变量的模型的估计量满足无偏性与一致性。偏性与一致性。(4 4)错误
5、模型的随机误差项方差是真实随机误差方差的有)错误模型的随机误差项方差是真实随机误差方差的有偏估计偏估计(5)错误模型的斜率系数方差也是有偏估计。)错误模型的斜率系数方差也是有偏估计。(6)通常的置信区间和假设检验过程不再可靠,置信区间会通常的置信区间和假设检验过程不再可靠,置信区间会变宽,会更频繁接受零假设。变宽,会更频繁接受零假设。举例:婴儿死亡率的决定因素被解释变量:婴儿死亡率(CM)解释变量:人均国民收入PGNP;女性识字率 FLR正确模型:上述三个变量模型(CM对PGNP、FLR回归)错误模型:遗漏FLR变量的两个变量模型(CM对PGNP回归)结论:不包含女性识字率的双变量模型,错误之
6、处:不仅忽略结论:不包含女性识字率的双变量模型,错误之处:不仅忽略了遗漏变量了遗漏变量“女性识字率女性识字率”对婴儿死亡率的影响,而且,也忽对婴儿死亡率的影响,而且,也忽略了女性识字率对人均国民收入的影响。略了女性识字率对人均国民收入的影响。因此,错误模型中的解释变量因此,错误模型中的解释变量PGNP,就担负起遗漏变量,就担负起遗漏变量“女女性识字率性识字率”对被解释变量(对被解释变量(CM)的影响,从而无法表现出的影响,从而无法表现出PGNP对对CM的真实的影响。的真实的影响。提示:在建立计量经济模型时,需要对所研究现象所蕴含的经提示:在建立计量经济模型时,需要对所研究现象所蕴含的经济理论做
7、深入了解,目的是把相关变量都引入模型中。济理论做深入了解,目的是把相关变量都引入模型中。婴儿死亡率与人均收入女性识字率建立的模型婴儿死亡率与人均收入女性识字率建立的模型正确设定模型正确设定模型:cm=263.6416-0.0056PGNP-2.2316FLR错误设定模型:错误设定模型:cm=157.4244-0.0114PGNP错误模型表明,人均收入每增加1美元,婴儿死亡率平均降低0.01,而该估计结果是错误高估了解释变量对被解释变量的影响,是上偏的。做FLR与PGNP回归即可以看出上偏的结果。FLR=47.5971+0.00256PGNP其斜率系数为b32=0.00256,由正确模型估计结果
8、知,B2=-0.0056,B3=-2.2316,根据式(7-3)得:B2+B3*b32=-0.0056+(-2.2316)*0.00256=-0.0114这与错误模型得到的估计值基本相等。因此,错误设定的模型中遗漏了变量因此,错误设定的模型中遗漏了变量FLR,不仅忽略了,不仅忽略了FLR对对CM的影响,也的影响,也忽略了忽略了FLR对对PGNP的影响,则错误设定模型的变量的影响,则错误设定模型的变量PGNP就只能担负起遗漏就只能担负起遗漏变量变量FLR对对CM的影响。从而也就无法表示的影响。从而也就无法表示PGNP对对CM的真实影响结果。的真实影响结果。包含无关变量偏误包含无关变量偏误:采用包
9、含无关解释变量的模型进行估计带来的偏误。设 Y=0+1X1+v (*)为正确模型,但却估计了错误的模型:Y=0+1X1+2X2+(*)如果2=0,则(*)与(*)相同,因此,可将(*)式视为以2=0为约束的(*)式的特殊形式。即即P86P86,第四章所介绍的,第四章所介绍的“受限最小二乘受限最小二乘”7.4包含无关变量包含无关变量:过度拟合模型过度拟合模型用OLS法估计模型Y=0+1X1+2X2+由于所有的经典假设都满足,因此:(1)OLS估计量无偏的,也是一致的(4)但是,引入多余解释变量的模型的但是,引入多余解释变量的模型的OLS估计量无效,估计量无效,不具有最小方差性不具有最小方差性(2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 模型 选择 标准 检验
限制150内