第五章-模型的建立与估计中的问题及对策.ppt
《第五章-模型的建立与估计中的问题及对策.ppt》由会员分享,可在线阅读,更多相关《第五章-模型的建立与估计中的问题及对策.ppt(145页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 模型的建立与估计中模型的建立与估计中的问题及对策的问题及对策2本章内容本章内容第一节第一节 误设定误设定第二节第二节 多重共线性多重共线性第三节第三节 异方差性异方差性第四节第四节 自相关自相关第五节第五节 随机解释变量随机解释变量3 OLS估估计计量量令令人人满满意意的的性性质质,是是根根据据一一组组假假设设条条件件而而得得到到的的。在在实实践践中中,如如果果某某些些假假设设条条件件不不能能满满足足,则则OLS就就不不再再适适用用于于模模型型的的估估计计。下下面列出实践中可能碰到的一些常见问题:面列出实践中可能碰到的一些常见问题:4 误设定误设定(Misspecificatio
2、n 或或specification error)多重共线性多重共线性(Multicollinearity)异方差性异方差性(Heteroscedasticity或或Heteroskedasticity)自相关自相关(Autocorrelation)随机解释变量随机解释变量(Stochastic explanatory variables)5第一节第一节 误设定误设定 采采用用OLS法法估估计计模模型型时时,实实际际上上有有一一个个隐隐含含的的假假设设,即即模模型型是是正正确确设设定定的的。这这包包括括两两方方面面的的含含义义:函函数数形形式式正正确确和和解解释释变变量量选选择择正正确确。在在实
3、实践践中中,这这样样一一个个假假设设或或许许从从来来也也不不现现实实。我我们们可可能犯下列三个方面的错误:能犯下列三个方面的错误:选择错误的函数形式选择错误的函数形式遗漏有关的解释变量遗漏有关的解释变量包括无关的解释变量包括无关的解释变量从而造成所谓的从而造成所谓的“误设定误设定”问题。问题。6 经济理论通常不会告诉我们因变量和解释变量之间的经济理论通常不会告诉我们因变量和解释变量之间的具体函数形式是什么,解决这个问题,很大程度上要靠计具体函数形式是什么,解决这个问题,很大程度上要靠计量经济工作者在实践中不断摸索。量经济工作者在实践中不断摸索。函数形式选择错误,所建立的模型当然无法反映所研函数
4、形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。这类错误中比较究现象的实际情况,后果是显而易见的。这类错误中比较常见的是有意或无意地将非线性关系作为线性关系处理;常见的是有意或无意地将非线性关系作为线性关系处理;还有一类是非线性关系的选择,比如变量之间是双对数还还有一类是非线性关系的选择,比如变量之间是双对数还是半对数等。这些都需要我们不断实践。是半对数等。这些都需要我们不断实践。函数形式误设定一般都会导致系数的函数形式误设定一般都会导致系数的OLS估计量有偏估计量有偏和不一致。和不一致。一、函数形式误设定一、函数形式误设定7二、二、模型中遗漏有关的解释变量模型中
5、遗漏有关的解释变量 模模型型中中遗遗漏漏了了对对因因变变量量有有显显著著影影响响的的解解释释变变量量的的后后果果是是:将将使使模模型型参参数数估估计计量量不不再再是是无无偏偏估估计计量量。下面用一个简单例子说明。下面用一个简单例子说明。89而由(而由(5-1)有:)有:(5-4)入()入(5-3),得:),得:1011三、三、模型中包括无关的解释变量模型中包括无关的解释变量 模型中包括无关的解释变量,模型中包括无关的解释变量,参数估计量仍无偏,但会参数估计量仍无偏,但会增大估计量的方差,即增大误差增大估计量的方差,即增大误差。我们同样用一个简单例子说明之。我们同样用一个简单例子说明之。设正确模
6、型为:设正确模型为:(5-6)而实际估计的模型是:而实际估计的模型是:(5-7)也就是说,也就是说,X2 与与Y无关,因而应有无关,因而应有 。可以证明可以证明 ,即,即 是真实参数是真实参数 的无偏估计量。的无偏估计量。但是但是由于由于r12一般不等于一般不等于0,因此我,因此我们们有:有:结论结论:模型中包括无关的解:模型中包括无关的解释变释变量,量,参数估参数估计计量量仍无偏,但会增大估仍无偏,但会增大估计计量的方差,即增大量的方差,即增大误误差。估差。估计计参数的置信区参数的置信区间进间进而而变宽变宽,从而使得我,从而使得我们们无法无法认认识识到被解到被解释变释变量与解量与解释变释变量
7、之量之间间的的显显著关系。著关系。而:而:14四、四、选择解释变量的四条原则选择解释变量的四条原则 在模型设定中的一般原则是尽量不漏掉有关的解在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一解释变量包括在方程中作出准确的判断确实不是一
8、件容易的事,因为目前还没有行之有效的方法可供件容易的事,因为目前还没有行之有效的方法可供使用。尽管如此,还是有一些有助于我们进行判断使用。尽管如此,还是有一些有助于我们进行判断的准则可用,它们是:的准则可用,它们是:15选择解释变量的四条准则选择解释变量的四条准则1.理论:理论:从理论上看,该变量是否应该作为解释变从理论上看,该变量是否应该作为解释变量包括在方程中?量包括在方程中?2.t检验:该变量的系数估计值是否显著检验:该变量的系数估计值是否显著?3.:该变量加进方程中后,:该变量加进方程中后,是否增大?是否增大?4.偏倚:偏倚:该变量加进方程中后,其它变量的系数估该变量加进方程中后,其它
9、变量的系数估计值是计值是否显著变化?否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是括在方程中;如果对四个问题的回答都是“否否”,则该变则该变量是无关变量,可以安全地从方程中删掉它。量是无关变量,可以安全地从方程中删掉它。16 但但根根据据以以上上准准则则判判断断并并不不总总是是这这么么简简单单。在在很很多多情情况况下下,这这四四项项准准则则的的判判断断结结果果会会出出现现不不一一致致。例例如如,有有可可能能某某个个变变量加进方程后,量加进方程后,增大,但该变量不显著。增大,但该变量不显著。因因此此,当
10、当这这四四项项用用于于判判断断一一个个变变量量是是否否应应加加进进回回归归方方程程的的准准则则出出现现不不一一致致的的情情况况时时,应应当当特特别别小小心心。在在这这种种情情况况下下,作作出出正正确确判判断断不不是是一一件件容容易易的的事事,但但可可以以让让事事情情变变得得容容易易一一些些,办办法法是是将将理理论论准准则则放放在在第第一一位位,再再多多的的统统计计证证据据也也不不能能将一个理论上很重要的变量变成将一个理论上很重要的变量变成“无关无关”变量。变量。在在选选择择变变量量的的问问题题上上,应应当当坚坚定定不不移移地地根根据据理理论论而而不不是是满满意意的的拟拟合合结结果果来来作作决决
11、定定,对对于于是是否否将将一一个个变变量量包包括括在在回回归归方方程程中中的的问问题题,理理论论是是最最重重要要的的判判断断准准则则。如如果果不不这这样样做做,产产生不正确结果的风险很大。生不正确结果的风险很大。17*五、模型的选择五、模型的选择 上一段讨论了某个解释变量应否包括在模型中的上一段讨论了某个解释变量应否包括在模型中的几条原则。实践中,几条原则。实践中,要解决的一个问题是如何从大量要解决的一个问题是如何从大量的潜在解释变量的集合中选择一个最合适的子集,以的潜在解释变量的集合中选择一个最合适的子集,以得到一个正确设定的模型。得到一个正确设定的模型。上个世纪六十年代后相当一段时间,人们
12、使用逐上个世纪六十年代后相当一段时间,人们使用逐步回归法来解决解释变量的选择问题。这种由计算机步回归法来解决解释变量的选择问题。这种由计算机机械挑选变量的做法如今已不流行了。目前比较通行机械挑选变量的做法如今已不流行了。目前比较通行的做法是从少量精心设定的备选模型中选择一个。的做法是从少量精心设定的备选模型中选择一个。计量经济学家就此提出了很多基于统计学的选择标计量经济学家就此提出了很多基于统计学的选择标准,我们这里讨论其中几种,如表准,我们这里讨论其中几种,如表51所示所示。18令RSSj表示第j个模型(有kj个解释变量)的残差平方和,并定义为第j个模型的的估计值。我们用表示包含全部k个解释
13、变量的模型的估计值。19表51 选择回归模型的准则准则 计算公式 20 1.准则准则希尔(Theil)的准则基于如下假设:所考虑的模型中有一个是正确模型。对于正确模型,对于不正确模型,。因此,选择最小的模型一般就能选出正确模型。由于最小化与最大化是一回事,我们习惯上称该准则为最大准则。这个准则的主要问题是,一个正确模型包括所有解释变量但同时也包括一些无关变量的模型也会给出,在这种情况下,我们所选择的其实并非正确模型。当备选模型包含大量无关变量时,选出正确模型的概率较低。21 2.基于预测的均方误差最小的三个准则基于预测的均方误差最小的三个准则希尔的准则是基于回归的标准误差最小,下列三个准则则是
14、基于预测的均方误差(MSE)最小。这三个准则是:马娄斯(Mallows)的准则霍金(Hocking)的准则阿美米亚(Amemiya)的PC准则假设正确的方程有k个解释变量,我们考虑的方程有个解释变量,问题是如何选择k1以及具体的k1个解释变量的集合。在上述三个预测准则中,这是通过使的均方误差达到最小实现的,其中是Y的未来值,而是预测值。22上述三个准则都是基于预测的均方误差最小,但在估计预测的均方误差时采用的假设有所不同,因而形成各自的计算公式,孰优孰劣,并无定论,在实践中可根据所用软件提供的输出结果选用其中一个作为模型选择的准则。具体做法是比较备选的几个模型的、或PC值,选其中最小的即可。在
15、三个预测准则的情况下,我们感兴趣的是改善预测的MSE,只要能改善,可以去掉某些变量,即便是正确模型中包括它们也在所不惜。23 3.赤池信息准则(赤池信息准则(AIC)赤池信息准则(AkaikesInformationCriterion,AIC)是一个更一般的准则,它可以应用于任何一个可用极大似然法估计的模型。对于我们这里的应用,AIC的计算公式为与赤池信息准则类似的还有施瓦茨信息准则(Schwarzinformationcriterion,SIC或SC):上述两个准则与前述准则一样,可用于模型选择,其值也是越小越好。24六、六、检验误设定的检验误设定的RESET方法方法 前前面面给给出出了了选
16、选择择解解释释变变量量的的四四条条原原则则。可可是是,有有时时这这些些原原则则不不能能提提供供足足够够的的信信息息使使研研究究人人员员确确信信其其设设定定是是最最恰恰当当的的,在在这这种种情情况况下下,可可考考虑虑使使用用一一些些更更正正规规的的检检验验方方法法来来比比较较不不同同估估计计方方程程的的性性质质。这这类类方方法法相相当当多多,这这里里就就不不一一一一列列出出,仅仅介介绍绍拉拉姆姆齐齐(J.B.Ramsey)的的回回归归设设定定误误差差检检验验法法(RESET法法,Regression Specification Error Test)。)。25 RESET检验法的思路检验法的思路
17、 RESET检验法的思路是在要检验的回归方程中检验法的思路是在要检验的回归方程中加进加进 等项作为解释变量,然后看结果是否等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。变量的问题或其它的误设定问题。直观地看,这些添加的项是任何可能的遗漏变直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通量或错误的函数形式的替身,如果这些替身能够通过过F检验检验,表明它们改善了原方程的拟合状况,则我表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。们有理由说
18、原方程存在误设定问题。等项形成多项式函数形式,多项式是一等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在误设定,种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代表它们则用这样一个装置可以很好地代表它们。26RESET检验法的步骤检验法的步骤 拉姆齐拉姆齐RESET检验的具体步骤是:检验的具体步骤是:(1)用用OLS法估计要要检验的方程,得到法估计要要检验的方程,得到 (2)由由 上上 一一 步步 得得 到到 的的 值值 (i=1,2,n),计计 算算 ,然后用,然后用OLS法估计:法估计:(3)用用F检检验验比比较较两两个个方方程程的的拟拟合合情情
19、况况(类类似似于于上上一一章章中中联联合合假假设设检检验验采采用用的的方方法法),如如果果两两方方程程总总体体拟拟合合情情况况显显著著不不同同,则则我我们们得得出出原原方方程程可可能能存存在在误误设设定定的的结结论论。使用的检验统计量为:使用的检验统计量为:27其其中中:RSSM为为第第一一步步中中回回归归(有有约约束束回回归归)的的残残差差平平方方和和,RSS为为第第二二步步中中回回归归(无无约约束束回回归归)的的残残差差平方和,平方和,M为约束条件的个数,这里是为约束条件的个数,这里是M=3。应应该该指指出出的的是是,拉拉姆姆齐齐RESET检检验验仅仅能能检检验验误误设设定定的的存存在在,
20、而而不不能能告告诉诉我我们们到到底底是是哪哪一一类类的的误误设设定定,或或者者说说,不不能能告告诉诉我我们们正正确确的的模模型型是是什什么么。但但该该方方法法毕毕竟竟能能给给出出模模型型误误设设定定的的信信号号,以以便便我我们们去去进进一一步步查查找找问问题题。另另一一方方面面,如如果果模模型型设设定定正正确确,RESET检检验验使使我我们们能能够够排排除除误误设设定定的的存存在在,转转而而去去查查找找其其它它方方面面的的问题。问题。28例例5.1 凯恩斯的绝对收入假说消费函数(例凯恩斯的绝对收入假说消费函数(例3.7)现代经济学家针对消费和储蓄行为提出了许多假现代经济学家针对消费和储蓄行为提
21、出了许多假说,包括凯恩斯的绝对收入假说、杜生贝的相对收入说,包括凯恩斯的绝对收入假说、杜生贝的相对收入假说、莫迪利安尼的生命周期假说和弗里德曼的持久假说、莫迪利安尼的生命周期假说和弗里德曼的持久收入假说等等。在本例中,我们用我国收入假说等等。在本例中,我们用我国19922009年城镇居民人均食品消费和人均可支配收入的实际数年城镇居民人均食品消费和人均可支配收入的实际数据来估计凯恩斯消费函数。据来估计凯恩斯消费函数。方程形式:方程形式:其中:其中:foodp代表食品消费,代表食品消费,yup代表收入。原代表收入。原始数据如下表所示。始数据如下表所示。29年份年份城镇居民家城镇居民家庭人均食品庭人
22、均食品消费(元)消费(元)城镇居民家庭城镇居民家庭人均可支配收人均可支配收入(元)入(元)城镇居民消费城镇居民消费价格指数价格指数(1992=100)城镇居民食品城镇居民食品消费价格指数消费价格指数(1992=100)Cu_foodyupuPu_food1992883.652026.610010019931058.22577.4116.101116.519941422.493496.2145.146153.54719951771.994283169.534187.63419961904.714838.9184.451202.08219971942.595160.3190.174202.0821
23、9981934.55425.1189.029195.81819991941.85854186.582187.20220001971.326280188.082182.33520012027.996859.6189.384182.51720022271.847702.8187.49181.60420032416.928472.2189.187187.77920042709.69421.6195.422204.86720052914.410493198.54211.21820063111.9211759.5201.5216.49820073628.0313785.8210.576241.82820
24、084259.8115780.8222.376276.89320094478.517174.7220.363279.66230由上表可计算出不变价数据由上表可计算出不变价数据(按按1992年不变价年不变价)。年份年份人均食品消费(元)人均食品消费(元)人均可支配收入(元)人均可支配收入(元)foodpyup1992883.652026.601993908.332219.961994926.422408.751995944.382526.331996942.542623.401997961.292713.471998987.912869.9819991037.283137.4920001081.
25、163338.9720011111.123622.0520021250.984108.3820031287.114478.2120041322.624821.1520051379.815285.0820061437.395835.9920071500.256546.7020081538.437096.4420091601.407793.803132为了检验上述模型设定是否正确,采用为了检验上述模型设定是否正确,采用RESET方方法,法,EViews结果如下结果如下(括号内数字为标准误差):括号内数字为标准误差):33由于P=0.00000.05,拒绝无误设定的原假设。34 为了解决例为了解决例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 模型 建立 估计 中的 问题 对策
限制150内