模型的建立与估计中的问题及对策PPT教案.pptx
《模型的建立与估计中的问题及对策PPT教案.pptx》由会员分享,可在线阅读,更多相关《模型的建立与估计中的问题及对策PPT教案.pptx(155页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模型的建立与估计中的问题模型的建立与估计中的问题(wnt)及对策及对策第一页,共155页。2 2经典假设经典假设(jish)与违背假设与违背假设(jish)的情的情况:况:异方差异方差自相关自相关多重共线性多重共线性第1页/共155页第二页,共155页。3 34.1 误设定误设定(sh dn)模型设定偏误主要有两大类模型设定偏误主要有两大类解释变量选取的偏误,主要包解释变量选取的偏误,主要包括漏选相关括漏选相关(xinggun)变量变量和多选无关变量。和多选无关变量。模型函数形式选取的偏误。模型函数形式选取的偏误。当模型(mxng)设定出现偏误时,模型(mxng)估计结果也会与“实际”有偏差。
2、这种偏差的性质及程度与模型(mxng)设定偏误的类型密切相关。第2页/共155页第三页,共155页。4 4遗漏遗漏遗漏遗漏(ylu)(ylu)相关变量(相关变量(相关变量(相关变量(omitting relevant omitting relevant variablesvariables)例如,如果例如,如果例如,如果例如,如果(rgu)“(rgu)“(rgu)“(rgu)“正确正确正确正确”的模型为的模型为的模型为的模型为:而我们将模型而我们将模型(mxng)(mxng)设定为设定为:即设定模型时漏掉了一个相关的解释变量。即设定模型时漏掉了一个相关的解释变量。这类错误称为遗漏相关变量。这类
3、错误称为遗漏相关变量。模型中遗漏了对因变量有显著影响的解释变量将使模型参数估计量不再是无偏估计量。第3页/共155页第四页,共155页。5 5误选无关误选无关误选无关误选无关(wgun)(wgun)变量变量变量变量(including irrevelant (including irrevelant variables)variables)例如,如果例如,如果例如,如果例如,如果(rgu)(rgu)为为为为“真真真真”,但我们将模型设定为,但我们将模型设定为,但我们将模型设定为,但我们将模型设定为:即设定模型时,多选了一个无关即设定模型时,多选了一个无关(wgun)(wgun)解释变量。解释变
4、量。这类错误称为误选无关这类错误称为误选无关(wgun)(wgun)变量。变量。模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。第4页/共155页第五页,共155页。6 6错误错误错误错误(cuw)(cuw)的函数形式的函数形式的函数形式的函数形式(wrong functional (wrong functional form)form)例如例如例如例如(lr)(lr)(lr)(lr),如果,如果,如果,如果“真实真实真实真实”的回归函数为的回归函数为的回归函数为的回归函数为:但却将模型但却将模型(mxng)(mxng)设定为设定为:这就是设定了错误的函数形式。这
5、就是设定了错误的函数形式。这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。第5页/共155页第六页,共155页。7 7解决解释变量误设定问题(wnt)的原则在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大(zn d)误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。第6页/共155页第七页,共155页。8 8理
6、论:从理论上看,该变量是否应该作为解释变量包括(boku)在方程中?t检验:该变量的系数估计值是否显著?:该变量加进方程中后,是否增大?偏倚:该变量加进方程中后,其它变量的系数估计值是否显著变化?如果对四个问题的回答都是肯定的,则该变量应该如果对四个问题的回答都是肯定的,则该变量应该(ynggi)包包括在方程中;如果对四个问题的回答都是括在方程中;如果对四个问题的回答都是“否否”,则该变量是无关则该变量是无关变量,可以安全地从方程中删掉它。这是两种容易决策的情形。变量,可以安全地从方程中删掉它。这是两种容易决策的情形。选择解释变量(binling)的四条准则第7页/共155页第八页,共155页
7、。9 9在很多情况下,这四项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后,增大,但该变量不显著。在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位,再多的统计证据(zhngj)也不能将一个理论上很重要的变量变成“无关”变量。在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。第8页/共155页第九页,共155页。1010检验(jinyn)模型误设定的RESET方法拉姆齐(J.B.Ramsey)于1969年提出了一种(y zhn)回
8、归设定误差检验法(RESET法)。RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。第9页/共155页第十页,共155页。1111直观地看,这些添加的项是任何可能的遗漏变量或直观地看,这些添加的项是任何可能的遗漏变量或直观地看,这些添加的项是任何可能的遗漏变量或直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过错误的函数形式的替身,如果这些替身能够通过错误的函数形式的替身,如果这些替身能够通过错误的函数形式的替身,如果这些替身能够通过F F 检验检验检验
9、检验,表明它们改善了原方程的拟合状况,则我们表明它们改善了原方程的拟合状况,则我们表明它们改善了原方程的拟合状况,则我们表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。有理由说原方程存在误设定问题。有理由说原方程存在误设定问题。有理由说原方程存在误设定问题。等项形成多项式函数形式,多项式是等项形成多项式函数形式,多项式是等项形成多项式函数形式,多项式是等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置一种强有力的曲线拟合装置一种强有力的曲线拟合装置一种强有力的曲线拟合装置(zhungzh)(zhungzh),因而如,因而如,因而如,因而如果存在误设定,则用这样一个装置
10、果存在误设定,则用这样一个装置果存在误设定,则用这样一个装置果存在误设定,则用这样一个装置(zhungzh)(zhungzh)可可可可以很好地代表它们。以很好地代表它们。以很好地代表它们。以很好地代表它们。第10页/共155页第十一页,共155页。1212(1)用用OLS法估计要检验的方程,得到法估计要检验的方程,得到(2)由由上上一一步步得得到到的的值值 (i=1,2,n),计计算算 ,然然后后用用OLS法估计:法估计:(3)用用F检检验验比比较较两两个个方方程程的的拟拟合合情情况况,如如果果两两方方程程总总体体拟拟合合情情况况显显著著不不同同,则则我我们们得得出出(d ch)原原方方程程可
11、可能能存存在在误误设设定定的的结结论论。使使用的检验统计量为:用的检验统计量为:RESET检验法的步骤(bzhu)第11页/共155页第十二页,共155页。1313 RSSM为为第第一一步步中中回回归归的的残残差差平平方方和和,RSS为为第第二二步步中中回回归归的残差平方和,的残差平方和,M为约束条件的个数,这里是为约束条件的个数,这里是M=3。注注意意:拉拉姆姆齐齐RESET检检验验仅仅能能检检验验误误设设定定的的存存在在,而而不不能能告告诉诉我我们们到到底底是是哪哪一一类类的的误误设设定定,或或者者说说,不不能能告告诉诉我我们们正正确确的的模模型型是是什什么么。但但该该方方法法毕毕竟竟能能
12、给给出出模模型型误误设设定定的的信信号号,以以便便我我们们去去进进一一步步查查找找问问题题。另另一一方方面面,如如果果(rgu)模模型型设设定定正正确确,RESET检检验验使使我我们们能能够够排排除除误误设设定定的的存存在在,转转而而去去查找其它方面的问题。查找其它方面的问题。第12页/共155页第十三页,共155页。1414软件软件(run jin)(run jin)实现实现EviewsEviews实现实现(shxin)(shxin)的步骤:的步骤:方程窗口方程窗口ViewViewStability Stability TestsTestsRamsey RESET TestRamsey RE
13、SET Test输入输入Number of fittedNumber of fittedOKOK。第13页/共155页第十四页,共155页。15154.2 多重共线性多重共线性 多重共线性的概念 多重共线性产生的原因及后果(hugu)多重共线性的检验 解决多重共线性问题的方法 实例第14页/共155页第十五页,共155页。1616一、多重共线性的概念一、多重共线性的概念(ginin)定义:如果某两个或多个解释变量高度定义:如果某两个或多个解释变量高度(god)线性线性相关,则称模型中存在多重共线性相关,则称模型中存在多重共线性(Multicollinearity)。对于模型 Yi=0+1X1i
14、+2X2i+kXki+ui,i=1,2,n,其基本假设之一是解释变量是互相独立的。表示为矩阵的秩,有rank(X)=k+1n,即解释变量之间不存在严格的线性关系,观测(gunc)值个数大于待估参数的个数。第15页/共155页第十六页,共155页。1717 如果存在(cnzi)c1X1i+c2X2i+ckXki=0,i=1,2,n,其中 ci 不全为0,则称为解释变量间存在(cnzi)完全的多重共线性(perfect multicollinearity)如果存在(cnzi)c1X1i+c2X2i+ckXki+vi=0,i=1,2,n,其中ci不全为0,vi 为随机误差项,则称为近似的多重共线性(
15、approximate multicollinearity)第16页/共155页第十七页,共155页。1818 在矩阵表示在矩阵表示(biosh)(biosh)的线性回归模型的线性回归模型Y=XY=X+u+u中,完全的多重共线性指:中,完全的多重共线性指:rank(X)k+1rank(X)k+1,即即中,至少有一列向量可由其他中,至少有一列向量可由其他(qt)列向量(不包括列向量(不包括第一列)线性表出。第一列)线性表出。如:X2=X1,则 X2 对 Y 的作用(zuyng)可由 X1 代替。第17页/共155页第十八页,共155页。1919二、多重共线性产生二、多重共线性产生二、多重共线性产
16、生二、多重共线性产生(chnshng)(chnshng)(chnshng)(chnshng)的原因的原因的原因的原因及后果及后果及后果及后果主主要要(zhyo)原原因因包包括括以以下下三三个方面:个方面:经济变量共同的变动趋势 时间序列(xli)数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第18页/共155页第十九页,共155页。2020 滞后变量的引入 在经济计量模型(mxng)中,往往需要引入滞后经济变量来反映真实的经济关系。例如:消费=f(当期
17、收入,前期收入)显然,两期收入间具有较强的线性相关性。第19页/共155页第二十页,共155页。2121 样本资料(zlio)的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。例如:消费=f(收入,财富水平),当我们获得收入和财富的样本数据时,两个自变量可能高度相关。我们很难找到足够多的财富少而收入高的样本。第20页/共155页第二十一页,共155页。2222 一般来说,简单线性模型中涉及到时间序列数据样本时往往会存在多重共线性;而对于截面(jimin)数据样本,问题不那么严重,但多重共线性仍然是存在的。在多元线性回归模型中,我们关心的并不是多重共线性
18、的有无,而是多重共线性的程度。当多重共线性的程度较高时,会给最小二乘估计量带来严重的后果。如何如何(rh)看待多重共线性呢?看待多重共线性呢?第21页/共155页第二十二页,共155页。2323多重共线性的后果多重共线性的后果多重共线性的后果多重共线性的后果(hugu)(hugu)(hugu)(hugu)的的OLS估计量为:估计量为:完全(wnqun)共线性下参数估计量不存在 如果存在完全共线性,则必有 ,故(XX)1 不存在,因此无法得到参数的估计量。第22页/共155页第二十三页,共155页。24例:对于例:对于(duy)二元线性回归模型二元线性回归模型 如果两个解释如果两个解释(jish
19、)变量完全相关,如变量完全相关,如X2=X1,则二元模型就会退化为一元线性回归模型:,则二元模型就会退化为一元线性回归模型:这时,只能这时,只能(zh nn)确定综合参数确定综合参数 1+2 的估的估计值:计值:第23页/共155页第二十四页,共155页。2525 近近 似似 共共 线线 性性 下下,可可 以以(ky)(ky)得得 到到OLSOLS参参数数估估计计量量,但但参参数数估估计计量量方方差差的的表达式为:表达式为:由于(yuy)|XX|0,引起(XX)-1 主对角线元素较大,即使得参数估计值的方差增大,估计值的精度降低。近似(jn s)共线性下OLS估计量的方差增大第24页/共155
20、页第二十五页,共155页。26仍以二元线性模型仍以二元线性模型(mxng)为例为例:恰为恰为 X1与与 X2的线性相关系数的平方的线性相关系数的平方r 2由于由于(yuy)r 2 1,故,故 1/(1-r2)1。第25页/共155页第二十六页,共155页。2727 多重共线性使参数估计值的方差增大多重共线性使参数估计值的方差增大多重共线性使参数估计值的方差增大多重共线性使参数估计值的方差增大(zn d)(zn d),1/(1-r 2)1/(1-r 2)为方差膨胀因子为方差膨胀因子为方差膨胀因子为方差膨胀因子(Variance Inflation(Variance Inflation Facto
21、r,VIF)Factor,VIF)当完全当完全(wnqun)不共线时不共线时,r 2=0 当近似(jn s)共线时,0 r 2 10作为存在严重作为存在严重(ynzhng)多重共线性的标准多重共线性的标准,特别在解释变量多的情形应当如特别在解释变量多的情形应当如此。此。需要指出的是,所有(suyu)VIF值都低,并不能排除严重多重共线性存在的可能性。第34页/共155页第三十五页,共155页。3636 条件指数高,表明存在多重共线性。条件指数高,表明存在多重共线性。“经验经验(jngyn)法则法则”告诉我们:告诉我们:CI在在5到到10之间为弱之间为弱相关性;在相关性;在10到到30之间为中强
22、度多重共线性,而之间为中强度多重共线性,而大于大于30表明存在严重的多重共线性。表明存在严重的多重共线性。3.通过条件指数通过条件指数(zhsh)检验检验第35页/共155页第三十六页,共155页。3737四、解决多重共线性问题四、解决多重共线性问题(wnt)(wnt)的方法的方法方法一、增加数据多重共线性实质上是样本的问题,或者说是数据问题,因此,增加数据就有可能消除(xioch)或减缓多重共线性。具体方法包括增加观测值、将时间序列数据与截面数据并用或采用新的样本等。当然,如果解释变量的总体存在多重共线性,那么增加样本容量就不能降低解释变量之间的线性关系。第36页/共155页第三十七页,共1
23、55页。3838在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差。最典型的例子是在CobbDouglas生产函数(hnsh)中加进规模报酬不变的约束,可以解决资本和劳动的高度相关而引起的多重共线性问题。方法二、对模型施加方法二、对模型施加(shji)某些约束条件某些约束条件第37页/共155页第三十八页,共155页。3939这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可根据(gnj)经典理论和假设检验的结果确定。另一种思路就是在建模的过程中避免引入共线性较大的变量,具体可以采用逐步回归的方法。方法方法
24、方法方法(fngf)(fngf)三、略去一个或几个共线变量三、略去一个或几个共线变量三、略去一个或几个共线变量三、略去一个或几个共线变量第38页/共155页第三十九页,共155页。4040逐步回归法逐步回归法逐步回归法逐步回归法 以 Y 为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。如果(rgu)拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果(rgu)拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。第39页/共155页第四十页,共155页。41411.用被解释变量分别对每个解释变量进行线性回归,根据经
25、济理论和统计检验从中选择一个最合适的回归方程作为基本回归方程,通常选取拟合(n h)优度最大的回归方程。2.在基本回归方程中逐个增加解释变量,重新进行线性回归:若新变量的引入提高了R2,并且回归方程中的其他参数统计上仍然显著,就在模型中保留该解释变量;若新变量的引入未能改进R2,则不在模型中保留该解释变量;若新变量的引入提高了R2,且显著地影响了其他回归参数估计值的符号与数值,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,略去较小的。逐步回归法的一般逐步回归法的一般(ybn)步骤:步骤:第40页/共155页第四十一页,共155页。4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模型 建立 估计 中的 问题 对策 PPT 教案
限制150内