《eviews单方程计量经济学模型.pptx》由会员分享,可在线阅读,更多相关《eviews单方程计量经济学模型.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 误设定模型设定误差的类型一般有:遗漏了重要的解释变量;模型包含无关的解释变量;采用了不正确的函数形式。第1页/共80页模型设定误差的检验(1)模型是否包含无关解释变量的检验对模型中是否包含无关解释变量的检验,就是对模型解释变量的参数是否为0的检验(2)模型遗漏重要解释变量和采用错误函数形式的检验 1)残差图示法检验2)一般性设定偏误检验:拉姆齐(Ramsey)的RESET检验第2页/共80页拉姆齐的RESET检验的EViews实现:选择Equation工具栏中的ViewStability TestRamsey RESET Test 功能。第3页/共80页例7本实验采用的数据是美国25家
2、主要金属行业的产出Y、资本投入K以及劳动投入L。(table3-2.wf1)。有人认为估计模型为LnY=LnA+aLnK+bLnL,利用Ramsey RESET检验来判断模型是否存在模型设定误差。检验的原假设是:模型不存在设定误差。第4页/共80页第二节 多重共线性的诊断与对策一般地,如果模型的F很大,F检验通过,但有些系数不能通过t检验,或模型的自变量之间简单相关系数很高,或回归系数的符号与简单相关系数的符号相反,都有理由怀疑存在多重共线性。第5页/共80页另外,方差扩大因子法也是诊断多重共线性的常用手段。其中 是把xj作为因变量,其余p-1个自变量作为自变量建立多元线性回归模型所得的决定系
3、数,也即xj与其余p-1个自变量间的复相关系数。第6页/共80页当存在某变量的VIF,大于10时就可认为自变量间有比较严重的共线性。还可以用所有p个自变量所对应的方差扩大因子的平均数,如远大于10时,表示自变量间存在严重的共线性。EViews不能直接计算自变量的方差扩大因子,需根据前述公式计算得到 第7页/共80页一般情况下并不需要对共线性进行特别的检验,但如果回归方程的可决系数很高,或F值很大,而系数的标准差较大(t值很小),则说明解释变量间存在较严重的多重共线性。第8页/共80页当自变量出现共线性时,应设法消除其影响,一方面从收集数据,增大样本容量考虑,一方面改变模型形式。常用的方法有:剔
4、除法。设法找到引起共线性的变量并给予剔除。这涉及到剔除的准则问题,通常可选择VIF值最大或未通过系数显著性检验的变量进行剔除,剔除时最好结合testdrop检验,检验剔除自变量是否对模型不利。差分法。将原模型变形,在建模过程中在方程定义栏中输入 y-y(-1)x1-x1(-1)xp-xp(-1).差分常常会丢失一些信息,使用时应慎重。第9页/共80页增加样本容量。利用先验信息改变参数的约束形式变换模型的形式逐步回归法主成分回归第10页/共80页 案例案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)成灾面积(X
5、3);农业机械总动力(X4);农业劳动力(X5)已知中国粮食生产的相关数据(case12),建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+第11页/共80页 1 1、用、用OLS法估计上述模型法估计上述模型:R2接近于1;给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第12页/共80页2 2、检验简单相关系数、检验简单相关系
6、数(1)相关系数检验。在命令窗口输入:COR X1 X2 X3 X4 X5,或者在变量组窗口,点击VIEW-CORRELATION 第13页/共80页 2 2、检验简单相关系数、检验简单相关系数发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:第14页/共80页(2)方差膨胀因子检验。先建立每个解释变量对其余解释变量的辅助回归模型。EVIEWS可以调用已建方程的回归系数。调用的格式是:equation_name.contents,其中前面是已建方程的名称,contents包括已建方程中的系数和统计量,常用的有coef(n),表示系数向量矩阵的第n个元素,R2是拟
7、合优度等。这样调用可以重新输入带来的一些不必要的麻烦。第15页/共80页计算X1的VIF值。首先建立一个方程,不妨命名为eqx1。它是以x1为因变量,其余变量为自变量建立的方程,然后在主窗口命令行输入 scalar vifx1=1/(1-eqx1.R2),该命令的意思是建立一个取值为上式的标量vifx1,其中R2是R2.执行后主窗口的左下角状态栏上会出现:“vifx1 successfully created”的字样,同时工作表中产生一个叫做vifx1的新变量。可以查看其值,大于10,就是存在多重共线性。第16页/共80页 3 3、找出最简单的回归形式、找出最简单的回归形式可见,应选第1 1个
8、式子为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36第17页/共80页 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。第18页/共80页第三节 异方差的检验与修正检验的非正式方法检验的正式方法异方差的修正第19页/共80页非正式方法1根据问题的
9、性质在涉及不均匀单位的横截面数据中,异方差可能是常有的情况。2残差的图形检验 利用因变量Y与解释变量X的散点图或者残差平方与X的散点图,对异方差是否存在及其类型作直观的近似的判断 异方差的类型大致可分为递增异方差、递减异方差和复杂异方差三种 第20页/共80页图形检图形检验验第21页/共80页EViews操作Ls y c xGenr e1=residGenr e2=e12Scat e2 x (如果解释变量比较多,则作e2与y的散点图)或者:在eviews中,建立回归模型之后,在方程窗口中点击Resids按钮可以得到模型的残差分布图。第22页/共80页例case15第23页/共80页正式方法帕克
10、检验格里奇检验G-Q检验White检验ARCH检验第24页/共80页帕克检验(Park test)帕克的基本思想是:利用残差平方和序列e2,求Lne2对Lnxi 的回归方程,最后对回归方程作显著性、拟合优度判断,以确定异方差是否存在。第25页/共80页帕克检验步骤用原始样本数据估计模型,求出残差序列,并生成对数序列操作:操作:LS Y C XLS Y C XGENR E1=RESIDGENR E1=RESID GENR E2=E12GENR E2=E12 GENR LNE2=LOG(E2)GENR LNE2=LOG(E2)求X序列的对数序列,并用残差的对数序列对X的对数序列作回归分析操作:操作
11、:GENR X1=LOG(X)GENR X1=LOG(X)LS LNE2 C X1LS LNE2 C X1如果有多个解释变量,则对每个解释变量都做形如以上的回归。如果有多个解释变量,则对每个解释变量都做形如以上的回归。或者作或者作e2对对Y的估计值的回归。的估计值的回归。观察R2、t、F检验,确定原始序列是否有异方差第26页/共80页帕克检验的适用条件:可以是小样本帕克检验的结果:判断有无异方差第27页/共80页格里瑟检验(Glejser)格里瑟检验的基本思想:利用残差绝对值ei序列对Xi进行回归,由回归的显著性、拟合优度判断异方差是否存在。第28页/共80页用原始样本数据估计模型,求出残差序
12、列操作:LS Y C X GENR E1=RESID GENR E2=ABS(E1)用残差绝对值序列与Xih序列进行回归分析 Xih 中的h通常需要选择多种数值进行试算操作:GENR XH=XH(H先赋值)LS E2 C XH经过R2、t、F检验,确定最合适的回归形式第29页/共80页与帕克检验一样,误差项本身可能存在异方差。然而,对于大样本,上述模型能够很好地检测异方差问题。因此格里奇检验可用作大样本的检测工具。第30页/共80页G-Q检验(戈德菲尔德匡特检验)先将样本一分为二,对子样1和子样2分别作回归,然后利用两个子样的残差均方差之比构造统计量进行异方差检验。这个统计量服从F分布。第31
13、页/共80页操作将样本容量为n的样本观察值(Xi,Yi),按解释变量观察值Xi的大小顺序排列。操作:SORT X将序列中间的C=n/4个观察值除去,并将剩下的观察值划分为大小相同的两个子样。每个子样的容量均为(n-c)/2。对每个子样分别求回归方程,并计算各自的残差平方和。子样1的残差平方和用e12表示,子样2的残差平方和用e22表示。操作:用SMPL定义子样区间,用LS作回归(两次)第32页/共80页提出假设:H0:12=22,H1:122212、22是分别对应两个子样的随机项方差构建F统计量:操作:用计算器功能将直接读出的残差平均和相比第33页/共80页检验并决策:根据给定的值,查F分布表
14、得临界值当FF时,认为序列存在异方差例:case 15第34页/共80页G-Q检验的适用条件:大样本G-Q检验的基础:F统计量 G-Q检验的结果:判断有无异方差第35页/共80页White检验White检验是通过建立辅助回归模型的方式来判断异方差性,它不需要关于异方差的任何先验知识,只要求在大样本的情况下即可。第36页/共80页White检验的具体步骤如下:1.用OLS法估计模型,并计算出相应的残差平方,作辅助回归模型:2.计算统计量nR2,其中n为样本容量,R2为辅助回归函数中的未调整的决定系数。3.查卡方分布表,在给定显著性水平下,判断是否存在异方差性。(原假设:不存在异方差)第37页/共
15、80页利用EViews软件可以直接进行White检验。(1)建立回归模型:LS y c x1 x2(2)检验异方差性:在方程窗口中依次点击ViewResidual TestWhite Heteroskedasticity此时可以选择在辅助回归模型中是否包含交叉乘积项(cross terms)。输出结果中obs*R-squared即White检验统计量,由其双侧概率可以判断是否拒绝无异方差性的原假设。例:case 15第38页/共80页例:case2是1950-1987年间美国机动汽油消费量和影响消费量的变量数值。其中各变量表示:QMG-机动车汽油消费量;MOB-汽车保有量;PMG-机动汽油零售
16、价格;POP-人口数;GNP-按照1982年美元计算的GNP;以汽油消费量为因变量,其它变量为自变量,建立一个回归模型。并对美国机动车汽油消费量研究模型进行异方差检验。第39页/共80页ARCH检验 恩格尔(Engel)于1982年提出了一种检验时间序列存在异方差性的方法 这种检验方法不是把随机误差项方差看作xi的函数,而是把其看作其滞后项的函数。第40页/共80页在方程输出结果窗口选择viewResiduallestARCH LM Test,屏幕提示用户指定卡方检验的阶数,系统默认为1,点击OK完成。ARCH检验的特点是:要求变量的观测值为大样本,并且是时间序列数据。第41页/共80页例序列
17、S和X分别代表1951年至1998年我国商品零售物价指数和居民消费价格指数,见case18.以商品零售物价指数序列为因变量,为考察变量间的动态影响,故采用分布滞后模型(通过反复试验,选取了一个相对较好的模型形式),其形式为St=b1Xt+b2Xt-1+b3Xt-2+b4St-1+b5St-3+et对残差序列进行ARCH效应检验第42页/共80页异方差的修正方法一、FGLS二、加权最小二乘法三、模型对数变换法第43页/共80页模型变换法(FGLS)模型变换法是对存在异方差的总体回归方程作适当的代数变换,使之成为满足同方差假定的模型,然后用OLS法估计。变换的关键在于事先对异方差=f(x)的具体形
18、式有一个合理的假设。这个假设可以通过对具体经济问题的经验分析,或者通过格里奇检验、帕克检验提供的信息加以确定。第44页/共80页第45页/共80页加权最小二乘法 对较大的残差平方和赋予较小的权数,对较小的残差平方和赋予较大的权数。命令方式:LS(W=XH)Y C XLS(W=XH)Y C X第46页/共80页菜单方式:在方程窗口点击Estimate按钮;在对话框中点击option;在参数设置对话框中选定Weight Ls方法,并在权数栏中输入权数变量;对估计后的模型,再使用white检验判断是否消除了异方差。第47页/共80页模型对数变换法对各变量取对数,缩小变量值的尺度。Lny=b0+b1l
19、nx+e第48页/共80页第三节 自相关的检验及修正诊断随机项是否存在自相关,就是对误差项进行分析。常用的直观方法是绘制残差序列图,另外还有回归检验和D.W检验、高阶自相关检验。第49页/共80页 然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。基本思路基本思路:第50页/共80页绘制残差序列图。在回归方程结果输出窗口选Procs/Make Residual Series,并在随后出现的对话框中输入残差序列名,可以生成模型的残差序列。观察它的分布图可选View/Actual,Fitted,Residual/Residual Graph 实现,也可通过对已命名的
20、残差序列e进行View/Line Graph操作。如果残差et随t的变化呈现出规律性的变化,如形成锯齿形或循环状的变化,可以断定残差序列存在相关。第51页/共80页回归检验法。首先应用OLS估计模型并求出E的估计值即残差项e,然后以et为被解释变量,以各种可能的相关变量如et-1、et-2等作为自变量进行线性拟合。对各种拟合形式进行统计检验,选择显著的最优的拟合形式作为序列相关的具体形式。用这种方法,确定自相关的同时也确定了自相关的形式,适用性较强。第52页/共80页 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法回归检验法的优点是:能够确定序列相关的形式;适
21、用于任何类型序列相关性问题的检验。第53页/共80页D.W检验。该方法适用于小样本的一阶自相关情况。应用较为十分普遍,但也存在明显弱点:当回归方程右边存在因变量的滞后项如yt-i(i=1,2)时,检验失效。第54页/共80页 D.W检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 0 dL dU 2 4-dU 4-dL 正相关不能确定无自相关不能确定负相关第55页/共80页高阶自相
22、关检验1.相关图检验偏相关系数是衡量多个变量之间相关程度的重要指标,可以用它来判断自相关性的类型。命令:Ident resid菜单:View/residual test/correlogram-Q-statistics第56页/共80页2.Q统计量检验H0:不存在p阶自相关由于Q统计量的伴随概率要根据自由度来估算,因此一个大的样本容量是保证Q统计量有效的重要因素3.LM检验克服DW检验存在的缺陷。菜单:View/residual test/serial correlation LM test实际中,可以从1阶逐渐向更高阶检验,并用辅助方程中各残差项前参数的显著性来帮助判断序列相关的阶数。第57
23、页/共80页残差序列存在自相关的回归模型,应分析导致自相关的原因,以采取相应的措施。可以采用差分法和Cochrane-Orcutt迭代法直接解决自相关。差分法是用增量数据代替原来的样本数据。它较好地克服了自相关,消除自相关的方法很简单。但该方法得到的方程往往存在拟合不佳,且改变了原有模型的形式,故实际不太常用。第58页/共80页差分法 一阶差分法如果原模型存在完全一阶正相关,那么我们可以用最小二乘法对差分方程求解参数。第59页/共80页 操作:Genr dy=y-y(-1)Genr dx1=x1-x1(-1)Genr dx2=x2-x2(-1)LS dy dx1 dx2 第60页/共80页广义
24、差分法如果原模型存在 可以将原来的模型变换为此时可用最小二乘法得到参数估计量。第61页/共80页 科克伦-奥科特迭代法 以一元线性模型为例:首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i第62页/共80页求出i新的“近拟估计值”,并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i第63页/共80页 类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,
25、就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。第64页/共80页应用软件中的广义差分法应用软件中的广义差分法 在Eview软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。在解释变量中引入AR(1)(1)、AR(2)(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。第65页/共80页例:case17是1950-1987年间美国机动车汽油消费量和影响消费量的变量数据。Y-机动车汽油消费量,X2-机动汽油零售价格,X3-人口数,X4-GNP。第66页/共80页例:case35
26、列出了我国城乡居民储蓄存款年底余额Y(单位:亿元)和GDP指数X(1978=100)的历年统计资料,试建立居民储蓄存款模型,并检验模型的自相关性。N=21,k=2,a=0.05,dL=1.221,dU=1.42N=19,k=2,a=0.05,dL=1.18,dU=1.4第67页/共80页一般是先根据残差图和DW值初步判断模型是否存在自相关性,然后再利用偏相关系数检验或B-G LM检验法进一步确认相关性。第68页/共80页发电量与工农业总产值关系模型Y-发电量X1-经价格调整后的农业总产值X2-经价格调整后的轻工业总产值X3-经价格调整后的重工业总产值Case19第69页/共80页经散点图,发现
27、,Y与X1成线性关系,Y与X2成二次关系,Y与X3成二次关系。可建立模型为:第70页/共80页K=4,n=24,dL=1.10,dU=1.66第71页/共80页工具变量 如果模型中出现随机解释变量并且与随机误差项相关时,普通最小二乘法就不能用于模型参数的估计。最常用的估计方法是工具变量法。第72页/共80页随机解释变量问题主要表现于用滞后被解释变量作为模型的解释变量的情况。而由于经济活动具有连续性,使得这类模型在以时间序列数据作样本的模型中占据较大份额。例如,消费不仅受收入的影响,还受前期消费水平的影响;投资不仅受收入的影响,还受前期投资水平的影响;等等。但是并不是所有包含滞后被解释变量的模型
28、都带来“随机解释变量问题”。第73页/共80页工具变量法(IV)的基本思路是:当随机解释变量与随机误差项相关时,则寻找另一个变量,该变量与随机解释变量高度相关,但与随机误差项不相关,称其为工具变量,用其替代随机解释变量。第74页/共80页选择为工具变量的变量必须满足以下条件:(1)与所替代的随机解释变量高度相关;(2)与随机误差项不相关;(3)与模型中其它解释变量不相关,以避免出现多重共线性。第75页/共80页例:1978-1998年中国国内生产总值GDP,宏观消费CONS,资本总额CAPI数据见case22。建立宏观消费模型(消费与GDP)第76页/共80页模型中宏观消费CONS是随机变量。
29、因为CONS是国内生产总值GDP的一部分,所以GDP也应该是随机变量,这就违反了模型中解释变量非随机的假定。而且GDP也必然与u高度相关,估计结果还显示模型存在严重的自相关,所以应该选择一个工具变量设法替代变量GDP。第77页/共80页资本总额CAPI是GDP的一部分,与GDP高度相关。经计算,以上模型的残差与CAPI的相关系数为-0.03,这在一定程度上说明CAPI与u不相关。基于上述理由,选择CAPI做GDP的工具变量。第78页/共80页菜单操作:从EViews主菜单中点击Quick键,并选择Estimate Equation功能,从而打开Equation Specification(模型设定)对话框。点击Method窗口,两阶段最小二乘估计方法,在Equation Specification选择区输入命令cons c gdp,在Instrument list(列写工具变量)选择区输入命令 c capi命令操作:TSLS Cons c gdp C capi第79页/共80页感谢您的欣赏!第80页/共80页
限制150内