《第六章 工具变量回归电子课件计量经济学.pptx》由会员分享,可在线阅读,更多相关《第六章 工具变量回归电子课件计量经济学.pptx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 工具变量回归电子课件计量经济学第六章第六章 工具变量回归工具变量回归 OLS能够成立的最重要条件是解释变量与随机扰动项不相关,若该假设成立,则称解释变量是外生解释变量或具有严格外生性,否则称为内生解释变量或具有内生性。违背这一基本假设的问题称为内生解释变量问题,此时的OLS估计量将是不一致的,即无论样本容量多大,OLS估计量也不会收敛到真实的总体参数。工具变量法作为内生性问题的主要解决方法之一,被广泛运用。6.1 内生性问题内生性问题 6.1 6.1 内生性问题内生性问题 对于模型对于模型 ,(6.1.16.1.1)其基本假设之一是解释变量其基本假设之一是解释变量 是外生变量。如是外生
2、变量。如果存在一个或多个随机变量是内生解释变量,则称原果存在一个或多个随机变量是内生解释变量,则称原模型存在内生解释变量问题。例如,宏观经济的消费模型存在内生解释变量问题。例如,宏观经济的消费方程中被解释变量消费和解释变量收入都是内生变量,方程中被解释变量消费和解释变量收入都是内生变量,两者相互影响,你影响我,我影响你。此时,解释变两者相互影响,你影响我,我影响你。此时,解释变量收入与模型的随机误差项是相关的,因为收入与影量收入与模型的随机误差项是相关的,因为收入与影响消费的其它因素是相关的。假设(响消费的其它因素是相关的。假设(6.1.16.1.1)式中)式中 为内生解释变量,针对内生解释变
3、量问题,可以分为为内生解释变量,针对内生解释变量问题,可以分为以下两种情况:以下两种情况:6.1 6.1 内生性问题内生性问题 1.解释变量与随机干扰项同期无关但异期相关解释变量与随机干扰项同期无关但异期相关即即 (6.1.2)(6.1.3)2.解释变量与随机干扰项同期相关解释变量与随机干扰项同期相关即即 (6.1.4)在实际经济问题中,经济变量往往都具有随机性。但是在单在实际经济问题中,经济变量往往都具有随机性。但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。方程计量经济学模型中,凡是外生变量都被认为是确定性的。内生解释变量问题除了解释变量出现内生变量情况外,还主内生解释变量问
4、题除了解释变量出现内生变量情况外,还主要表现于:解释变量出现滞后被解释变量的情况。也就是当要表现于:解释变量出现滞后被解释变量的情况。也就是当解释变量出现了内生变量,或滞后被解释变量,就产生了内解释变量出现了内生变量,或滞后被解释变量,就产生了内生解释变量问题。内生解释变量为内生变量或滞后被解释变生解释变量问题。内生解释变量为内生变量或滞后被解释变量。量。6.1 6.1 内生性问题内生性问题 例例6.1.1 耐用品存量调整模型耐用品存量调整模型 耐用品的存量耐用品的存量 由前一个时期的存量由前一个时期的存量 和当期和当期收入收入 共同决定:共同决定:(6.1.5)如果模型不存在随机误差项的序列
5、相关性,那如果模型不存在随机误差项的序列相关性,那么随机解释变量么随机解释变量 只与只与 相关,与相关,与 不相关,属于不相关,属于上述第上述第1种情况,解释变量与随机干扰项同期无关但种情况,解释变量与随机干扰项同期无关但异期相关。异期相关。6.1 6.1 内生性问题内生性问题 例例6.1.2 合理预期的消费函数模型合理预期的消费函数模型该模型认为消费该模型认为消费 是由对收入的预期是由对收入的预期 所决定的:所决定的:(6.1.6)在预期收入在预期收入 与实际收入与实际收入 之间存在假设之间存在假设 (6.1.7)的情况下,容易推出合理预期消费函数模型:的情况下,容易推出合理预期消费函数模型
6、:(6.1.8)由式(由式(6.1.8)可知,作为解释变量的)可知,作为解释变量的 与随机干扰项与随机干扰项 高度相关(因为高度相关(因为 与与 高度相关),属于上述第高度相关),属于上述第1种情况,种情况,解释变量与随机干扰项同期相关解释变量与随机干扰项同期相关。6.1 6.1 内生性问题内生性问题 回归分析的一个基本假设是方程的解释变量与回归分析的一个基本假设是方程的解释变量与随机扰动项不相关。但是由于解释变量观测误差的随机扰动项不相关。但是由于解释变量观测误差的存在,用于估计模型参数的数据经常与它们的理论存在,用于估计模型参数的数据经常与它们的理论值不一致;或者由于遗漏了重要的解释变量,
7、使得值不一致;或者由于遗漏了重要的解释变量,使得随机误差项中含有可能与解释变量相关的变量,这随机误差项中含有可能与解释变量相关的变量,这些都可能导致解释变量与随机扰动项的相关。出现些都可能导致解释变量与随机扰动项的相关。出现这种问题时,这种问题时,OLS和和WLS估计量都有偏差且不一致,估计量都有偏差且不一致,因而要采用其他方法估计。最常用的估计方法是工因而要采用其他方法估计。最常用的估计方法是工具变量法。具变量法。6.2 工具变量估计工具变量估计工具变量法(instrument variable,IV)是消除内生性的一种常用方法,应用的基本思路是,当出现内生解释变量,即解释变量与随机误差项相
8、关时,则寻找另一个变量,该变量与内生解释变量高度相关,但与随机误差项不相关,称该变量为工具变量,用其替代内生解释变量参与参数的估计过程。6.2.1 6.2.1 工具变量的选取工具变量的选取工具变量的选择应满足以下条件:工具变量的选择应满足以下条件:(1 1)工具变量必须具有实际经济意义;)工具变量必须具有实际经济意义;(2 2)工具变量与所替代的内生解释变量高度相关,)工具变量与所替代的内生解释变量高度相关,但与随机误差项不相关:但与随机误差项不相关:;(3 3)工具变量与模型中其它解释变量不相关,且模)工具变量与模型中其它解释变量不相关,且模型中的多个工具变量之间不相关。型中的多个工具变量之
9、间不相关。注意一点,工具变量对内生解释变量的替代并不注意一点,工具变量对内生解释变量的替代并不是是“完全完全”替代,即不是用工具变量代换模型中对应替代,即不是用工具变量代换模型中对应的内生解释变量,而是在最小二乘法的正规方程组中的内生解释变量,而是在最小二乘法的正规方程组中用工具变量对内生解释变量进行部分替代。用工具变量对内生解释变量进行部分替代。6.2.2 6.2.2 工具变量法的应用工具变量法的应用 工具变量法是矩估计的一种形式,下面以一元回工具变量法是矩估计的一种形式,下面以一元回归模型为例对该方法的应用进行说明。归模型为例对该方法的应用进行说明。设有一元线性回归模型:设有一元线性回归模
10、型:(6.2.16.2.1)由随机干扰项的条件零均值假设由随机干扰项的条件零均值假设 ,可知,可知 ,这两个式子作为总体矩条件,可得,这两个式子作为总体矩条件,可得对应的样本矩条件为:对应的样本矩条件为:(6.2.26.2.2)整理后,得到正规方程组:整理后,得到正规方程组:(6.2.36.2.3)求解该正规方程组,得到求解该正规方程组,得到6.2.2 6.2.2 工具变量法的应用工具变量法的应用 (6.2.46.2.4)如果解释变量内生,即如果解释变量内生,即 与与 相关,则第二个矩相关,则第二个矩条件不能满足,样本矩条件也就无从谈起,所以,无条件不能满足,样本矩条件也就无从谈起,所以,无法
11、推导出式(法推导出式(6.2.36.2.3)。)。此时我们需要寻找一个工具变量。满足,对应的此时我们需要寻找一个工具变量。满足,对应的样本矩条件为:样本矩条件为:(6.2.56.2.5)可得正规方程组如下:可得正规方程组如下:(6.2.66.2.6)6.2.2 6.2.2 工具变量法的应用工具变量法的应用同上解得:同上解得:(6.2.76.2.7)这种求模型估计参数的方法称为工具变量法,这种求模型估计参数的方法称为工具变量法,称为工具变量法估计量。将上述一元线性回归模型的称为工具变量法估计量。将上述一元线性回归模型的工具变量法推广到多元线性回归模型的情形:工具变量法推广到多元线性回归模型的情形
12、:(6.2.86.2.8)当当 与随机干扰项与随机干扰项 相关,设相关,设 的工具的工具变量为变量为 ,即每一个解释变量均对应一个工,即每一个解释变量均对应一个工具变量。根据工具变量应满足的条件,可知具变量。根据工具变量应满足的条件,可知 满足条满足条件件 。6.2.2 6.2.2 工具变量法的应用工具变量法的应用 假设假设 为内生解释变量,用工具变量为内生解释变量,用工具变量 替替代,可得多元线性模型的正规方程组如下:代,可得多元线性模型的正规方程组如下:(6.2.96.2.9)记记 ,式式(6.2.96.2.9)的矩阵形式可表示为:)的矩阵形式可表示为:(6.2.106.2.10)于是,参
13、数的工具变量估计量为:于是,参数的工具变量估计量为:(6.2.116.2.11)6.2.2 6.2.2 工具变量法的应用工具变量法的应用 需要注意,通常情况下,工具变量矩阵需要注意,通常情况下,工具变量矩阵 由工具由工具变量及原模型中的外生解释变量组成。这是,对于没变量及原模型中的外生解释变量组成。这是,对于没有选择另外的变量作为工具变量的解释变量,可以认有选择另外的变量作为工具变量的解释变量,可以认为用自身作为工具变量。为用自身作为工具变量。6.3 两阶段最小二乘法两阶段最小二乘法6.3 6.3 两阶段最小二乘法两阶段最小二乘法 当对一个内生解释变量寻找到一个工具变量时,当对一个内生解释变量
14、寻找到一个工具变量时,工具变量法或两阶段最小二乘法(工具变量法或两阶段最小二乘法(two stage least two stage least squares,TSLSsquares,TSLS)可以得到参数的一致估计量。而当)可以得到参数的一致估计量。而当对一个内生解释变量寻找到多个工具变量,且不想损对一个内生解释变量寻找到多个工具变量,且不想损失这些工具变量提供的信息时,可以采用两阶段最小失这些工具变量提供的信息时,可以采用两阶段最小二乘法(二乘法(TSLSTSLS)来得到参数的一致估计。下面以二元)来得到参数的一致估计。下面以二元模型为例进行说明。模型为例进行说明。对于二元线性回归模型:
15、对于二元线性回归模型:(6.3.16.3.1)其中,假设其中,假设 为同期内生变量,为同期内生变量,为外生变量。如果为外生变量。如果对内生变量对内生变量 寻找到了两个工具变量寻找到了两个工具变量 ,则两阶段,则两阶段最小二乘估计过程为:最小二乘估计过程为:6.3 6.3 两阶段最小二乘法两阶段最小二乘法 第一阶段,做内生变量第一阶段,做内生变量 关于工具变量关于工具变量 及模及模型中的外生变量型中的外生变量 的的OLSOLS回归,并记录的拟合值:回归,并记录的拟合值:(6.3.26.3.2)第二阶段,以第一阶段得到的第二阶段,以第一阶段得到的 替代原模型中的,替代原模型中的,进行如下进行如下O
16、LSOLS回归:回归:(6.3.36.3.3)上述过程表明,两阶段最小二乘法(上述过程表明,两阶段最小二乘法(TSLSTSLS)本质)本质上属于工具变量法。接下来,考虑多元线性回归模型上属于工具变量法。接下来,考虑多元线性回归模型的矩阵形式:的矩阵形式:(6.3.46.3.4)其中,其中,和和 是因变量向量和解释变量数据矩阵,是因变量向量和解释变量数据矩阵,是是系数向量。系数向量。6.3 6.3 两阶段最小二乘法两阶段最小二乘法 设解释变量设解释变量 的前的前r r(rKrK)个为内生解释)个为内生解释变量。变量。第一阶段(分离出内生变量的外生部分):将每第一阶段(分离出内生变量的外生部分):
17、将每个解释变量个解释变量 分别对所有分别对所有 个工具变量个工具变量 作作OLSOLS回归,其中第回归,其中第 个解释变量个解释变量 ,。得到拟合值得到拟合值 (6.3.56.3.5)其中,其中,为对应于为对应于 的投影矩阵。写成矩阵形的投影矩阵。写成矩阵形式式:(6.3.66.3.6)6.3 6.3 两阶段最小二乘法两阶段最小二乘法 第二阶段(使用此外生部分进行回归):由于第二阶段(使用此外生部分进行回归):由于 是是 的线性组合(参见第一阶段回归),故的线性组合(参见第一阶段回归),故 恰好包含个恰好包含个 工具变量。使用工具变量。使用 为工具变量对原模型为工具变量对原模型(6.3.46.
18、3.4)进行工具变量法估计:)进行工具变量法估计:(6.3.76.3.7)上式的最后一个等号能成立,是由于上式的最后一个等号能成立,是由于 ,其中,投影矩阵其中,投影矩阵 为对为对称幂等矩阵,即称幂等矩阵,即 。因此,可以将。因此,可以将 视为把视为把 对对 进行进行OLSOLS回归而得到,故名回归而得到,故名“两阶段最小二乘法两阶段最小二乘法”。6.4 工具变量的检验工具变量的检验工具变量法作为消除内生性的一种常用方法,要求所寻找的工具变量与随机误差项不相关。这就需要对变量进行相应的检验。6.4.1 6.4.1 解释变量的内生性检验解释变量的内生性检验 解释变量的内生性检验又称为豪斯曼解释变
19、量的内生性检验又称为豪斯曼(HausmanHausman)检验,检验步骤为:)检验,检验步骤为:(1 1)若怀疑)若怀疑 是内生变量,则引入工具变量是内生变量,则引入工具变量 (可以可以多个多个),并对,并对(6.4.16.4.1)作普通最小二乘回归,并将残差值作普通最小二乘回归,并将残差值 保存下来。保存下来。(2 2)再对方程)再对方程(6.4.26.4.2)作普通最小二乘回归。作普通最小二乘回归。(3 3)若)若 显著不为零,则认为解释变量显著不为零,则认为解释变量 是同期内是同期内生变量,否则判断解释变生变量,否则判断解释变 量是同期外生变量。量是同期外生变量。6.4.2 6.4.2
20、过度识别约束检验过度识别约束检验 当一个内生解释变量对应多个工具变量时,可以当一个内生解释变量对应多个工具变量时,可以对该组工具变量的外生性进行检验,这个检验就称作对该组工具变量的外生性进行检验,这个检验就称作过度识别约束检验。检验步骤为:过度识别约束检验。检验步骤为:(1 1)先对模型()先对模型(6.1.16.1.1)进行普通最小二乘回归,并)进行普通最小二乘回归,并计算残差计算残差(6.4.36.4.3)(2 2)若怀疑)若怀疑 是内生变量,且存在是内生变量,且存在 个工具变量个工具变量 ,并对,并对 (6.4.46.4.4)作普通最小二乘回归,同时计算检验作普通最小二乘回归,同时计算检
21、验 的的 统计量。统计量。6.4.2 6.4.2 过度识别约束检验过度识别约束检验(3 3)在原假设成立下,)在原假设成立下,统计量渐进服从自由度为统计量渐进服从自由度为 的的 分布。或利用工具变量进行分布。或利用工具变量进行GMMGMM估估计,计算计,计算 统计量统计量 ,它在原假设成立下,渐近服,它在原假设成立下,渐近服从从 分布。给定显著性水平分布。给定显著性水平 ,若,若 统计量的值统计量的值或者或者 统计量的值大于临界值,则拒绝工具变量统计量的值大于临界值,则拒绝工具变量 的都为外生变量的假设,其中至少有一个为的都为外生变量的假设,其中至少有一个为内生变量。否则,接受原假设。内生变量
22、。否则,接受原假设。6.5 应用应用6.5 应用应用例例 6.5.1 为了研究人口增长的影响因素,我们利用中国相关的数据为样本观测值建立模型。根据理论研究,人口的增长与经济的发展,教育事业的发展有关,因此收集了1978年-2015年的人口自然增长率P,国内生产总值GDP和每十万人口高等学校平均在校生数S的样本数据,人口的增长模型可以写成6.5 应用应用使用使用stata16stata16打开目录打开目录“D:stata16shujuchap06”“D:stata16shujuchap06”中的中的“0601.dta”“0601.dta”数据文件,命令如下:数据文件,命令如下:use“D:sta
23、ta16shujuchap060601.dta”,clearuse“D:stata16shujuchap060601.dta”,clear为了便于后面数据处理,将中文变量用英文字母表示,为了便于后面数据处理,将中文变量用英文字母表示,在在commandcommand窗口输入以下命令:窗口输入以下命令:rename rename 人口自然增长率人口自然增长率 p/*p/*表示人口自热增长率用表示人口自热增长率用p p表示表示*/*/rename rename 国内生产总值亿元国内生产总值亿元 GDP GDPrename rename 每十万人口高等学校平均在校生数人每十万人口高等学校平均在校生数
24、人 s srename rename 资本形成总额亿元资本形成总额亿元 z1 z1rename rename 财政收入亿元财政收入亿元 z2 z26.5 应用应用然后根据方程设定形式,对人口自然增长率然后根据方程设定形式,对人口自然增长率p p和国内和国内生产总值亿元生产总值亿元 GDP GDP分别取对数,并进行普通最小二乘分别取对数,并进行普通最小二乘回归。在回归。在CommandCommand窗口输入以下程序:窗口输入以下程序:gen lnp=log(p)gen lnp=log(p)gen lngdp=log(GDP)gen lngdp=log(GDP)reg lnp lngdp sreg
25、 lnp lngdp spredict u,r/*predict u,r/*表示对回归的残差进行保存表示对回归的残差进行保存*/*/EnterEnter键后得到回归结果如下:键后得到回归结果如下:6.5 应用应用从上述回归结果可以得到如下回归模型:可以看出国内生产总值GDP是影响人口自然增长率P的重要因素,可是国内生产总值GDP与人口自然增长率P之间存在双向因果关系,使得GDP具有内生性,导致估计量是有偏且不一致的。6.5 应用应用6.5 应用应用从上述回归结果可以得到如下回归模型:6.5 应用应用从上述回归结果可以得到如下回归模型:6.5 应用应用6.5 应用应用6.5 应用应用并记录ln(GDP)的拟合值。在Command窗口输入如下命令:predictplngdp/*表示对lngdp进行预测,生成的预测值存储于plngdp*/6.5 应用应用6.5 应用应用6.5 应用应用从上述回归结果可以得到如下回归模型:可以发现,相比原模型的结果,两阶段最小二乘法估计所得的各个系数非常显著,对参数估计值进行了修正。该两阶段最小二乘法估计结果也可以通过在Command窗口中输入如下命令:ivreglnps(lngdp=lnz1lnz2)获得相同的估计结果。本章到此结束
限制150内