第14章面板数据模型优秀PPT.ppt
第14章面板数据模型1现在学习的是第1页,共34页前言n什么是面板数据(Panel Data)?n面板数据的特征与优势?n面板数据模型的分类:静态与动态。n静态、动态面板数据模型如何进行估计?以及估计量性质如何?计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著2现在学习的是第2页,共34页14.1 面板数据模型 其中:和 分别表示消费和收入。表示两个观测个体。为经典误差项。n例1.居民消费行为分析n将城镇居民和农村居民的时间序列数据组成面板数据,那么模型(5.1.1)可以表述为:(14.1.1)(14.1.2)一、面板数据模型计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著3现在学习的是第3页,共34页n例2.农村居民收入分析 (14.1.3)n面板数据:多个观测对象的时间序列数据所组成的样本数据。n 反映不随个体变化的时间上的差异性,被称为时间效应。n 反映不随时间变化的个体上的差异性,被称为个体效应计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著4现在学习的是第4页,共34页n面板数据的基本特征:其数据结构的二维性。时间序列数据横截面数据 二、面板数据的特征及优势图14.1.1 变量X的面板数据结构计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著5现在学习的是第5页,共34页n面板数据的优势:n1.扩大信息量,增加估计和检验统计量的自由度。n2.有助于提供动态分析的可靠性。n3.有助于反映经济结构、经济制度的渐进性变化。n4.面板数据模型有助于反映经济体的结构性特征。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著6现在学习的是第6页,共34页三、面板数据模型的混合估计 其中:(14.1.5)为经典误差项n面板混合OLS估计:直接把各时间序列或各横截面数据混合起来进行估计。n对于模型(14.1.3),假定个体效应和时间效应为0,则模型为:n缺陷:假定个体间和不同时点的经济关系是同质的。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著7现在学习的是第7页,共34页举例:基于中国28个省市自治区19952005年的面板数据,估计的结果为:t统计值 202.2730 17.2520 5.7464 3.1736p值 0.0000 0.0000 0.0000 0.0017 (14.1.6)计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著8现在学习的是第8页,共34页14.2 固定效应与随机效应 (14.2.1)n固定效应:如果个体效应或时间效应与模型中的解释变量相关。n静态面板数据模型:解释变量中不含被解释变量滞后项的模型。例如(14.2.1)。n面板数据模型的一般形式:n随机效应:如果个体效应或时间效应与模型中的解释变量不相关。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著9现在学习的是第9页,共34页14.3 14.3 静态面板数据模型的估计静态面板数据模型的估计nOLS估计量:有偏的,非一致的。n本质问题本质问题:个体效应(或时间效应)的内生性。n其BLUE是最小二乘虚拟变量(LSDV)法。1 1、LSDVLSDV估计方法估计方法n基本思想:通过虚拟变量把个体效应(和时间效应)从误差项中分离出来,使分离后剩余的误差项与解释变量不相关,以便进行OLS估计。(14.3.1)一、固定效应估计法一、固定效应估计法n估计步骤:如对计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著10现在学习的是第10页,共34页 (14.3.2)n引入虚拟变量,。其中:表示第i个观测个体,表示不是第i个观测个体。则模型(14.3.1)可表述为:n为解决虚拟变量的完全多重共线性,可直接估计模型:(14.3.3)如果 是经典误差项,可以直接对(14.3.3)进行OLS估计。并且 (14.3.4)计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著11现在学习的是第11页,共34页n 举例:对模型(14.1.3)进行LSDV估计,估计结果为:(14.3.5)t统计值 310.5582 35.0807 2.1178 0.6352 p值 0.0000 0.0000 0.0351 0.5258 n 思考:比较LSDV结果(14.3.5)与混合OLS结果 (14.1.6)?判定系数?计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著12现在学习的是第12页,共34页表14.3.1 个体效应的估计结果地 区个体效应地 区个体效应地 区个体效应地 区个体效应北 京-0.1652黑龙江0.1699山 东-0.0614贵 州0.0457天 津-0.1154上 海-0.0700河 南-0.0325云 南-0.0892河 北-0.0572江 苏0.0546湖 北0.0955陕 西-0.3129山 西-0.0177浙 江0.2140湖 南0.0740甘 肃-0.1588内蒙古-0.0150安 徽0.0537广 东0.3291青 海-0.1545辽 宁0.0218福 建0.3129广 西0.2091宁 夏-0.1481吉 林0.0689江 西0.1703四 川-0.0712新 疆-0.3504计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著13现在学习的是第13页,共34页2.LSDV2.LSDV估计方法的直观含义估计方法的直观含义 (14.3.6)(1)分别估计方程(14.3.6)和(14.3.7)(2)估计方程(14.3.8)n含义:变量Y的个体内离差对变量X的个体内离差进行回归,并进行OLS估计。(14.3.7)(14.3.8)n对模型(14.3.3),另一种等价的估计方法步骤:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著14现在学习的是第14页,共34页二、静态面板数据模型的随机效应估计二、静态面板数据模型的随机效应估计nOLS估计量:无偏的,但估计量有较大的方差。n本质问题本质问题:个体(或时间)效应导致了误差项自相关。n其线性无偏最优的估计方法是广义最小二乘法(GLS)。(14.3.9)t统计值 202.1297 35.3193 2.4289 0.4921p值 0.0000 0.0000 0.0157 0.6230n思考:比较GLS(14.3.9)和LSDV(14.3.5)的估计结果?为什么在固定效应估计时没有考虑自相关问题?n举例:对模型(14.1.3)进行GLS估计,估计结果为:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著15现在学习的是第15页,共34页三、豪斯曼检验三、豪斯曼检验n固定效应模型:LSDV估计量无偏;GLS估计量有偏。n随机效应模型:LSDV和GLS估计量都无偏,但LSDV估计量有较大方差;。n固定效应模型:两种估计量的结果就有较大的差异。n随机效应模型:LSDV估计量和GLS估计量的估计结果就比较接近。n豪斯曼检验假设:原假设(H0):随机效应;备选假设(HA):固定效应 检验统计量为:(14.3.10)计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著16现在学习的是第16页,共34页n其中:,分别为回归系数的LSDV估计向量,GLS估计向量;,分别为LSDV估计系数,GLS估计系数的协方差矩阵估计量。n若随机效应为真时,豪斯曼检验统计量:(14.3.11)自由度K为模型中解释变量(不包括截距项)的个数。n 对模型(14.1.3)进行豪斯曼检验,结果为:H4.1777,p值0.2429。接受随机效应的原假设。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著17现在学习的是第17页,共34页14.4 14.4 动态面板数据模型简介动态面板数据模型简介 (14.4.1)n动态面板模型:解释变量中包含被解释变量的滞后项。(14.4.2)其中:为经典误差,n以下分析基于模型(14.4.1)的简化设定形式:n一般表述形式为:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著18现在学习的是第18页,共34页一、动态面板数据模型的内生性问题一、动态面板数据模型的内生性问题n动态面板数据模型:存在固有的内生性。n(1)解释变量 与误差项 都包含个体效应 。n 1.GLS1.GLS估计的有偏和非一致性估计的有偏和非一致性nGLS估计和LSDV估计:有偏的非一致的。n(2)进行差分变换,与 ,都包含共同因素 ,无法消除解释变量的内生性问题。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著19现在学习的是第19页,共34页n 等价于模型:n 显然,和 是相关的,都包含误差 。其中:(14.4.3)n 模型(14.4.2)可以表示为:(14.4.4)2.LSDV2.LSDV估计的有偏和非一致性估计的有偏和非一致性计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著20现在学习的是第20页,共34页其中:为经典误差项二、动态面板模型的广义矩估计方法(二、动态面板模型的广义矩估计方法(GMM)n LSDV、GLS估计:有偏并且非一致的。n对动态面板数据模型(14.4.2):n 要得到 的一致估计量:需为 寻找适当的工具变量。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著21现在学习的是第21页,共34页n工具变量选择的方法:n对模型(14.4.2)取一阶差分:(14.4.5)因为 已经剔除了个体效应 ,同时对于 和 ,都是前定变量,都可以作为模型(14.4.5)中 的工具变量。n工具变量选择的条件:(1)工具变量必须与 不相关,(2)而 与相关。n思考:能作为 工具变量使用吗?计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著22现在学习的是第22页,共34页n基于一个给定的样本,通过求解 (14.4.7)n 思考:只选取 作为模型(14.4.5)中的 工具变量的局限性?单个工具变量对内生解释变量变化信息的反 应能力较差。(14.4.6)nIV估计量求解:如果只选择 作为 的 工具变量,正交的约束条件:可得到 的IV估计量 。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著23现在学习的是第23页,共34页 总体矩条件为:(14.4.8)其中,被称为总体矩,简记为 。,由总体矩条件,可以得到 的广义矩(GMM)估计量或被称为差分GMM估计量。n 总体矩所对应的样本矩:(14.4.9)n当选取 作为工具变量时:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著24现在学习的是第24页,共34页n 其中,是一个列向量,是 所有样本矩组成的列向量。n 根据(14.4.8)对总体矩的约束条件,寻找一个估计值 ,使样本矩向量等于0 0向量。即:(14.4.10)n 注意:(14.4.10)是用多个方程求解一个未知数 。原因是我们为一个内生解释变量选取了多个 工具变量,存在过度识别。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著25现在学习的是第25页,共34页nGMM的估计思想:最小化所有样本矩的平方和。(14.4.11)n其中:函数G被称为GMM目标函数。W是一个对称、正定的加权矩阵。nGMM估计量:就是基于样本矩的加权平方和最小化而得到的估计量。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著26现在学习的是第26页,共34页三、工具变量的选择及其有效性的检验三、工具变量的选择及其有效性的检验n(1)只选取相邻较近的滞后变量作为工具变量,而不再用更早期的那些滞后项。1.关于工具变量选择的两点说明关于工具变量选择的两点说明 (14.4.12)其差分形式为:(14.4.13)此时,GMM工具变量如何选择?n(2)如果模型中包含了外生解释变量,例 如 ,那么要分析的模型为:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著27现在学习的是第27页,共34页2.2.工具变量有效性检验工具变量有效性检验n J 检验:检验过度识别的矩约束条件是否是有效。nJ 检验统计量:GMM目标函数值乘以矩条件的个数。(14.4.14)其中:m为矩条件的个数,k为待估计参数的个数。W为 的加权矩阵,为根据参数向量估计值 得到的样本矩。n 分布:n 原假设:过度识别的矩条件是有效的。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著28现在学习的是第28页,共34页n举例:农村居民收入,在模型(14.1.3)中引入被解释变量的滞后项,即:(14.4.15)n 其差分GMM估计结果为:(14.4.16)t值 24.6656 13.9010 12.2935 2.0219p值 0.0000 0.00000 0.0000 0.0443计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著29现在学习的是第29页,共34页 解释变量的工具变量集为:工具变量个数为28。待估计参数个数为4。如果过度识别的矩约束条件是有效的,那么,n 根据(14.4.14)计算J=25.2211,p=0.3938。不能拒绝“过度识别的据约束条件有效”的原 假设。工具变量是有效的。n过度识别的矩约束条件有效性检验:过度识别的矩约束条件有效性检验:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著30现在学习的是第30页,共34页四、例子:新凯恩斯混合四、例子:新凯恩斯混合Phillips曲线的估计曲线的估计n 新凯恩斯混合Phillips曲线的回归方程可以表述为:(14.4.17)n 举例:基于19922007年中国大陆29个省市区的统计数据对模型(14.4.17)进行差分GMM方法估计。结果为:(14.4.18)t值 186.8387 109.6812 19.7960 12.8279 p值 0.0000 0.0000 0.0000 0.0000 计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著31现在学习的是第31页,共34页 解释变量的工具变量集为:全部工具变量个数为29。待估计参数个数为4。如果过度识别的约束是有效的,那么n 根据(14.4.14)计算J=28.7345,p=0.2752。不能拒绝“过度识别的据约束条件有效”的原 假设。工具变量是有效的。n 过度识别的约束有效性检验:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著32现在学习的是第32页,共34页本章小节本章小节n1.面板数据提供更多的信息,有助于增大估计和检验的自由度,有助于增强动态分析的可靠性,有助于反映经济体的结构性特征和经济制度的渐进性变化。n2.面板模型的混合OLS估计假定不存在个体效应和时间效应,是一种较为粗略的估计方法。n3.如果个体效应 ,时间效应 与模型中的解释变量是相关的,称这种个体效应或时间效应是固定效应。反之,则为随机效应。n4.固定效应模型的本质问题是解释变量的内生性问题,OLS估计量有偏,其最优无偏估计量是LSDV估计量。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著33现在学习的是第33页,共34页n5.随机效应模型的本质问题是误差项的自相关问题,OLS估计量无偏,但有较大的方差。其最优无偏估计量是GLS估计量。n6.豪斯曼检验以随机效应为原假设,基于LSDV估计量和GLS估计量之间是否存在显著的差异,来检验模型是固定效应还是随机效应。n7.动态面板数据模型具有固有的内生性问题,固定效应的LSDV和随机效应的GLS估计都是有偏的并且非一致的。n8.GMM估计的基本思想就是:使样本矩的加权平方和最小化。GMM工具变量的有效性可以基于J检验来判定。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著34现在学习的是第34页,共34页