PanelData分析理论和应用技术发展综述 .docx
《PanelData分析理论和应用技术发展综述 .docx》由会员分享,可在线阅读,更多相关《PanelData分析理论和应用技术发展综述 .docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结Panel Data 分析的理论和应用进展综述汪 涛饶海斌王丽娟1. 引言1 .1Panel Data 的含义Panel Data(或者 Longitudinal Data )可译成 “板面数据 ”、“时空数据 ”,根据比较权威的懂得,是用来描述一个总体中给定样本在一段时间的情形,并对样本中每一个样本单位都进行多重观看。这种多重观看既包括对样本单位在某一时期(时点) 上多个特性进行观看,也包括对该样本单位的这些特性在一段时间的连续观看,连续观看将得到数据集称为板面数据。最早是 Mundlak (1961 )、Balestra 和 Nerlove ( 1966)把 Panel D
2、ata 引入到经济计量中。从今以后, 大量关于 Panel Data 的分析方法、 争论文章如雨后春笋般显现在经济学、治理学、社会学、心理学等领域。从1990 年到目前为止,已有近1000 篇有关Panel Data 理论性和应用性的文章发表, Panel Data 争论成为近十年来经济计量学的一个热点。相伴着经济理论, 包括宏观经济理论和微观经济理论、运算机技术和统计方法的进展,Panel Data 在经济学领域的应用逐步被经济计量学家推广。在宏观经济领域,它被广泛应用于经济增长、技术创新、金融、税收政策等领域。在微观经济领域,它被大量应用于就业、家庭消费、入学、市场营销等领域。美国最闻名的
3、两个PanelData 数据集,一个是俄亥俄高校的 NLS数据集( the National Longitudinal Surveys of Labor MarketExperience)。另一个是 密西根高校的PSID 数据集( the University of MichiganPasnel Study of Income Dynamics )。 NLS 数据集包括 5 个独立的与劳动力有关的板面数据集,这 5 个板面数据集的主体包括1966 年 45 岁到 59 岁的成年男子、 1966 年 14 岁到 24 岁的青年男子、 1967 年 30 岁到 44 岁的成年女子、 1968 年
4、14 岁到 24 岁的青年女子、 1979 年 14 岁到 21 岁的男女青年。前四个群体被连续 (跟踪) ?观看了 15 年,最终一个青年群体在被连续观看了15 年后,又被连续观看了 6 年。调查的变量有上千个,主要侧重明白劳动力市场上供应方的情形。PSID 数据集由从 1968 年起直到现在所收集的6000 个家庭和 15000 个人的 5000 多个变量的数据构成,这 5000 多个变量涉及就业状态、收入、家庭资产、住房、上班交通工具、汽车拥有等方面。收集这些Panel Data 数据集主要是为了争论美国贫困人口状况及其贫困缘由。除此之外, 这些数据集仍被用来监测和说明经济状态变化以及经
5、济和社会状况对人们生活的影响。目前, 世界上已经成立了特的争论Panel Data 的协会, 每两年举办一次全球性的Panel Data 学术沟通大会。 第九届国际 Panel Data 会议于 2000 年 6 月 22-23 日在日内瓦高校举办, 入会者均是从事 Panel Data 争论的经济学家、经济计量学家、统计学家和社会学家。大会强调除了在经济计量学中以外,要扩展Panel Data 的应用领域,以期发觉Panel Data 分析的新方法和新的应用领域,特殊强调Panel Data 在社会科学、医学和金融学这三个领域的应用。1.2Panel Data 的作用Panel Data 分
6、析的作用表达在:(1) 掌握个体行为差异。Panel Data 数据库显示个体(包括个人、企业、的区或国家)之间存在差异,而单独的时间序列和横截面不能有效反映这种差异。假如只是简洁使用时间序列和横截面分析就可能获得有偏结果。此外, Panel Data 分析能够掌握在时间序列和横截面争论中不能掌握的涉及的区和时间为常数的情形。也就是说, 当个体在时间或的区分布中存在着常数的变量(例如受训练程度、电视广告等)时,假如在模型中不考虑这些变量,有可能会得到有偏结果。可编辑资料 - - - 欢迎下载精品名师归纳总结Panel Data 分析能够掌握时间或的区分布中的恒变量,而一般时间序列和横截面争论中
7、就不能。(2) Panel Data 能够供应更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列常常受多重共线性的困扰。(3) Panel Data 能够更好的争论动态调剂,横截面分布看上去相对稳固但却隐匿了很多变化, Panel Data 由于包含较长时间,能够弄清诸如经济政策变化对失业状况的影响等问题。(4) Panel Data 能更好的识别和度量纯时间序列和纯横截面数据所不能发觉的影响因素。(5) 相对于纯横截面和纯时间序列数据而言,Panel Data 能够构造和检验更复杂的行为模型。(6) 通常, Panel Data 可以收集到更精确的微观单位(个人、企业、家庭
8、)的情形。由此得到的总体数据可以消去测量误差的影响。尽管 Panel Data 争论的理论和应用进展很快,但目前仍旧存在一些问题需要解决:(1) 设计和收集数据困难。同一般数据收集和治理一样,Panel Data 也面临着设计不完整、无回答、核准、多次拜访、拜访间隔、对比参照期等问题。(2) 存在测量误差由于不清晰的回答、记忆错误等带来的测量误差给Panel Data 应用带来很大困难。(3) 存在挑选性困难主要指自挑选无回答和磨损(样本丢失)。(4) 时间序列较短由于收集数据时间跨度较短,为了满意渐近理论,就要求样本数量趋向于无穷。2. Panel Data分析进展的简要回忆2.1 Pane
9、l Data 分析的基本框架Panel Data 的内容特别丰富,这里以Matyas 和 Sevestre( 1996)再版的书为框架,主要从争论这种时空数据的模型角度,简洁回忆一下争论Panel Data 方法的进展:2.1.1 线性模型1、单变量模型(1) 固定效应和固定系数模型(Fixed Effect Models and Fixed Coefficient Models):通常采纳 OLS 估量。固定效应包括时间效应以准时间和个体效应,并可以进一步放宽条件,答应在有异方差、自相关性和等相关矩阵块情形下,用GLS 估量。(2) 误差成分模型( Error Components Mode
10、ls ):最常用的 Panel Data 模型。针对不怜悯形, 通常可以用 OLS 估量、 GLS 估量、内部估量(WithinEstimator )和 FGLS 估量,并检验误差成分中的个体效应以及个体和时间效应,同时将自相关和异方差情形也纳入该模型框架中。(3) 随机系数模型 Random Coefficient Models :即模型自变量的系数可能包含时间效应或个体效应,再加上一个随机数,系数通常用抽样方法或者贝叶斯方法来估量。(4) 带有随机自变量的线性模型Linear models with random regressiors :通常用工具变量估量( IV 估量) 和 GMM估量
11、。同时, 利用工具变量可以对相关的特定效应模型the Correlated Specific Effect Models 估量,并对随机变量与特定效应之间的相关性进行检验。(5) 动态线性模型(Dynamic linear Models ),该模型同样又包含固定效应自回来模型(通常用 LSDV 估量、 Within 估量、 IV 估量法估量参数) 、动态误差成分模型( -类估量、 IV估量、 GMM 估量和最大似然估量等方法估量参数)以及带有异方差的动态线性模型(联合可编辑资料 - - - 欢迎下载精品名师归纳总结估量、组均值估量和截面估量等方法估量参数,并检验异方差性),成为近来 Panel
12、 Data 单位根和协整理论进展的基础。2、联立方程模型包括带特定误差成分和联立方程(用GLS、最大似然估量、 G2SLS 、EC2SLS、G3SLS、EC3SLS 以及 FIML等方法估量参数) ,以及带自相关特定效应或者带随机效应的联立方程模型。3、带测量误差模型:包括基本回来模型、带一个误差成分结构测量误差模型,参数估计方法包括基本估量、集合估量、差分估量。仍包括具有测量误差和异方差的模型(GLS估量),以及具有自相关性测量误差的模型。4、伪 Panel Data伪 Panel Data 是指重复抽自一个横截面所构成的数据集,对伪Panel Data 争论包括伪 Panel Data 的
13、识别和估量。除此之外, 仍有一些特殊问题如误差成分模型形式挑选,豪斯曼(Hausman)特定检验,异方差问题等处处理。2.1.2 非线性模型1、logit 和 probit 模型固定效应模型 ( ML 估量、CMLE 估量和半参估量方法估量模型参数)和随机效应模型 ( MLE估量)用二步骤方法来检验模型是否存在异方差。2、非线性潜在变量模型包括变量是线性的但模型是非线性的形式和变量非线性模型(估量方法包括非一样的IV 估量、 ML 估量、最小距离MDE 估量、二步估量、近似MLE估量以及估量偏差调整)以及 作为变量非线性模型中的一种特殊情形- 二元挑选情形, 估量方法用重复 ML 估量或者条件
14、ML 估量。3、生存模型主要包括对 Cox 模型、加速生存模型、竞争风险模型争论。4、点过程主要包括对马氏过程、半马氏过程,以及用广义半参方法处理的点过程。除此之外仍包括:5、处理 Panel Data 数据不完整而带来的挑选偏差问题:通常不完整的Panel Data 根据对争论结果的影响分为可忽视挑选规章(机制)和不行忽视挑选规章(机制)。可忽视挑选规章(机制) 模型参数通常用 ML 估量和 EM 算法, 而不行忽视挑选机制模型参数通常用二步估量,?是否是?(含义不清)不行忽视挑选规章(机制)通常采纳LM 检验、 Hausman检验、变量可加性检验。6、GMM 估量方法使用和对非线性模型进行
15、特殊检验包括使用 GMM 方法估量泊松模型、非均衡Panel Data 和对 Panel Probit 利用 Ward、LM 、Hausman 方法进行检验。7、借助 Gibbs 抽样利用 MCMC 方法对 Panel Data 模型进行推断, 主要是针对带随机效应高斯模型和带随机效应的 Panel Probit 模型。2.2 Panel Data 争论的学术专著目前有关 Panel Data 的学术专著主要有:1. Analysis of panel data / Cheng Hsiao.1986.2. Econometric analysis of panel data / Badi H.
16、Baltagi. 1995.3. The Econometrics of panel data : a handbook of the theory with applications / Matyas可编辑资料 - - - 欢迎下载精品名师归纳总结& Sevestre. c1996.4. Panel data and structural labour market models / Henning Bunzel et al.c20002.3 Panel Data 争论的代表人物Mauel ArallanoCEMFL,Madrid ) Pierto BaletraUniversity of
17、Geneva Badi BaltagiTexasA&MUniversity Richard BlundellUniversityCollegeLondonAlmas Heshmati GoteborgUniversity Alberto HollyUniversity of LausanneCheng HsiaoUniversity of southern California Jan KivietUniversity of Amsterdam Anders Klevmarken UppsalaUniversityJayaKrishnakumar University of Geneva Mi
18、chael Lechner University of Saint-Gall Jacque Mairesse CREST-INSE and NBER EsfandiarMaasoumiSouthernMethodistUniversityLaszloMatyasBudapestUniversityofEconomicsMarcNerloveUniversityofMarylandHashem Pesaran University of CambridgePatrick Sevestre University of Paris XII Alain TrognonGENES Tom Wansbee
19、kUniversity ofGroningen3. Panel Data分析的最新进展目前,在 Panel Data 理论和应用争论中, 主要有两个热点领域:一个是非线性模型争论, 另一个是动态线性模型单位根和协整的理论联系和应用争论。3.1 Panel Data 非线性模型争论最新进展Li和 Stengos( 1996)借助工具变量对半参线性Panel Data 模型进行估量,并且证明当T 很小, N 很大时,估量量是以N1/2 一样收敛。 Hsiao 和 Li( 1998)又对半参 Panel Data 模型给出了三个序列相关检验,第一个是 1 阶序列相关检验, 其次个是检验高阶序列相关,
20、第三个是检验个体行为, 这种模型答应滞后因变量作为说明变量,在原假设为一个鞅差误差过程情形下,它们分别听从渐近正态或者卡方分布。对模型 Panel Probit,Bertschek 和 Lechner( 1998)用一类 GMM 方法进行估量。这类 GMM 估量, 由于它的条件矩仅仅涉及到二元因变量一阶矩而变得简洁运算, 同时, 这类 GMM 估量利用非参数的方法 ( K-NN 方法) 得到最优估量。 一个蒙特卡洛模拟争论显示这类估量有良好的小样本特性,与 ML 估量相比,它的估量效率缺失较小。 Inkmann( 2000)同样证明,在小样本中,即使是存在时间异方差的情形下,这类 GMM 估量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PanelData分析理论和应用技术发展综述 PanelData 分析 理论 应用 技术发展 综述
限制150内