第7章-面板数据模型ppt课件.ppt
《第7章-面板数据模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《第7章-面板数据模型ppt课件.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 面板数据模型的分析面板数据模型的分析第一节 面板数据模型简介第二节 固定效应模型及其估计方法第三节 随机效应模型及其估计方法第四节 模型设定的检验第五节 面板数据模型应用实例 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物第一节第一节 面板数据模型简介面板数据模型简介一、面板数据和模型概述一、面板数据和模型概述 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量
2、按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。简单地讲,面板数据因同时含有时间序列数据和截面数据,所以其统计性质既带有时间序列的性质,又包含一定的横截面特点。因而,以往采用的计量模型和估计方法就需要有所调整。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物例 1 表 1 中展示的数据就是一个面板数
3、据的例子。 表表 1 华华东东地地区区各各省省市市 GDP 历历史史数数据据 单位:亿元 1995 1996 1997 1998 1999 上海 2462.57 2902.20 3360.21 3688.20 4034.96 江苏 5155.25 6004.21 6680.34 7199.95 7697.82 浙江 3524.79 4146.06 4638.24 4987.50 5364.89 安徽 2003.66 2339.25 2669.95 2805.45 2908.59 福建 2191.27 2583.83 3000.36 3286.56 3550.24 江西 1244.04 1517
4、.26 1715.18 1851.98 1962.98 山东 4996.87 5960.42 6650.02 7162.20 7662.10 数据来源:中国统计年鉴 1996-2000。 其他类似的例子还有:历次人口普查中有关不同年龄段的受教育状况;同行业不同公司在不同时间节点上的产值等。 这里, 不同的年龄段和公司代表不同的截面,而不同时间节点数据反映了数据的时间序列性。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物研究和分析面板数据的模型被称为面板数据模型(panel data model) 。 它
5、的变量取值都带有时间序列和横截面的两重性。一般的线性模型只单独处理横截面数据或时间序列数据,而不能同时分析和对比它们。面板数据模型,相对于一般的线性回归模型,其长处在于它既考虑到了横截面数据存在的共性,又能分析模型中横截面因素的个体特殊效应。当然,我们也可以将横截面数据简单地堆积起来用回归模型来处理,但这样做就丧失了分析个体特殊效应的机会。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物面板数据通常分为两类面板数据通常分为两类: 由个体调查数据得到的面板数据通常被称为微观面板(micro panels)。
6、 微观面板数据的特点是个体数N 较大(通常是几百或几千个),而时期数T 较短(最少是2 年,最长不超过10 年或20 年)。 由一段时期内不同国家的数据得到的面板数据通常被称为宏观面板(macro panels)。 这类数据一般具有适度规模的个体N(从7 到100 或200 不等,如七国集团,OECD,欧盟,发达国家或发展中国家),时期数T 一般在20 年到60 年之间。 对于宏观面板,当时间序列较长时需要考虑数据的非平稳问题,如单位根、结构突变以及协整等;而微观面板不需要处理非平稳问题,特别是每个家庭或个体的时期数T 较短时。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽
7、的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物面板数据的优点()可以控制个体异质性 可以克服未观测到的异质性(unobserved heterogeneity)这种遗漏变量问题。这个异质性是指在面板数据样本期间内取值恒定的某些遗漏变量。(2)面板数据模型容易避免多重共线性问题 面板数据具有更多的信息; 面板数据具有更大的变异; 面板数据的变量间更弱的共线性; 面板数据模型具有更大的自由度以及更高的效率。(3)与纯横截面数据或时间序列数据相比,面板数据模型允许构建并检验更复杂的行为模型。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也
8、感到愉快,证实我的猜测没有错:表里边有一个活的生物二、一般面板数据模型介绍 用面板数据建立的模型通常有3种。即混合估计模型、固定效应模型和随机效应模型。 混合(pool)估计模型。 如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物二、一般面板数据模型介绍二、一般面板数据模型介绍 符号介绍:ity因变量在横截面 i 和时间 t 上的数值; jitx第
9、j 个解释变量在横截面 i 和时间 t 上的数值; 假设:有 K 个解释变量,即Kj, 2 , 1; 有 N 个横截面,即Ni, 2 , 1; 时间指标Tt, 2 , 1。 记第 i 个横截面的数据为 iTiiiyyyy21; KiTiTiTKiiiKiiiixxxxxxxxxX212221212111;iTiii 21 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物其中对应的i 是横截面 i 和时间 t 时随机误差项。再记 Nyyyy21; NXXXX21; N 21; K 21 这样,y 是一个1TN
10、的向量;X 是一个KTN的矩阵;而是一个1TN的向量。针对这样的数据, 有以下以矩阵形式表达的面板数据模型: Xy (1) 方程(1)代表一个最基本的面板数据模型。基于对系数和随机误差项的不同假设,从这个基本模型可以衍生出各种不同的面板数据模型。最简单的模型就是忽略数据中每个横截面个体所可能有的特殊效应,如假设), 0(2 iid,而简单地将模型视为横截面数据堆积的模型。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感
11、到愉快,证实我的猜测没有错:表里边有一个活的生物几点说明 未观测到的异质性可能不会随着样本的变化而变化,也可能随着样本的变化而发生随机的变化。 不同截距的数据生成过程就是这未观测到的差别不随样本而变化的数据生成过程。 误差成份(error components)数据生成过程就是这未观测到的差别随样本而随机变化的数据生成过程。 在不同截距的数据生成过程中,各自不同的截距都是参数。误差成份模型有两种情况,一是随机的个体效应与解释变量无关,一种是随机的个体效应与解释变量相关。 所谓双因素效应模型,就是在模型中既考虑了不可观测非时变的(个体)异质效应,又考虑了不可观测时变(个体)同质效应的模型。 类似
12、地,双因素效应模型也有固定效应和随机效应之分,如果设定个体效应i 和时间效应t 是确定的,就是双因素固定效应模型;如果设定个体效应i 和时间效应t 是随机的,就是双因素随机效应模型。在实际应用时,模型的正确设定必须进行相关的统计检验。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物第二节第二节 固定效应模型及其估计方法固定效应模型及其估计方法我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物进一步定义: iiidddDN0
13、0000021 id为1TN向量,是一个虚拟变量(dummy variable) 。模型可以再写为: xDy 其中 D 是一个有虚拟变量组成的矩阵。 因此固定效应模型也被称为最小二乘虚拟变量模型(least squares dummy variable(LSDV) model) ,或简单称为虚拟变量模型。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多
14、么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物第二步,估计参数。由于已经得到了的估计值,所以的估计就变得比较简单。 )()(1wXYDDD 其实就是用自变量和解释变量的个体均值和w 按下列模型计算出的误差项: wiiiXy 估计量w 和 的方差估计: 122)(XPXsDw iiXXTswi 22 其中2s是对误差项方差的估计量: KNNTxysitwitiit22)( 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物注注意意:在对误差项
15、方差的估计量中,分母(NT-N-K)反映了整个模型的自由度。有了这些方差的估计量,就可以用传统的 t-统计量对估计系数的显著性进行检验。 同时, 还可以运用下列 F-统计量对jiji, 的原假设进行检验: )/()1 () 1/()(), 1(222KNNTRNRRKNNTNFURU 其中2UR代表无约束回归模型2R, 而2RR为有约束回归模型的2R,约束条件即为原假设。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感
16、到愉快,证实我的猜测没有错:表里边有一个活的生物第三节第三节 随机效应模型及其估计方法随机效应模型及其估计方法一一、随随机机效效应应模模型型的的形形式式 类似固定效应模型,随机效应模型也假定: itiit 但与固定效应模型不同的是,随机效应模型假定i 与it 同为随机变量 随机效应模型可以表达如下: iiiiiXy (18) 其中iy和i 均为1T向量;iX是KT 矩阵;i 是一个随机变量,代表个体的随机效应。 由于模型的误差项为二种随机误差之和, 所以也称该模型为误差构成模型(error component model) 。还假定: 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样
17、一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(1)i 和itx不相关; (2)0)()(iitEE ; (3)tjiEjit, 0)( ; (4)stjiEjsit或, 0)( ; (5)jiEji , 0)( (6)tiEit,),(22 ; (7)iEi),(22 。 给定这些假设,随机效应面板数据模型也可同样写为: y=X+ 其中 )(iIn,的向量形式与以前相同。是Kronecker乘法符号。 例2 Kronecker乘法: 121212200iiiI 例3 前面的矩阵D也可用Kronecker乘法表示:1TNiID 我吓了一跳,蝎子是多么丑恶和恐怖的
18、东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物在这些假设的情况下,简单OLS 估计量仍然是无偏和一致的,但不是有效的。因为: i iIVarTi22)( (19) NNNTIi iIIVar22)( (20) 同一个个体、不同时间节点上的随机误差项之间存在一定的相关性,而 OLS 没有利用方差矩阵中含有的这些信息,因而不再是最有效的估计量。因此有必要采用GLS。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物二二、随随机机效效应应模模型型的的估估计计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据模型 ppt 课件
限制150内