第11章 面板数据模型.pdf
《第11章 面板数据模型.pdf》由会员分享,可在线阅读,更多相关《第11章 面板数据模型.pdf(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中级计量经济学 436第 11 章 面板数据模型 11.1 面板数据模型概述 11.1.1 面板数据的含义 面板数据(panel data)也称平行数据,或时间序列截面数据(time series and cross section data)或混合数据(pool data),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如 yi t,i=1,2,N;t=1,2,T 表示在横截面 i 时间 t 上取值。N 表示面板数据中含有 N 个个体。T 表示时
2、间序列的最大长度。若固定 t 不变,yi.(i=1,2,N)是横截面上的 N 个个体截面数据序列;若固定 i 不变,y.t(t=1,2,T)是纵剖面上的一个时间序列(个体),如图 11.1.1 所示。图 11.1.1 面板数据示意图 例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的一个时间序列。面板数据由 30 个个体组成。共有 330 个观测值。对于面板数据 yi t,i=1,2,N;t=1,2,T 来说,如果从横截面上看,每个变量都有观第 11 章 面板数据模型
3、 437测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。例 11.1.1例 11.1.1 1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表 11.1.1 和表 11.1.2。数据是 7 年的,每一年都有 15 个数据,共105 组观测值。表 11.1.1 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费数据(不变价格)地区人均消费 19
4、96 1997 1998 1999 2000 2001 2002 CP-AH(安徽)3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 CP-BJ(北京)5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 CP-FJ(福建)4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 CP-HB(河北)3197.339 3868.319 3896.778 4104.281 4361.5
5、55 4457.463 5120.485 CP-HLJ(黑龙江)2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林)2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 CP-JS(江苏)3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 CP-JX(江西)2714.124 3136.873 3234.465 3531.775 3612.722 3914.08
6、0 4544.775 CP-LN(辽宁)3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063 CP-NMG(内蒙古)2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东)3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 CP-SH(上海)6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94
7、 CP-SX(山西)2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 CP-TJ(天津)4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 CP-ZJ(浙江)5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210 资料来源:中国统计年鉴1997-2003。表 11.1.2 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均收入数据(不变价格)地区人均收入
8、 1996 1997 1998 1999 2000 2001 2002 IP-AH(安徽)4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333 IP-BJ(北京)6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38 IP-FJ(福建)4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538 中级计量经济学 438IP-HB(河北)4148.282 4790.986 5167.317 5
9、468.940 5678.195 5955.045 6747.152 IP-HLJ(黑龙江)3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565 IP-JL(吉林)3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618 IP-JS(江苏)4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589 IP-JX(江西)3487.269 3991.490 4209.327 4787.606 50
10、88.315 5533.688 6329.311 IP-LN(辽宁)3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088 IP-NMG(内蒙古)3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922 IP-SD(山东)4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036 IP-SH(上海)7489.451 8209.037 8773.100 10770.09 11432.20 128
11、83.46 13183.88 IP-SX(山西)3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732 IP-TJ(天津)5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060 IP-ZJ(浙江)6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00 资料来源:中国统计年鉴1997-2003。人均消费和收入的面板数据从纵剖面观察分别见图 11.1.2 和图 11.1.3。从横截面观察分别
12、见图 11.1.4 和图 11.1.5。用 CP 表示消费,IP 表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。2000300040005000600070008000900010000110001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ 20004000600080
13、001000012000140001996199719981999200020012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ 图 11.1.2 15 个省市人均消费序列(纵剖面)图 11.1.3 15 个省市人均收入序列 第 11 章 面板数据模型 43920004000600080001000012000140002468101214CP1996CP1997CP1998CP1999CP2000CP2001CP200220004000600080001000012000140002468101214IP1
14、996IP1997IP1998IP1999IP2000IP2001IP2002 图 11.1.4 15 个省市人均消费散点图 图 11.1.5 15 个省市人均收入散点图(7 个横截面叠加)(每条连线表示同一年度 15 个地区的消费值)(每条连线表示同一年度 15 个地区的收入值)15 个地区 7 年人均消费对收入的面板数据散点图见图 11.1.6 和图 11.1.7。图 11.1.6 中每一种符号代表一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。图11.1.7 中每一种符号代表一个年度的截面散点图(共 7 个截面)。相当于观察 7 个截面散点图的叠加。200030
15、0040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ 图 11.1.6 用 15 个时间序列表示的人均消费对收入的面板数据 中级计量经济学 440200040006000800010000120002000400060008000100001200014000IP(1996-2002)CP1996CP1997CP1998CP1999CP2000CP2001CP2002 图 11.1.7 用
16、 7 个截面表示的人均消费对收入的面板数据(7 个截面叠加)图 11.1.8 给出北京和内蒙古 1996-2002 年消费对收入散点图。图 11.1.9 给出 15 个省级地2 年的消费对收入散点图。区 1996 和 200 图 11.1.8 北京和内蒙古 1996-2002 年消费对收入时序图 图 11.1.9 1996 和 2002 年地区消费对收入散点图11.1.2 面板数据模型的基本类型 我们把建立在面板数据基础上的计量经济模型称为面板数据模型。设 yit为被解释变量在横截面jitit面 i 和时间 t 上的随机误差项;bji为第 i 截面上的第 j 个解释变量的模型参数;ai为常数项
17、2,N;时间长度为 t=1,2,T。其中,N 表示个体截面成员的个数,T 表示每个截面成员的观测时期总数,k 表示解释变量的个数。则单方程面板数据模型的(分量)一般形式可 i 和时间 t 上的数值,x为第 j 个解释变量在横截面 i 和时间 t 上的数值,u 为横截或截距项,代表第 i 横截面(第 i 个体的影响);解释变量数为 j=l,2,k;截面数为 i=1,写成:(Ni,2,1L=;Tt,2,1L=itkitkiitiitiiituxbxbxbay+=L2211)(11.1.1)若记:为itx=),(21kitititxxxLk1为解释变量,为系数向量,为随机误差项,满足相互独立、零均值
18、、同方差为的假设。式(11.1.1)为单方程面板ib=),(21kiiibbbL1kitu2u第 11 章 面板数据模型 441数据模型的一般形式。则上式也可写成:iitay=+iitbx+itu,NiL,1=,TtL,1=(11.1.2)进一步,若记第 i 截面样本数据为:iTiyyyM2,kiTkikiiTiiiTixxxxxxxxxLLLLLLL2122212121,并记:,则面板数据模型的一般形式也可写为:iy=i1i11ix=iTiixxxM21iu=iTiiuuuM21=NyyyyM21=NxxxxM21=NuuuUM21=kbbbbM21a=NaaaM21 ayUxb+=+(11
19、.1.3)对于平衡的面板数据,即在每一个截面单元上具有 当 N=1 且 T 很大时,就是所熟悉的时间序列数据;当 T=1 而 N 很大时,就只有截面数据。面板数据模型划分为 3 种类型:ai=aj=a,b,bi i=b=bj j=b=b 相同个数的观测值,模型样本观测数据的总数等于 NT。(1)无个体影响的不变系数模型:无个体影响的不变系数模型:ayit=+bxit+itu,NiL,1=,TtL,1=(11.1.4)这种情形意味着模型在横截面上无个体影响、无结构变化,可面数据假设条件,就可以采用 OLS 法进行估计(共有 k+1 个参数需要估计),该模型也被称为联合回 (2)变截距模型:变截距
20、模型:a a,b=b=b,b=b=b,将模型简单地视为是横截堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本归模型(pooled regression model)。ijijijiitay=+bxit+uitNiL,1=,TtL,1=(11.1.5)这种情形意味着模型在横截面上存在个体影响,不存在结构性构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项 a (i1,2,N)的差别来说明,故通常把它称为变截距模型。(3)变系数模型:变系数模型:aiaj,b,bi ib bj j 的变化,即解释变量的结i中级计量经济学 442iitay=+bx+u,iL
21、,1iititNTtL,1=,(11.1.6)在个体影响,又存在结构变化,即在允许个体影响由变化的截距项 ai(i1,2,N)来说明的同时还允许系数向量体成1利用面板数据模型可以解决样本容量不足的问题 关系 11.2 模型形式设定检验 建立面板数据模型首先要检验被解释变量 yit的参数 ai和 b bi i是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述 3 种情况的哪一种面板数据模型形式,从而避免模型这种情形意味着模型在横截面上存b bi i(i1,2,N)依个员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。11.1.3 面板数据模型的优点 2有助于正
22、确地分析经济变量之间的3可以估计某些难以度量的因素对被解释变量的影响设定的偏差,改进参数估计的有效性。主要检验如下两个假设:H:bbb1N=L (11.2.1)21:;Nbbb=L212HNaaa=L21 (11.2.2)如果接受假设 H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设 H1。如果接受1,则认为样本数变截距、不变系则认11.1.6)的残差平方和 S11.1.6)的残差平方和 S1 1。H据符合数模型;反之,为样本数据符合变系数模型。下面介绍假设检验的 F 统计量的计算方法。首先计算变截距、变系数模型(首先计算变截距、变系数模型(如果记 iy=T1
23、T=tity1,ix=T1T=titx1 (11.2.3)则模型(11.1.6)参数的最小二乘估计为 ixyixxiWWb,1,=iiyaiibx (11.2.4)称为群内估计。其中 第 11 章 面板数据模型 443=TtiitiitixxxxxxW1,)()(,=TtiitixyxxW1,)()(iityy =TtiitiyyyyW12,)(11.2.5)第 群残差平方和是,模型(11.1.6)的残差平方和记为,则 (11.2.6)其次计算变截距、不变系数模型(11.1.5)的残差平方和 S其次计算变截距、不变系数模型(11.1.5)的残差平方和 S2 2。,则模型(11.1.5)的最小二
24、乘估计为,iiRSS=ixyixxixyiyyWWWW,1,1S=NiiRSSS11如果记=NiixxxxWW1,=NiixyxyWW1,=NiiyyyyWW1,xyxxwWWb1=iiya wibx (11.2.7)模型(11.1.5)的残差平方和记为,则 (11.2.8)最后计算不变截距、不变系数模(11.1.4)的残差平最后计算不变截距、不变系数模(11.1.4)的残差平2S2S=xyxxxyyyWWWW1型方和 S型方和 S3 3。如果记=NiTtiitiitxxxxxxT11)()(,=NiTtiitiitxyyyxxT11)()(=NiTtiityyyyT112)(11.2.9)其
25、中=NiTtitxNTx111,=NiTtityNTy111 则模型(11.1.4)的最小二乘估计为,xyxxTTb1=ya bx (11.2.10)模型(11.1.4)的残差平方和记为,则 3S中级计量经济学 4443S=(11.2.11)xyxxxyyyTTTT1由此可以得到下列结论:(1);21/uS)1(2kTN(2)在下,和;2H23/uS)1(2+kNT213/)(uSS)1)(1(2+kN(3)与独立。213/)(uSS21/uS所以,在假设下检验统计量服从相应自由度下的分布,即 2H2FF)1(/)1)(1/()(1132+=kNNTSkNSSF)1(),1)(1(+kTNkN
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第11章 面板数据模型 11 面板 数据模型
限制150内