面板数据模型(1).doc
《面板数据模型(1).doc》由会员分享,可在线阅读,更多相关《面板数据模型(1).doc(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date面板数据模型(1)面板数据模型面板数据模型1面板数据定义。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数
2、据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。面板数据用双下标变量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , TN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,yi ., ( i = 1, 2, , N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列(个体)。图1 N=7,T=50的面板数
3、据示意图例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yi t, i = 1, 2, , N; t = 1, 2, , T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。注意:EViwes 3.1、4
4、.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数
5、据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896.778 4104.2
6、81 4361.555 4457.463 5120.485CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.72
7、2 3914.080 4544.775CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山东) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100
8、 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210资料来源:中国统计年鉴1997-2003。表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1
9、996199719981999200020012002IP-AH(安徽) 4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333IP-BJ(北京) 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38IP-FJ(福建) 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538IP-HB(河北) 4148.282 4790.986 5167.317 5468.940 5678.195 59
10、55.045 6747.152IP-HLJ(黑龙江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565IP-JL(吉林) 3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618IP-JS(江苏) 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP-JX(江西) 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 632
11、9.311IP-LN(辽宁) 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088IP-NMG(内蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922IP-SD(山东) 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH(上海) 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX
12、(山西) 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ(天津) 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060IP-ZJ(浙江) 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00资料来源:中国统计年鉴1997-2003。 图2 15个省级地区的人均消费序列(纵剖面) 图3 15个省级地区的人均收入序列(file:4panel02) 图4 15个省级地区的
13、人均消费散点图 图5 15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符
14、号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。图6 用15个时间序列表示的人均消费对收入的面板数据图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加) 为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。可见6年之后15个地区的消费和收入都有了相应的提高。 图8 北京和内蒙古1996-2002年消费对收入时序图 图9 1996和2002年15
15、个地区的消费对收入散点图2面板数据的估计。用面板数据建立的模型通常有3种。即混合估计模型、固定效应模型和随机效应模型。2.1 混合估计模型。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型, yit = a +b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (1)a 和b1不随i,t变化。称模型(1)为混合估计模型。以例1中15个地区1996和2002年数据建立
16、关于消费的混合估计模型,得结果如下:图10 EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object(新对象)选择窗。在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。在窗口中输入15个地区标识AH(安徽)、BJ(北京)、ZJ(浙江)。工具栏中点击Sheet键,从而打开Series List(列写序列名)窗口,定义变量CP?和IP?,点击OK键,Pool(混合或合并数据库)窗口显示面板数据。在Pool窗口的工具栏中点击Estimate键,打开Pool
17、ed Estimation(混合估计)窗口如下图。图11在Dependent Variable(相依变量)选择窗填入CP?;在Common coefficients(系数相同)选择窗填入IP?;Cross section specific coefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击No weighting。点击Pooled Estimation(混合估计)窗口中的OK键。得输出结果如图10。相应表达式是= 129.6313 +0.7587 IPit (2.0) (79.7) R2 = 0.
18、98, SSEr = 4824588, t0.05 (103) = 1.9915个省级地区的人均支出平均占收入的76%。如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a = 0)的混合估计模型。以二变量模型为例,建立混合估计模型如下, yit = b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (2)对于本例,因为上式中的截距项有显著性(t = 2.0 t0.05 (103) = 1.99),所以建立截距项为零的混合估计模型是不合适的。EViwes估计方法:在Pooled Estimation(混合估计)对话框中Intercept(截距项)选择
19、窗中选None,其余选项同上。2.2 固定效应模型。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。
20、下面分别介绍。(1)个体固定效应模型。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型,表示如下, yit = b1 xit +g1 W1 + g2 W2 + +gN WN +eit, t = 1, 2, , T (3)其中Wi =eit, i = 1, 2, , N; t = 1, 2, , T,表示随机误差项。yit, xit, i = 1, 2, , N; t = 1, 2, , T分别表示被解释变量和解释变量。模型(3)或者表示为 y1t = g1 +b1 x1
21、t +e1t, i = 1(对于第1个个体,或时间序列),t = 1, 2, , T y2t = g2 +b1 x2t +e2 t, i = 2(对于第2个个体,或时间序列),t = 1, 2, , T yN t = gN +b1 xN t +e N t, i = N(对于第N个个体,或时间序列),t = 1, 2, , T写成矩阵形式,y1 = (1 x1)+e1 = g1 + x1 b +e1yN = (1 xN)+eN = gN + xN b +eN上式中yi,gi,ei,xi都是N1阶列向量。b为标量。当模型中含有k个解释变量时,b为k1阶列向量。进一步写成矩阵形式,= +b + 上式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据模型
限制150内