第8章面板数据分析.ppt
《第8章面板数据分析.ppt》由会员分享,可在线阅读,更多相关《第8章面板数据分析.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第8章面板数据分析章面板数据分析现在学习的是第1页,共97页v面板数据面板数据(Panel Data)又称纵列数据又称纵列数据(Longitudinal Data),是指不同的横截面个体在不同的时间上的,是指不同的横截面个体在不同的时间上的观测值的集合。从水平看,它包括了某一时间上观测值的集合。从水平看,它包括了某一时间上的不同的横截面个体的数据;从纵向看,它包括的不同的横截面个体的数据;从纵向看,它包括了每一横截面的时间序列数据。因此,面板数据了每一横截面的时间序列数据。因此,面板数据模型可以增加模型的自由度,降低解释变量之间模型可以增加模型的自由度,降低解释变量之间的多重共线性程度,从而
2、可能获得更精确的参数的多重共线性程度,从而可能获得更精确的参数估计值。此外,面板数据可以进行更复杂的行为估计值。此外,面板数据可以进行更复杂的行为假设,并能在一定程度上控制缺失或不可观测变假设,并能在一定程度上控制缺失或不可观测变量的影响。但是,面板数据模型也不是万能的,量的影响。但是,面板数据模型也不是万能的,它的设定和估计都存在一定的假定条件,如果应它的设定和估计都存在一定的假定条件,如果应用不当的话同样会产生偏误。用不当的话同样会产生偏误。现在学习的是第2页,共97页第一节第一节 面板数据模型的基本分类面板数据模型的基本分类v从形式上看,面板数据模型与一般的横截面数据从形式上看,面板数据
3、模型与一般的横截面数据模型或时间序列模型的区别在于模型中的变量有模型或时间序列模型的区别在于模型中的变量有两个下角标,例如:两个下角标,例如:(8.1)其中的其中的i代表了横截面个体,如个人、家庭、企业代表了横截面个体,如个人、家庭、企业或国家等,或国家等,t代表时间。因此,代表时间。因此,N代表横截面的宽代表横截面的宽度,度,T代表时间的长度。代表时间的长度。是是K1的向量,的向量,Xit是是K个解释变量(这里暂不包括常数项)的第个解释变量(这里暂不包括常数项)的第it个观测个观测值。值。是随机扰动项(或随机误差项)。是随机扰动项(或随机误差项)。v面板数据模型的基本分类与面板数据模型的基本
4、分类与(8.1)式中的随机误差式中的随机误差项的分解和假设有关。项的分解和假设有关。现在学习的是第3页,共97页一、双向误差构成模型一、双向误差构成模型(Two-way Error Component Model)v假设假设(8.1)式中的随机误差项式中的随机误差项 可以分解为:可以分解为:(8.2)其中,其中,表示横截面效应,它不随时间表示横截面效应,它不随时间的变动而变动,但却随着横截面个体的不同而不的变动而变动,但却随着横截面个体的不同而不同;同;表示时间效应,它对同一时间的表示时间效应,它对同一时间的横截面个体是相同的,但却随着时间的变动而变横截面个体是相同的,但却随着时间的变动而变动
5、。动。现在学习的是第4页,共97页v当当(8.2)式成立并且假定:式成立并且假定:A1:(8.3)A2:(8.4)则则(8.1)式的面板数据模型称为双向误差构成模型。式的面板数据模型称为双向误差构成模型。因为它将因为它将(8.1)式中的误差项从横截面和时间两个式中的误差项从横截面和时间两个维度上进行了分解。维度上进行了分解。现在学习的是第5页,共97页二、单向误差构成模型二、单向误差构成模型(One-way Error Component Model)v当把当把(8.1)式中的随机误差项式中的随机误差项 只分解为:只分解为:(8.5)或或 (8.6)时,并且同样假设时,并且同样假设(8.3)式
6、和式和(8.4)式成立,则式成立,则(8.1)式的面板数据模型称为单向误差构成模型,因为式的面板数据模型称为单向误差构成模型,因为它仅将它仅将(8.1)式中的误差项从横截面或时间的维度式中的误差项从横截面或时间的维度上进行了分解。上进行了分解。现在学习的是第6页,共97页三、固定效应(三、固定效应(Fixed Effects)模型)模型v无论是双向误差构成模型还是单向误差构成模型无论是双向误差构成模型还是单向误差构成模型,当假设当假设(8.2)式、式、(8.5)式或式或(8.6)式中的式中的 或或 是固定的(未知)常数时,则相应是固定的(未知)常数时,则相应的面板数据模型称为固定效应模型。具体
7、的,当的面板数据模型称为固定效应模型。具体的,当假设假设(8.5)式中的式中的 为固定的常数时,相应为固定的常数时,相应的面板数据模型称为横截面固定效应模型;当假的面板数据模型称为横截面固定效应模型;当假设设(8.6)式中的式中的 为固定的常数时,相为固定的常数时,相应的面板数据模型称为时间固定效应模型;当假应的面板数据模型称为时间固定效应模型;当假设设(8.2)式中的式中的 和和 都为固都为固定的常数时,相应的面板数据模型称为同时横截定的常数时,相应的面板数据模型称为同时横截面和时间固定效应模型或双向固定效应模型。面和时间固定效应模型或双向固定效应模型。现在学习的是第7页,共97页四、随机效
8、应四、随机效应(Random Effects)模型模型v同样,无论是双向误差构成模型还是单向误差构同样,无论是双向误差构成模型还是单向误差构成模型,当假设成模型,当假设(8.2)式、式、(8.5)式或式或(8.6)式中的式中的 和和/或或 是一个随机变量而是一个随机变量而非固定的常数时非固定的常数时,则相应的面板数据模型称为随机则相应的面板数据模型称为随机效应模型。具体的效应模型。具体的,当假设当假设(8.5)式中的式中的 为为随机变量时,相应的面板数据模型称为横截面随随机变量时,相应的面板数据模型称为横截面随机效应模型;当假设机效应模型;当假设(8.6)式中的式中的 为随为随机变量时,相应的
9、面板数据模型称为时间随机效机变量时,相应的面板数据模型称为时间随机效应模型;当假设应模型;当假设(8.2)式中的式中的 和和 都为随机变量时,相应的面板数据模都为随机变量时,相应的面板数据模型称为同时横截面和时间随机效应模型或双向随型称为同时横截面和时间随机效应模型或双向随机效应模型。机效应模型。现在学习的是第8页,共97页v以上关于面板数据模型的基本分类的归纳可参见以上关于面板数据模型的基本分类的归纳可参见图图8.1。现在学习的是第9页,共97页面板数据模型双向误差构成模型单向误差构成模型双向固定效应双向随机效应单向随机效应单向固定效应横截面随机效应时间随机效应横截面固定效应时间固定效应随机
10、效应模型固定效应模型图8.1 面板数据模型的基本分类现在学习的是第10页,共97页第二节第二节 固定效应模型固定效应模型 最小二乘虚拟变量估计最小二乘虚拟变量估计 协方差估计协方差估计(内部估计内部估计)广义最小二乘估计广义最小二乘估计 平均效应的估计平均效应的估计 双向固定效应模型双向固定效应模型 固定效应的检验固定效应的检验 现在学习的是第11页,共97页8.2.1 最小二乘虚拟变量估计最小二乘虚拟变量估计v这里我们先以横截面固定效应模型为例来说明固这里我们先以横截面固定效应模型为例来说明固定效应模型的估计方法。对于时间固定效应模型定效应模型的估计方法。对于时间固定效应模型的估计,其方法与
11、横截面固定效应模型的估计方的估计,其方法与横截面固定效应模型的估计方法类似,只要将其中对横截面的处理改换为对时法类似,只要将其中对横截面的处理改换为对时间的处理就可以了。间的处理就可以了。v将将(8.5)式代入式代入(8.1)式中,并且假定式中,并且假定 为固定的常数,即可得以下的横截面固定效应模为固定的常数,即可得以下的横截面固定效应模型:型:(8.7)现在学习的是第12页,共97页v假设假设现在学习的是第13页,共97页v那么,那么,(8.7)式的矩阵形式为:式的矩阵形式为:(8.8)现在学习的是第14页,共97页v(8.8)式中式中 对应的向量实际上是一个虚对应的向量实际上是一个虚拟变量
12、,设:拟变量,设:这样这样(8.8)式可以进一步简化为:式可以进一步简化为:(8.9)现在学习的是第15页,共97页v设设对对(8.9)式进行式进行OLS估计,实际上是通过对固定效估计,实际上是通过对固定效应模型应模型(8.7)式设定了式设定了N个虚拟变量后的最小二乘估个虚拟变量后的最小二乘估计,因此,对计,因此,对(8.9)式的式的OLS估计又被称为最小二估计又被称为最小二乘虚拟变量估计乘虚拟变量估计(Least Squares Dummy Estimate,LSDE),模型,模型(8.8)式或式或(8.9)式被称为最式被称为最小二乘虚拟变量小二乘虚拟变量(LSDV)模型。模型。现在学习的是
13、第16页,共97页v(8.9)式的式的OLS估计结果或(估计结果或(8.7)式的)式的LSDE估计估计结果为:结果为:(8.10)当假定条件当假定条件(8.3)式和式和(8.4)式满足时,式满足时,LSDE估计估计量是最优线性无偏估计量量是最优线性无偏估计量(BLUE)。现在学习的是第17页,共97页8.2.2 协方差估计协方差估计(内部估计内部估计)v对于对于(8.10)式的式的LSDE的结果,需要涉及到的结果,需要涉及到(K+N)(K+N)矩阵的逆运算,过程较为复杂。实矩阵的逆运算,过程较为复杂。实际的计算机计算一般是采用以下的较为简便的二际的计算机计算一般是采用以下的较为简便的二步法进行
14、的。步法进行的。v(1)步骤一:)步骤一:设,设,对对(8.7)式的每一个横截面个体在时间上求平均,式的每一个横截面个体在时间上求平均,得以下模型:得以下模型:(8.11)现在学习的是第18页,共97页v将将(8.7)式减去式减去(8.11)式得:式得:(8.12)(8.12)式与式与(8.7)式相比,没有了反应横截面固定效式相比,没有了反应横截面固定效应的常数项应的常数项 。现在学习的是第19页,共97页v对对(8.12)式进行式进行OLS估计,得到的参数估计量具有估计,得到的参数估计量具有如如(8.13)式的协方差的形式,因此这一估计过程被式的协方差的形式,因此这一估计过程被称为协方差估计
15、称为协方差估计(Covariance Estimate),得到的估,得到的估计量称为协方差估计量。计量称为协方差估计量。(8.13)与与(8.10)式的式的LSDE相比,协方差估计只需要计算相比,协方差估计只需要计算KK矩阵的逆,因此简化了计算的过程。矩阵的逆,因此简化了计算的过程。现在学习的是第20页,共97页v(2)步骤二:)步骤二:利用利用(8.13)式的估计结果,得到式的估计结果,得到 (8.14)由于在二步法的估计过程中,只用到了每一横截由于在二步法的估计过程中,只用到了每一横截面个体内部不同时间的差异的信息面个体内部不同时间的差异的信息 ,并未用,并未用到不同横截面个体之间差异的信
16、息到不同横截面个体之间差异的信息 ,所以,所以二步法的估计过程又称为内部估计二步法的估计过程又称为内部估计(Within Estimate),其估计结果称为内部估计量。,其估计结果称为内部估计量。现在学习的是第21页,共97页v但是,当解释变量但是,当解释变量X中包括有那些只随横截面个中包括有那些只随横截面个体的变化而变化但不随时间变动的变量时,由于体的变化而变化但不随时间变动的变量时,由于在获得在获得(8.12)式时会象式时会象 那样被消除,因此在那样被消除,因此在(8.13)的估计结果中并不包含这些解释变量的系数的估计结果中并不包含这些解释变量的系数的估计值。的估计值。现在学习的是第22页
17、,共97页v需要注意的是,由于协方差估计或内部估计只估需要注意的是,由于协方差估计或内部估计只估计了计了K个参数,因此其回归的方差个参数,因此其回归的方差 的估计值的估计值 是通过残差平方和除以是通过残差平方和除以(NTK)得到的。而得到的。而LSDM中的方差的估计值中的方差的估计值 是通过用残差平方和是通过用残差平方和除以除以(NTKN)得到的。因此,二者的关系为:得到的。因此,二者的关系为:(8.15)现在学习的是第23页,共97页8.2.3 广义最小二乘估计广义最小二乘估计v在在(8.8)式中,第式中,第i个方程可以写成:个方程可以写成:(8.16)令一个幂等转换矩阵令一个幂等转换矩阵Q
18、为:为:(8.17)现在学习的是第24页,共97页vQ的秩的秩Rank(Q)=T-1,且,且 。将。将Q左乘左乘(8.16)式得:式得:(8.18)这样,这样,(8.18)式等价于式等价于(8.12)式,也消除了横截面式,也消除了横截面效应项效应项 ,且,且因此,因此,(8.18)式的式的OLS估计量,即估计量,即(8.16)式的广义式的广义最小二乘(最小二乘(GLS)估计量会等价于前面介绍的协)估计量会等价于前面介绍的协方差估计量,即方差估计量,即 (8.19)现在学习的是第25页,共97页v(8.19)式或式或(8.13)式的协方差估计量是无偏的,它式的协方差估计量是无偏的,它的方差的方差
19、协方差矩阵为:协方差矩阵为:(8.20)v当当N或或T或二者都趋近于无穷时,协方差估计量或二者都趋近于无穷时,协方差估计量是一致估计量。但是一致估计量。但(8.14)式中的式中的 虽然是无偏的虽然是无偏的,但它仅当但它仅当T趋近于无穷时是一致估计量。趋近于无穷时是一致估计量。现在学习的是第26页,共97页8.2.4 平均效应的估计平均效应的估计 v当模型当模型(8.1)式中增加一个截距项式中增加一个截距项 时,则固定效时,则固定效应模型应模型(8.7)式相应的转变为:式相应的转变为:(8.21)v为了避免在为了避免在LSDM的设定中出现虚拟变量陷阱或的设定中出现虚拟变量陷阱或完全的多重共线性,
20、需要对完全的多重共线性,需要对(8.21)式中的式中的 施加约施加约束条件。一般假设束条件。一般假设 。现在学习的是第27页,共97页v根据前面的介绍,我们只能单独估计出根据前面的介绍,我们只能单独估计出 和和(),而无法单独的估计出,而无法单独的估计出 和和 。在。在 的约束条的约束条件下,件下,可以看成是横截面个体的平均截距项,可以看成是横截面个体的平均截距项,则是第则是第i个横截面个体与平均截距的差异。此时,个横截面个体与平均截距的差异。此时,依然可由协方差估计的结果依然可由协方差估计的结果(8.13)式获得,而式获得,而 的的估计量为:估计量为:(8.22)其中,其中,有了有了 和和
21、,即可进一步得到:,即可进一步得到:(8.23)现在学习的是第28页,共97页8.2.5 双向固定效应模型双向固定效应模型v将将(8.2)式代入式代入(8.1)式中,得到如下既反映横截面式中,得到如下既反映横截面固定效应又反映时间固定效应的双向固定效应模固定效应又反映时间固定效应的双向固定效应模型:型:(8.24)(8.24)式的矩阵形式为式的矩阵形式为 (8.25)现在学习的是第29页,共97页v其中,其中,现在学习的是第30页,共97页v对对(8.25)式进行式进行OLS估计即可得参数估计即可得参数 、和和 的的估计值。但由于这一估计过程中需要估计估计值。但由于这一估计过程中需要估计K+N
22、+T个参数,会损失较多的自由度,且有关的矩阵运个参数,会损失较多的自由度,且有关的矩阵运算也较为繁杂,因此在实际应用中采用的是协方算也较为繁杂,因此在实际应用中采用的是协方差估计法。差估计法。v对对(8.24)式的每一个横截面在时间上求平均,得:式的每一个横截面在时间上求平均,得:(8.26)v其中,其中,。对。对(8.24)式的每一时间求横截式的每一时间求横截面的平均,得:面的平均,得:(8.27)现在学习的是第31页,共97页v其中其中,。另外,定义:。另外,定义:v将将(8.26)式再对横截面平均或将式再对横截面平均或将(8.27)式再对时间式再对时间平均,得:平均,得:(8.28)现在
23、学习的是第32页,共97页v由由(8.24)式式-(8.26)式式-(8.27)式式+(8.28)式,得:式,得:(8.29)v对对(8.29)进行进行OLS估计,可以得到估计,可以得到 的协方差估计的协方差估计量量 。和和 的估计量为:的估计量为:(8.30)v由于由于(8.29)式中消除了随时间不变或随横截面不变式中消除了随时间不变或随横截面不变的解释变量,因此这些解释变量的系数的估计值的解释变量,因此这些解释变量的系数的估计值不在不在 当中。当中。现在学习的是第33页,共97页8.2.6 固定效应的检验固定效应的检验v前面介绍的横截面固定效应模型为前面介绍的横截面固定效应模型为 (8.3
24、1)v实际上,实际上,(8.31)式是假设存在横截面个体效应。但式是假设存在横截面个体效应。但是,如果这种效应不存在的话,则固定效应模型是,如果这种效应不存在的话,则固定效应模型实际上就等于以下合并回归模型:实际上就等于以下合并回归模型:(8.32)v因此,检验横截面效应是否存在,实际上是把因此,检验横截面效应是否存在,实际上是把(8.31)式看成是无约束模型,式看成是无约束模型,(8.32)式看成是约束式看成是约束模型,构造以下模型,构造以下F统计量进行检验:统计量进行检验:(8.33)现在学习的是第34页,共97页v其中,其中,S1是是(8.31)式的残差平方和,式的残差平方和,S2是是(
25、8.32)式式的残差平方和。其中的约束条件为:的残差平方和。其中的约束条件为:v同样,对于固定时间效应模型:同样,对于固定时间效应模型:(8.34)v检验固定时间效应是否存在的检验统计量为检验固定时间效应是否存在的检验统计量为 (8.35)v其中其中S3为为(8.34)式的残差平方和,其约束条件为:式的残差平方和,其约束条件为:。现在学习的是第35页,共97页v对于同时反映横截面固定效应和时间固定效应的对于同时反映横截面固定效应和时间固定效应的双效应模型:双效应模型:(8.36)v检验双效应(横截面效应和时间效应)是否存在检验双效应(横截面效应和时间效应)是否存在的检验统计量为的检验统计量为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 分析
限制150内