面板数据分析方法步骤计算机数据挖掘与模式识别高等教育大学课件.pdf
《面板数据分析方法步骤计算机数据挖掘与模式识别高等教育大学课件.pdf》由会员分享,可在线阅读,更多相关《面板数据分析方法步骤计算机数据挖掘与模式识别高等教育大学课件.pdf(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.面板数据分析方法步骤 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的 步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又 是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模 型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问 题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一 个简要总结,和大家分享一下,也希望大家都进来讨论讨论。步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间
2、本身不一 定有直接的关联,此时,对这些数据进行回归,尽管有较高的 R平方,但其结 果是没有任何实际意义的。这种情况称为虚假回归或伪回归(spurious regression。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时 间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三 种检验模式:既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平 稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可 以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的 折线是否含有趋势项
3、和(或)截距项,从而为进一步的单位根检验的检验模式做 准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程 中丄evin an dLi n(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果 也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al.(2002)的改进,提出了检验面板单位根的LLC法。Levin et al.(2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25250之间,截面数介于10250之间)的面板 单位根检验。Im et al.(1997)还提出了检验面板单位根
4、的IPS法,但 Breitung(2000)发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检 验的 Breitung 法。Maddala and Wu(1999又提出了 ADF-Fisher 和 PP-Fisher面板 单位根检验方法。由上述综述可知,可以使用 LLC、IPS、Breintung、ADF-Fisher 和 PP-Fisher5 种方法进行面板单位根检验。其中 LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z 分别指 Levin,Lin&Chu t*统计量、Breitung t 统计量、Im Pesaran&Shin W 统计量、ADF-Fish
5、er Chi-square 统计量、PP-Fisher Chi-square统计量、Hadri Z 统计量,并且Levin,Lin&Chu t*统计量、Breitung t统计量的原假设为存在普通的单位根 过程,Im Pesaran&Shin W 统计量、ADF-Fisher Chi-square 统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量 的检验原假设为不存在普通的单位根过程。有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检 验LLC(Levin-Lin-Chu)检验和不同根单位根检验 Fisher-ADF检验
6、(注:对普 通序列(非面板序列)的单位根检验方法则常用 ADF检验),如果在两种检验中 均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距 项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时 序图得出的结论,在单位根检验中选择相应检验模式。但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一 检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首 先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都 不含的模型。并且认为,只有
7、三个模型的检验结果都不能拒绝原假设时,我们才 认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就 可认为时间序列是平稳的。此外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位 根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高 阶差分后检验,直至序列平稳为止。我们记 1(0)为零阶单整,1(1)为一阶单整,依次类推,I(N)为N阶单整。步骤二:协整检验或模型修正 情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们 可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是 指若两个或多个非平稳的变量序列,其
8、某个线性组合后的序列呈平稳性。此时我 们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的 单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数 高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数 应该相同。也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也 不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。
9、而相对处 于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如 是必须的这些都是我们在研究的过程中需要考虑的而且又是很实在的问题面板单位根检验如何进行协整检验呢什么情况下要进行模型的修正面板模型回归形式的选择如何更有效的进行回归诸如此类的问题我们应该如何去分析并一一数据的平稳性单位根检验按照正规程序面板数据模型在回归前需检验数据的平稳性李子奈曾指出一些平稳的经济时间序列往往表现出共同的变化趋势而这些序列间本身不一定有直接的关联此时对这些数据进行回归尽管有较高的平方变的均值可视为截距和时间趋势以后剩余的序列为零均值同方差即白噪声因此单位根检验时有三种检验模式既有趋势又有截距只有
10、截距以上都无因此为了避免伪回归确保估计结果的有效性我们必须对各面板序列的平稳性进行检验而果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。协整检验方法的文献综述:Kao(1999)、Kao and Chiang(2000利用推广的 DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并 且利用静态面板回归的残差来构建统计量。(2)Pedro n(1999在零假设是在动态多 元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方
11、法允许异质面板的存在。Larsson et al(2001)发展了基于Johansen(1995向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。我们主要采用的是Pedroni、Kao、Johansen的方法。通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残 差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较 精确的。这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提 是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格 兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如
12、果 y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶 单整序列,并且要看它们此时有无经济意义。”下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定 不变的条件下,如果一个事件 X的发生与不发生对于另一个事件 丫的发生的概 率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个 事件在时间上又有先后顺序(A前B后),那么我们便可以说X是丫的原因。考 虑最简单的形式,Gran ger检验是运用F-统计量来检验X的滞后值是否显著影响 丫(在统计的意义下,且已经综合考虑了 丫的滞
13、后值;如果影响不显著,那么称 X不是丫的“Gran ger原因”(Gran ger cause;如果影响显著,那么称 X是丫的“Gran ger原因”。同样,这也可以用于检验 丫是X的“原因”,检验丫的滞后 值是否影响X(已经考虑了 X的滞后对X自身的影响)。Eviews好像没有在 POOL窗口中提供 Granger causality test,而只有 unit root test和cointegration test说明Eviews是无法对面板数据序列做格兰杰检 验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在 Eviews中是 针对普通的序列对(pairwise)而言的。你如果
14、想对面板数据中的某些合成序列做因 果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。是必须的这些都是我们在研究的过程中需要考虑的而且又是很实在的问题面板单位根检验如何进行协整检验呢什么情况下要进行模型的修正面板模型回归形式的选择如何更有效的进行回归诸如此类的问题我们应该如何去分析并一一数据的平稳性单位根检验按照正规程序面板数据模型在回归前需检验数据的平稳性李子奈曾指出一些平稳的经济时间序列往往表现出共同的变化趋势而这些序列间本身不一定有直接的关联此时对这些数据进行回归尽管有较高的平方变的均值可视为截距和时间趋势以后剩余的序列为零均值同方差即白
15、噪声因此单位根检验时有三种检验模式既有趋势又有截距只有截距以上都无因此为了避免伪回归确保估计结果的有效性我们必须对各面板序列的平稳性进行检验而情况二:如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板 数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列 进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们 前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某 些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列 进行二阶差分,因为对变动数据或增
16、长率数据再进行差分,我们不好对其冠以经 济解释。难道你称其为变动率的变动率?步骤三:面板模型的选择与回归 面板数据模型的选择通常有三种形式:一种是混合估计模型(Pooled Regression Mode)。如果从时间上看,不同个 体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那 么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。一种 是固定效应模型(Fixed Effects Regression Mode)。如果对于不同的截面或不同 的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回 归参数。一种是随机效应模型(Ran dom E
17、ffects Regressio n Mod。如果固定效 应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这 两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型 还是固定效应模型,然后用 Hausman检验确定应该建立随机效应模型还是固定 效应模型。检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:在回归的时候,权数可以选择按截面加权(cross-section weights的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差 现象。估计方法采用 PCS
18、E(Panel Corrected Standard Errors面板校正标准误)方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的一个 创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。实证检验步骤:先做单位根检验,看变量序列是否平稳序列,若平稳,可构 造回归模型等经典计量经济学模型;若非平稳,进行差分,当进行到第 i次差分 时序列平稳,则服从i阶单整(注意趋势、截距不同情况选择,根据 P值和原假 设判定)若所有检验序列均服从同阶单整,可构造 VAR模型,做协整检验(注意滞 后期的选择),判断模型内部变量间是否存
19、在协整关系,即是否存在长期均衡关 系。协整检是必须的这些都是我们在研究的过程中需要考虑的而且又是很实在的问题面板单位根检验如何进行协整检验呢什么情况下要进行模型的修正面板模型回归形式的选择如何更有效的进行回归诸如此类的问题我们应该如何去分析并一一数据的平稳性单位根检验按照正规程序面板数据模型在回归前需检验数据的平稳性李子奈曾指出一些平稳的经济时间序列往往表现出共同的变化趋势而这些序列间本身不一定有直接的关联此时对这些数据进行回归尽管有较高的平方变的均值可视为截距和时间趋势以后剩余的序列为零均值同方差即白噪声因此单位根检验时有三种检验模式既有趋势又有截距只有截距以上都无因此为了避免伪回归确保估计
20、结果的有效性我们必须对各面板序列的平稳性进行检验而验的原假设就是,变量回归后的残差是平稳序列。如若残差是平稳序 列,说明存在协整关系,如果残差序列有单位根,则协整关系不存在。如果有协 整关系,则可以构造 VEC模型或者进行Gran ger因果检验,检验变量之间“谁 引起谁变化”,即因果关系。(1)建立混合数据库(Pool)对象。首先建立工作文件。在打开工作文件窗口的基础上,点击 EViwes主功能菜 单上的Objects键,选New Object功能,从而打开New Object(新对象)选择窗。在Type of Object选择区选择Pool(合并数据库),并在Name of Object选
21、择区为 混合数据库起名Pool01(初始显示为Un titled)。(2)定义序列名并输入数据。在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击 View 键,选 Spreadsheet(stacked data)能),从而打开 Series List(列写序 列名)窗口,定义时间序列变量丫?和X.点击OK键,从而打开混合数据库(Pool)窗口,(点击Edit+-键,使EViwes处于可编辑状态)输入数据。补充:点击Orde叶-键,还可以变换为以时间为序的阵列式排列。工作文件也可以以合并数据(Pool data)和非合并数据的形式用复制和粘贴 的方法建立。(3)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 分析 方法 步骤 计算机 挖掘 模式识别 高等教育 大学 课件
限制150内