《时间序列计量经济学模型的理论与方法幻灯片.ppt》由会员分享,可在线阅读,更多相关《时间序列计量经济学模型的理论与方法幻灯片.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、时间序列计量经济学模型的理论与方法第1页,共61页,编辑于2022年,星期六9.1 9.1 时间序列的平稳性及其检验时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归一、问题的引出:非平稳变量与经典回归模型模型二、时间序列数据的平稳性二、时间序列数据的平稳性三、平稳性的图示判断三、平稳性的图示判断四、平稳性的单位根检验四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程五、单整、趋势平稳与差分平稳随机过程第2页,共61页,编辑于2022年,星期六一、问题的引出:非平稳变量与经典回一、问题的引出:非平稳变量与经典回归模型归模型第3页,共61页,编辑于2022年,星期六常见的数据类
2、型常见的数据类型到目前为止,经典计量经济模型常用到的数据有:到目前为止,经典计量经济模型常用到的数据有:时间序列数据时间序列数据(time-series data);截面数据截面数据(cross-sectional data)平行平行/面板数据面板数据(panel data/time-series cross-section data)时间序列数据是最常见,也是最常用到的数据时间序列数据是最常见,也是最常用到的数据。第4页,共61页,编辑于2022年,星期六经典回归模型与数据的平稳性经典回归模型与数据的平稳性经典回归分析经典回归分析暗含暗含着一个重要着一个重要假设假设:数据是平稳的。数据是平稳
3、的。数据非平稳数据非平稳,大样本下的统计推断基础,大样本下的统计推断基础“一致性一致性”要要求求被破怀。被破怀。经典回归分析的假设之一:解释变量经典回归分析的假设之一:解释变量X是非随机变量是非随机变量放宽该假设:放宽该假设:X是随机变量,则需进一步要求:是随机变量,则需进一步要求:(1)X与随机扰动项与随机扰动项 不相关不相关 Cov(X,)=0依概率收敛:依概率收敛:(2)第5页,共61页,编辑于2022年,星期六 第(2)条是为了满足统计推断中大样本下的“一致性”特性:第(1)条是OLS估计的需要如果如果X是非平稳数据是非平稳数据(如表现出向上的趋势),则(如表现出向上的趋势),则(2)
4、不成立,回归估计量不满足不成立,回归估计量不满足“一致性一致性”,基于大样本的,基于大样本的统计推断也就遇到麻烦。统计推断也就遇到麻烦。因此:注意:注意:在双变量模型中:在双变量模型中:第6页,共61页,编辑于2022年,星期六 表现在表现在:两个本来没有任何因果关系的变量,却有很高的两个本来没有任何因果关系的变量,却有很高的相关性相关性(有较高的R2):例如:例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中在现实经济生活中:情况往往是实际的时间序列数据是非平稳的实际的时间序列数据是非平稳的,而且主
5、要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。一般不会得到有意义的结果。数据非平稳,往往导致出现数据非平稳,往往导致出现“虚假回归虚假回归”问问题题第7页,共61页,编辑于2022年,星期六 时间序列分析时间序列分析模型方法模型方法就是在这样的情况下,以通以通过揭示时间序列自身的变化规律为主线而发展起来的过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论全新的计量经济学方法论。时间序列分析时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中
6、。第8页,共61页,编辑于2022年,星期六二、时间序列数据的平稳性二、时间序列数据的平稳性第9页,共61页,编辑于2022年,星期六 时间序列分析中首先遇到的问题首先遇到的问题是关于时间序列数据的平稳性平稳性问题。假定某个时间序列是由某一假定某个时间序列是由某一随机过程随机过程(stochastic process)生成的,即假定时间序列)生成的,即假定时间序列Xt(t=1,2,)的每一)的每一个数值都是从一个概率分布中随机得到,如果满足下列条个数值都是从一个概率分布中随机得到,如果满足下列条件:件:1)均值)均值E(XE(Xt t)=)=是是与时间与时间t 无关的常数;无关的常数;2)方差
7、)方差Var(XVar(Xt t)=)=2 2是是与时间与时间t 无关的常数;无关的常数;3)协方差)协方差Cov(XCov(Xt t,X,Xt+kt+k)=)=k k 是是只与时期间隔只与时期间隔k有关,与时有关,与时间间t 无关的常数;无关的常数;则称该随机时间序列是则称该随机时间序列是平稳的平稳的(stationary),而该随机过,而该随机过程是一程是一平稳随机过程平稳随机过程(stationary stochastic process)。)。第10页,共61页,编辑于2022年,星期六 例例9.1.1一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t ,tN(0,2
8、)例例9.1.2另一个简单的随机时间列序被称为随随机机游游走走(random walk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。该序列常被称为是一个白噪声白噪声(white noise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的一个白噪声序列是平稳的。第11页,共61页,编辑于2022年,星期六 为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知 X1=X0+1 X2=X1+2=X0+1+2 X Xt t=X=X0 0+1+2+t 由于X0为常数,t是一个白噪声,因此Var(Xt)=t2 即即Xt的方差与时间的方差与时
9、间t t有关而非常数,它是一非平稳序列。有关而非常数,它是一非平稳序列。容易知道该序列有相同的均值均值:E(Xt)=E(Xt-1)第12页,共61页,编辑于2022年,星期六然而,对X取一阶差分一阶差分(first difference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列Xt是平稳的。后面将会看到后面将会看到:如果一个时间序列是非平稳的,它常常如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列可通过取差分的方法而形成平稳序列。事事实实上上,随随机机游游走走过过程程是是下下面面我我们们称称之之为为1 1阶阶自自回回归归AR(1)AR(1)过程过程的特例的特例 X
10、 Xt t=X Xt-1t-1+t 不不难难验验证证:1)|1|1时时,该该随随机机过过程程生生成成的的时时间间序序列列是是发发散散的的,表表现现为为持持续续上上升升(1)1)或或持持续续下下降降(-1)-1),因因此此是是非平稳的;非平稳的;第13页,共61页,编辑于2022年,星期六 第二节中将证明第二节中将证明:只有当只有当-1-1 10,样样本本自自相相关关系系数数近近似似地地服服从从以以0为为均均值,值,1/n 为方差的正态分布,其中为方差的正态分布,其中n为样本数。为样本数。也也可可检检验验对对所所有有k0k0,自自相相关关系系数数都都为为0 0的的联联合合假假设设,这可通过如下这
11、可通过如下Q QLBLB统计量进行:统计量进行:第20页,共61页,编辑于2022年,星期六 该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的如果计算的Q Q值大于显著性水平值大于显著性水平为为 的临界值,则有的临界值,则有1-1-的把握拒绝所有的把握拒绝所有 k k(k0)(k0)同时为同时为0 0的假设。的假设。例例9.1.3:9.1.3:表表9.1.19.1.1序列序列Random1Random1是通过是通过一随机过程(随机函数)生成的有一随机过程(随机函数)生成的有1919个样个样本的随机时间序列。本的随机时间序列。第21页,共61页,编辑于2022年,星期六第2
12、2页,共61页,编辑于2022年,星期六容易验证:该样本序列的均值为该样本序列的均值为0 0,方差为,方差为0.07890.0789。从图形看:它在其样本均值它在其样本均值0 0附近上下波动,且样本自相关系附近上下波动,且样本自相关系数迅速下降到数迅速下降到0 0,随后在,随后在0 0附近波动且逐渐收敛于附近波动且逐渐收敛于0 0。第23页,共61页,编辑于2022年,星期六 由于该序列由一随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。该序列为一白噪声。根据Bartlett的理论:kN(0,1/19)因此任一rk(k0)的95%的置信区间都将是 可以看出可以看出:k0k0时,时
13、,r rk k的值确实落在了该区间内,的值确实落在了该区间内,因此可以接受因此可以接受 k k(k0)k0)为为0 0的假设的假设。同样地,从从Q QLBLB统计量的计算值看,滞后统计量的计算值看,滞后1717期的计期的计算值为算值为26.3826.38,未超过,未超过5%5%显著性水平的临界值显著性水平的临界值27.5827.58,因此因此,可以接受所有的自相关系数可以接受所有的自相关系数 k k(k0)k0)都为都为0 0的假设。的假设。因此,该随机过程是一个平稳过程。该随机过程是一个平稳过程。第24页,共61页,编辑于2022年,星期六 序列Random2是由一随机游走过程 Xt=Xt-
14、1+t 生成的一随机游走时间序列样本。其中,第0项取值为0,t是由Random1表示的白噪声。第25页,共61页,编辑于2022年,星期六 样本自相关系数显示样本自相关系数显示:r1=0.48,落在了区间-0.4497,0.4497之外,因此在5%的显著性水平上拒绝1的真值为0的假设。该随机游走序列是非平稳的。该随机游走序列是非平稳的。图形表示出:图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。第26页,共61页,编辑于2022年,星期六第27页,共61页,编辑于2022年,星期六 图形:表现出了一个持续上升的过程
15、图形:表现出了一个持续上升的过程,可,可初步判断初步判断是非平稳是非平稳的。的。样本自相关系数:缓慢下降样本自相关系数:缓慢下降,再次表明它,再次表明它的的非平稳非平稳性。性。第28页,共61页,编辑于2022年,星期六 拒拒绝绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。结论结论:19782000年间中国GDP时间序列是非平稳序列。从滞后从滞后18期的期的QLB统计量看:统计量看:QLB(18)=57.1828.86=20.05第29页,共61页,编辑于2022年,星期六例例9.1.59.1.5 检验2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。原图 样本自
16、相关图 第30页,共61页,编辑于2022年,星期六从图形上看:从图形上看:人均居民消费(CPC)与人均国内生产总值(GDPPC)是非平稳的是非平稳的。从滞后从滞后1414期的期的QLB统计量看:统计量看:CPC与GDPPC序列的统计量计算值均为57.18,超过了显著性水平为5%时的临界值23.68。再次表明它表明它们的非平稳性。们的非平稳性。就此来说,运用传统的回归方法建立它们的回归方就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。程是无实际意义的。不过,第三节中将看到,如果两个非平稳时间序不过,第三节中将看到,如果两个非平稳时间序列是列是协整协整的,则传统的回归结果却是有意义
17、的,而这两的,则传统的回归结果却是有意义的,而这两时间序列恰是时间序列恰是协整协整的。的。第31页,共61页,编辑于2022年,星期六四、平稳性的单位根检验四、平稳性的单位根检验第32页,共61页,编辑于2022年,星期六 对时间序列的平稳性除了通过图形直观判断外,运用统计量进行统计检验则是更为准确与重要的。单位根检验(单位根检验(unit root test)是统计检验中普遍应用的一种检验方法。1 1、DFDF检验检验我们已知道,随机游走序列 Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型 Xt=Xt-1+t中参数=1时的情形。第33页,共61页,编辑于2022年,星
18、期六也就是说,我们对式 Xt=Xt-1+t (*)做回归,如果确实发现=1,就说随机变量Xt有一个单位根单位根。(*)式可变形式成差分形式:Xt=(1-)Xt-1+t =Xt-1+t (*)检验(*)式是否存在单位根=1,也可通过(*)式判断是否有=0。第34页,共61页,编辑于2022年,星期六 一般地一般地:检验一个时间序列检验一个时间序列XtXt的平稳性,可通过检验带有的平稳性,可通过检验带有截距项的一阶自回归模型截距项的一阶自回归模型 X Xt t=+X Xt-1t-1+t t (*)中的参数中的参数 是否小于是否小于1 1。或者:或者:检验其等价变形式检验其等价变形式 X Xt t=
19、+X Xt-1t-1+t t (*)中的参数中的参数 是否小于是否小于0 0。在第二节中将证明,(*)式中的参数 11或或=1=1时,时间序列时,时间序列是非平稳的是非平稳的;对应于(*)式,则是 00或或 =0。第35页,共61页,编辑于2022年,星期六因此,针对式 X Xt t=+X Xt-1t-1+t t 我们关心的检验为:零假设零假设 H0:=0。备择假设备择假设 H1:0 上述检验可通过上述检验可通过OLS法下的法下的t检验完成。检验完成。然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。Dicky和Fuller于1976年提出
20、了这一情形下t统计量服从的分布(这时的t统计量称为 统统计计量量),即DF分分布布(见表9.1.3)。由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。第36页,共61页,编辑于2022年,星期六 因此,可通过OLS法估计 X Xt t=+X Xt-1t-1+t t 并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:如果:如果:t临界值,则拒绝零假设临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。认为时间序列不存在单位根,是平稳的。第37页,共61页,编辑于2022年,星期六注意:在不同的教科书上有不同的描述,但是结果注意:在不同的教科书上有不同的描述,
21、但是结果是相同的。是相同的。例如:例如:“如果计算得到的如果计算得到的t统计量的绝对值大于临统计量的绝对值大于临界值的绝对值,则拒绝界值的绝对值,则拒绝=0”的假设,原序列不存的假设,原序列不存在单位根,为平稳序列。在单位根,为平稳序列。第38页,共61页,编辑于2022年,星期六 进一步的问题进一步的问题:在上述使用 X Xt t=+X Xt-1t-1+t t对时间序列进行平稳性检验中,实实际际上上假假定定了了时时间间序序列列是是由由具具有有白白噪声随机误差项的一阶自回归过程噪声随机误差项的一阶自回归过程AR(1)生成的生成的。但但在在实实际际检检验验中中,时时间间序序列列可可能能由由更更高
22、高阶阶的的自自回回归归过过程程生生成成的的,或或者者随随机机误误差差项项并并非非是是白白噪噪声声,这样用OLS法法进进行行估估计计均均会会表表现现出出随随机误差项出现自相关机误差项出现自相关(autocorrelation),导致DF检验无效。另另外外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随机误差项问题自相关随机误差项问题。为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller)检验)检验。2 2、ADFADF检验检验第39页,共61页,编辑于202
23、2年,星期六ADF检验是通过下面三个模型完成的:检验是通过下面三个模型完成的:模模型型3 中中的的t是是时时间间变变量量,代表了时间序列随时间变化的某种趋势(如果有的话)。检检验验的的假假设设都都是是:针针对对H1:临界值,不能拒绝存在单位根的零假设。临界值,不能拒绝存在单位根的零假设。时间T的t统计量小于ADF分布表中的临界值,因此不不能能拒拒绝绝不不存存在在趋势项的零假设趋势项的零假设。需进一步检验模型需进一步检验模型2。第44页,共61页,编辑于2022年,星期六2)经试验,模型2中滞后项取2阶:LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的。从GDPt-1的参数值看,其t
24、统计量为正值,大于临界值,不不能能拒拒绝绝存在单位根的零假设存在单位根的零假设。常数项的t统计量小于AFD分布表中的临界值,不不能能拒拒绝绝不不存存常数项的零假设。常数项的零假设。需进一步检验模型1。第45页,共61页,编辑于2022年,星期六3)经试验,模型1中滞后项取2阶:LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的。从GDPt-1的参数值看,其t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。不能拒绝存在单位根的零假设。可断定中国支出法可断定中国支出法GDP时间序列是非平稳的。时间序列是非平稳的。第46页,共61页,编辑于2022年,星期六例例9.1.7 检验2.1
25、0中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。1)对中中国国人人均均国国内内生生产产总总值值GDPPC来说,经过偿试,三个模型的适当形式分别为第47页,共61页,编辑于2022年,星期六 三个模型中参数的估计值的t统计量均大于各自的临界值,因此不能拒绝存在单位根的零假设不能拒绝存在单位根的零假设。结论:人均国内生产总值(人均国内生产总值(GDPPC)是非平稳的。)是非平稳的。第48页,共61页,编辑于2022年,星期六2)对于人均居民消费CPC时间序列来说,三个模型的适当形式为 第49页,共61页,编辑于2022年,星期六 三个模型中参数CPCt-1的t统计量的值均比ADF临界值
26、表中各自的临界值大,不不能能拒拒绝绝该该时时间间序序列列存存在在单位根的假设单位根的假设,因此,可判断人均居民消费序列可判断人均居民消费序列CPC是非平稳的。是非平稳的。第50页,共61页,编辑于2022年,星期六五、单整、趋势平稳与差分平稳随机过五、单整、趋势平稳与差分平稳随机过程程第51页,共61页,编辑于2022年,星期六 随机游走序列 Xt=Xt-1+t经差分后等价地变形为 Xt=t 由于t是一个白噪声,因此差差分分后后的的序序列列 Xt是是平平稳稳的。的。单整单整第52页,共61页,编辑于2022年,星期六 一般地,如果一个时间序列经过一般地,如果一个时间序列经过d次差分后变成平稳序
27、列,则次差分后变成平稳序列,则称原序列是称原序列是d 阶单整阶单整(integrated of d)序列序列,记为,记为I(d)。显然,I(0)代表一平稳时间序列。代表一平稳时间序列。现实经济生活中现实经济生活中:1)只有少数经济指标的时间序列表现为平稳的,只有少数经济指标的时间序列表现为平稳的,如利率等如利率等;2)大大多多数数指指标标的的时时间间序序列列是是非非平平稳稳的的,如如一一些些价价格格指指数数常常常常是是2阶阶单整的,以不变价格表示的消费额、收入等常表现为单整的,以不变价格表示的消费额、收入等常表现为1阶单整。阶单整。大大多多数数非非平平稳稳的的时时间间序序列列一一般般可可通通过
28、过一一次次或或多多次次差差分分的的形形式式变变为为平平稳的。稳的。但但也也有有一一些些时时间间序序列列,无无论论经经过过多多少少次次差差分分,都都不不能能变变为为平平稳稳的的。这种序列被称为这种序列被称为非单整的(非单整的(non-integrated)。如果一个时间序列经过一次差分变成平稳的,就称原序列是如果一个时间序列经过一次差分变成平稳的,就称原序列是一阶一阶单整单整(integrated of 1)序列序列,记为,记为I(1)。第53页,共61页,编辑于2022年,星期六例例9.1.8 中国支出法GDP的单整性。经过试算,发现中中国国支支出出法法GDP是是1阶阶单单整整的的,适当的检验
29、模型为第54页,共61页,编辑于2022年,星期六例例9.1.9 中国人均居民消费与人均国内生产总值的单整性。经过试算,发现中中国国人人均均国国内内生生产产总总值值GDPPC是是2阶阶单单整整的的,适当的检验模型为 同样地,CPC也是也是2阶单整的阶单整的,适当的检验模型为第55页,共61页,编辑于2022年,星期六 趋势平稳与差分平稳随机过程趋势平稳与差分平稳随机过程 前文已指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的R2,但其结果是没有任何实际意义的。这种现象我们称之为虚虚假假回回归归或或伪回归伪回归(
30、spurious regression)。如:用中国的劳动力时间序列数据与美国GDP时间序列作回归,会得到较高的R2,但不能认为两者有直接的关联关系,而只不过它们有共同的趋势罢了,这种回归结果我们认为是虚假的。第56页,共61页,编辑于2022年,星期六为了避免这种虚假回归的产生,通常的做法是引入作为趋势变量的时间,这样包含有时间趋势变量的回归,可以消除这种趋势性的影响。然而这种做法,只有当趋势性变量是确确定定性性的的(deterministic)而非随随机机性性的的(stochastic),才会是有效的。换言之,如如果果一一个个包包含含有有某某种种确确定定性性趋趋势势的的非非平平稳稳时时间间
31、序序列列,可可以以通通过过引引入入表表示示这这一一确确定定性性趋趋势势的的趋势变量,而将确定性趋势分离出来。趋势变量,而将确定性趋势分离出来。第57页,共61页,编辑于2022年,星期六1)如果=1,=0,则(*)式成为一一带带位位移移的的随随机机游游走走过程过程:Xt=+Xt-1+t (*)根据的正负,Xt表现出明显的上升或下降趋势。这种趋势称为随机性趋势(随机性趋势(stochastic trend)。2)如果=0,0,则(*)式成为一带时间趋势的随机变化过程:Xt=+t+t (*)根据的正负,Xt表现出明显的上升或下降趋势。这种趋势称为确定性趋势(确定性趋势(deterministic
32、trend)。考虑如下的含有一阶自回归的随机过程:Xt=+t+Xt-1+t (*)其中:t是一白噪声,t为一时间趋势。第58页,共61页,编辑于2022年,星期六 3)如果=1,0,则Xt包含有确定性与随机性两种确定性与随机性两种趋势。趋势。判断一个非平稳的时间序列,它的趋势是随机性的还是确定性的,可通过ADF检验中所用的第3个模型进行。该模型中已引入了表示确定性趋势的时间变量t,即分离出了确定性趋势的影响。因此,(1)如如果果检检验验结结果果表表明明所所给给时时间间序序列列有有单单位位根根,且且时时间间变变量量前前的的参参数数显显著著为为零零,则则该该序序列列显显示示出出随随机性趋势机性趋势
33、;(2)如如果果没没有有单单位位根根,且且时时间间变变量量前前的的参参数数显显著著地地异于零,则该序列显示出确定性趋势。异于零,则该序列显示出确定性趋势。第59页,共61页,编辑于2022年,星期六 随机性趋势可通过差分的方法消除随机性趋势可通过差分的方法消除 如:对式Xt=+Xt-1+t 可通过差分变换为 Xt=+t 该时间序列称为差分平稳过程(差分平稳过程(difference stationary process);第60页,共61页,编辑于2022年,星期六确定性趋势无法通过差分的方法消除,而只能通确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除,过除去趋势项消除,如:对式Xt=+t+t可通过除去t变换为Xt-t=+t该时间序列是平稳的,因此称为趋势平稳过程趋势平稳过程(trend stationary process)。)。最后需要说明的是,最后需要说明的是,趋势平稳过程代表了一个时趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于进行长期预测间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。则是更为可靠的。第61页,共61页,编辑于2022年,星期六
限制150内