chapter时间序列数实用.pptx
10.1时间序列数据的性质(i)时间序列数据集按照时间顺序排列的 例子:波多黎各的最低工资、失业及相关数据obsnoyear avgminavgcovunempgnp119500.2020.115.4878.7219510.2120.716.0925.0319520.2322.614.81015.9 3819873.3558.216.84496.7过去影响未来,而不是相反第1页/共47页(ii)时间序列数据的随机性时间序列满足随机变量的结果所要求的直观条件 随机过程或者时间序列过程:标注有时间的一个随机变量序列 Eg:无法知道股市下一个交易日的确切的收盘指数是多少?当搜集到一组时间序列,就得到该随机过程的一个可能的结果或实现什么是时间序列数据的“总体”?一个时间序列过程的所有可能实现集第2页/共47页10.2时间序列回归模型的例子静态模型与有限分布滞后模型这两种模型在经验的时间序列分析中很有用,且容易用OLS来估计第3页/共47页10.2.1 静态模型假设有y和z的时间序列数据,一个静态模型为:该模型反映了y和z之间同一时期的关系例子:静态的菲利普斯曲线同一时期内,失业率和通货膨胀率之间的关系。第4页/共47页例子:有多个解释变量的静态模型 mrdrtet:某特定城市在第t年中平均每千人中发生的谋杀案件数;convrtet:谋杀案的定罪率;unemt:本地失业率;yngmlet:当地人口中18-25岁之间的男性人口比例第5页/共47页10.2.2 有限分布滞后模型(FDL)有限分布滞后模型,允许一个或多个变量对y的影响有一定的时滞。第6页/共47页即期倾向或即期乘数z的这个暂时变化后的下一个时期y的变化z的这个暂时变化后第二个时期y的变化第7页/共47页滞后分布:z的暂时变化对y的影响系数滞后期1234两阶FDL模型的滞后分布真实值永远不知道第8页/共47页Z的永久性提高对y产生的影响Z变化的即期倾向Z变化一期以后对y的影响Z变化两期以后对y的影响长期倾向(LRP)第9页/共47页p一个q阶有限分布滞后模型:静态模型是其的一种特例:1 1,p p都设为0 0长期倾向:第10页/共47页10.2.3标注时间的惯例对于FDL模型,我们假定从t=1时刻开始成立第一期的解释变量为z1、z0、z-1第11页/共47页10.3经典假设下OLS的有限样本性质10.3.1OLS的无偏性假定TS.1 对参数是线性的 随机过程(xt1,xt2,xtk,yt):t=1,2,n遵循线性模型 式中,ut:t=1,2,n为误差序列。TS.1与MLR.1本质上是相同的第12页/共47页假定TS.2 无完全共线性 在样本中,没有任何自变量是恒定不变的,或者是其他自变量的一个完全的线性组合。该假定允许解释变量相关,但不允许完全相关第13页/共47页假定TS.3 条件均值为0 对于每一个t,当所有时期的解释变量都给定时,误差项的期望值为0,记为:与横截面数据类似,时间序列数据有Xtj是同期外生的第14页/共47页假定TS.3只要求“同期外生”吗 当TS.3成立时,解释变量是严格外生的。注意:TS.3并没有对自变量之间或不同时期的ut的相关性做出任何限制。否。ut必须与xsj不相关,即使s不等于t。同期外生一致的,严格外生无偏的第15页/共47页导致假定TS.3 无效的原因遗漏变量某些自变量的测量误差其他更不明显的原因,比如简单静态模型如果y对z的将来值有反馈作用,则该假定无效第16页/共47页y对z的将来值有反馈作用的例子:如果城市根据过去犯罪率的多少来调整警力规模,则意味着polpet+1可能与ut相关,因为较高的ut导致较高的mrdrtet第17页/共47页严格外生的解释变量无法对过去发生在y上的变化做出反应 有的变量满足这样的要求:未来各年的降雨量不受现在或过去产量的影响。更多的变量无法满足这样的要求:劳动投入量、货币供给的增长等。虽然TS.2不太现实,但仍然以它为出发点第18页/共47页定理10.1 OLS的无偏性 当假定TS.1TS.3成立时,对于给定的X,OLS的估计量是无偏的,即第19页/共47页10.3.2OLS估计量的方差和高斯-马尔科夫定理假定TS.4 同方差性 给定X,ut的方差在所有的时间t上都相等:当TS.4不成立时,则误差是异方差的第20页/共47页假定TS.5 无序列相关 给定X,任意两个不同时期的误差不相关:如果此式不成立,则误差是序列相关的或自相关的自变量之间在时间上自变量之间在时间上的相关不影响的相关不影响TS.5TS.5第21页/共47页思考题:为什么对于横截面数据不做误差不相关的假定?假定TS.1TS.5是应用于时间序列的高斯-马尔科夫假定 有随机抽样假定第22页/共47页定理10.2 OLS的样本方差 在时间序列的高斯-马尔科夫假定成立时,有 SSTj为xtj的总平方和;为由xj对其他自变量回归得到的R2。第23页/共47页定理10.3 误差方差估计量的无偏性 在假定TS.1TS.5下,估计量 是 的一个无偏估计量。定理10.4 高斯-马尔科夫定理 在假定TS.1TS.5下,给定X的值,OLS估计量是最优线性无偏估计量。第24页/共47页10.3.3经典线性模型假设下的推断假定TS.6 正态性 误差ut独立于X,且独立同分布,服从均值为0,方差为 的正态分布该假定蕴含了TS.3,TS.4,TS.5,但更强,因为它还包含了独立性和正态性第25页/共47页定理10.5 正态抽样分布 在假定TS.1TS.6下,给定X,OLS估计量遵循正态分布。而且在虚拟假设下,t统计量呈t分布,F统计量呈F分布,通常构造置信区间的方法也是有效的。换言之,当假定TS.1TS.6成立时,所学过的关于横截面回归的估计和推断地全部内容可直接用到时间序列回归中。第26页/共47页Example:静态菲力普斯曲线我们想要检验失业和通货膨胀之间是否存在替代关系,H0:1=0,H1:10,a20,则这个趋势的斜率为负。二次时间趋势第35页/共47页10.5.2 在回归分析中使用趋势变量仅仅因为每个变量都随着时间增长,而在两个或更多趋势变量之间找到某种关系的现象是谬误回归的一个例子。增加一个时间趋势变量可以消除谬误回归xt3=t,不能省略,特别是当x1、x2本身也具有趋势时Y随时间的增加从本质上来说与x1,x2无关第36页/共47页Example:房产投资与价格根据对美国1947-1988年房产投资和房产价格指数的数据,得到如下估计结果:也具有趋势,则会出现谬误回归第37页/共47页Example:生育方程 变为原来的3倍多,且更为显著符号变化,且变得不显著显著,说明gft随时间不断下降注意到在1913-1984年间生育率先下降后上升,所以考虑二次趋势:系数更大且更显著表现出负影响,显著性提高都是显著的第38页/共47页10.5.3 对包含时间趋势回归的除趋势解释如何解释?去除了线性趋势后的yt除趋后的x没有时间趋势的回归第39页/共47页Example:波多黎各的就业和最低工资 prepopt为第t年的就业率;usgnpt为美元衡量的实际GNP(单位:十亿美元);mincovt=(avgmint/avgwaget)avgcovt,avgmint 为平均最低工资,avgwaget为总体平均工资,avgcovt为平均工资覆盖率。没有趋势有趋势第40页/共47页小结:在回归模型中引进时间趋势,相当于在回归分析中在使用原始数据之前将它们的趋势去掉.无论有多少个自变量,也无论趋势是二次的还是更高次的,这个结论都成立。如果自变量含有趋势,即使因变量不含趋势,在回归中包含一个时间趋势也不失为一种好办法。第41页/共47页10.5.4 因变量有趋势时R2的计算时间序列回归中的R2通常很大,与典型的横截面数据的R2相比尤其是这样。当因变量有趋势时,普通或者调整的R2可能会人为地变大因为R2度量的是y的总体变异中能够被x解释的部分,而在因变量有趋势时,y的总变异中还有因为时间趋势而导致的变异。第42页/共47页解决方法:在一个因变量已经去掉趋势的回归中计算普通的R2。例如,因变量y先对t作回归,得到残差 ;然后 再对自变量作回归。注意:计算F统计量时依然用没有除趋时的R2.第43页/共47页10.5.5 季节性如果一个时间序列是由定期如每月或每季度(甚至每周或每天)观测而得到的,它就有可能表现出季节性。比如:第四季度的零售额正常情况下会比前三个季度高;不同月份的房产动工数量会有一定的差异,等等尽管有很多月度和季度数据表现出季节性变化,但不是所有的都如此。比如:利息率、通胀率并没有明显的季节性变化。第44页/共47页很多情况,有季节性变化的序列通常在公布前已经进行了季节性调整,比如一些季度、月度的宏观数据。面对未经季节性调整的数据,如何处理?在模型中包括一组季节性虚拟变量来解释因变量或自变量中的季节性。例如:如果数据是按季度给出的,如何处理?第45页/共47页像在回归中加入时间趋势可以理解为首先去掉趋势一样,在回归中加入季节虚拟变量可以看作是除季节性。表现出季节性的时间序列也可能有某种趋势。这需要在回归模型中同时包含时间趋势变量和季节性虚拟变量。第46页/共47页感谢您的观赏!第47页/共47页