数学建模——时间序列分析精选PPT.ppt
关于数学建模关于数学建模时时间序列分析间序列分析第1页,讲稿共187张,创作于星期二7000年前的古埃及人把年前的古埃及人把 尼罗河尼罗河涨落的情况逐天记录下来,就构涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了及的农业迅速发展,从而创建了埃及灿烂的史前文明。埃及灿烂的史前文明。引例引例第2页,讲稿共187张,创作于星期二引例引例第3页,讲稿共187张,创作于星期二时间序列:序列:某一系某一系统在不同的在不同的时间(地点或其他条件等)的(地点或其他条件等)的响响应(数据)。(数据)。时间序列是按序列是按一定的一定的顺序序排列而成,排列而成,“一定一定顺序序”既可以既可以是是时间顺序,也可以是具有不同意序,也可以是具有不同意义的物理量。的物理量。如:如:研究高度与气研究高度与气压的关系,的关系,这里的高度就可以看作里的高度就可以看作“时间”总而言之,而言之,时间序列只是序列只是强调顺序的重要性,因此又被称序的重要性,因此又被称为“纵向数据向数据”,相,相对于于“横向数据横向数据”而言的。而言的。什么是时间序列什么是时间序列第4页,讲稿共187张,创作于星期二时间序列数据的序列数据的预处理理 平平稳性性检验 纯随机性随机性检验 平平稳时间序列数据分析序列数据分析非平非平稳时间序列数据分析序列数据分析内容提要内容提要第5页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理基本概念基本概念平稳性检验平稳性检验纯随机性检验纯随机性检验第6页,讲稿共187张,创作于星期二概率分布概率分布的意义的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定数决定 时间序列时间序列概率分布族概率分布族的定义的定义几个重要几个重要数字特征数字特征:均值:均值 、方差、自协方差、自相关系数、方差、自协方差、自相关系数时间序列数据的预处理时间序列数据的预处理1 基本概念基本概念1.1 基本的数字特征基本的数字特征第7页,讲稿共187张,创作于星期二特征统计量特征统计量均值均值 方差方差自协方差自协方差自相关系数自相关系数时间序列数据的预处理时间序列数据的预处理第8页,讲稿共187张,创作于星期二1.2 平稳时间序列的定义平稳时间序列的定义严平稳严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。化时,该序列才能被认为平稳。宽平稳宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。主要性质近似稳定。时间序列数据的预处理时间序列数据的预处理第9页,讲稿共187张,创作于星期二满足如下条件的序列称为满足如下条件的序列称为宽平稳序列宽平稳序列时间序列数据的预处理时间序列数据的预处理第10页,讲稿共187张,创作于星期二常数均值和方差常数均值和方差 自协方差函数和自相关函数只依赖于时间的平移长度,自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起止点无关而与时间的起止点无关 延迟延迟k自协方差函数自协方差函数 延迟延迟k自相关系数自相关系数平稳时间序列的统计性质平稳时间序列的统计性质 时间序列数据的预处理时间序列数据的预处理第11页,讲稿共187张,创作于星期二平稳时间序列的意义平稳时间序列的意义 时间序列数据结构的特殊性时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察可列多个随机变量,而每个变量只有一个样本观察值值平稳性的重大意义平稳性的重大意义极极大大地地减减少少了了随随机机变变量量的的个个数数,并并增增加加了了待待估估变变量量的的样样本容量本容量极极大大地地简简化化了了时时序序分分析析的的难难度度,同同时时也也提提高高了了对对特征统计量的估计精度特征统计量的估计精度时间序列数据的预处理时间序列数据的预处理第12页,讲稿共187张,创作于星期二平稳性检验主要有平稳性检验主要有两种两种方法:方法:根据时序图和自相关图显示的特征做出判断的根据时序图和自相关图显示的特征做出判断的图检验图检验方法方法构造检验统计量进行构造检验统计量进行假设检验假设检验的方法。的方法。时间序列数据的预处理时间序列数据的预处理2 平稳性检验平稳性检验第13页,讲稿共187张,创作于星期二时序图检验时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳序列的根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。而且波动的范围有界、无明显趋势及周期特征。自相关图检验自相关图检验 平稳序列通常具有短期相关性。该性质用自相关系数来平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。会很快地衰减向零。2.1 平稳性的图检验平稳性的图检验时间序列数据的预处理时间序列数据的预处理第14页,讲稿共187张,创作于星期二例例1检验检验1964年年1999年中国纱年产量序列的平稳性年中国纱年产量序列的平稳性例例2检验检验1962年年1月月1975年年12月平均每头奶牛月产奶量月平均每头奶牛月产奶量序列的平稳性序列的平稳性例例3检验检验1949年年1998年北京市每年最高气温序列的平年北京市每年最高气温序列的平稳性稳性平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第15页,讲稿共187张,创作于星期二例例1 平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第16页,讲稿共187张,创作于星期二平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第17页,讲稿共187张,创作于星期二平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理第18页,讲稿共187张,创作于星期二例例2 自相关图自相关图时间序列数据的预处理时间序列数据的预处理第19页,讲稿共187张,创作于星期二例例3 时序图时序图时间序列数据的预处理时间序列数据的预处理第20页,讲稿共187张,创作于星期二例例3 自相关图自相关图时间序列数据的预处理时间序列数据的预处理第21页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)第22页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)第23页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理数据的变换数据的变换程序说明(数据的录入)程序说明(数据的录入)第24页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理取数据中的子集取数据中的子集程序说明(数据的录入)程序说明(数据的录入)第25页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理缺失数据的插入缺失数据的插入程序说明(数据的录入)程序说明(数据的录入)第26页,讲稿共187张,创作于星期二data a;input sha;year=intnx(year,1964,_n_-1);format year year4.;dif=dif(sha);cards;97 130 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8501.8 501.5 489.5 542.3 512.2 559.8 542 567;proc gplot;plot sha*year=1 dif*year=2;symbol1 v=circle i=join c=black;symbol2 v=star i=join c=red;proc arima data=a;identify var=sha nlag=22;run;时间序列数据的预处理时间序列数据的预处理1964年年1999年中国纱年产量年中国纱年产量SAS程序程序第27页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理1962年年1月月1975年年12月平均每头奶牛月产奶量月平均每头奶牛月产奶量SAS程序程序第28页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理1949年年1998年北京市每年最高气温年北京市每年最高气温SAS程序程序第29页,讲稿共187张,创作于星期二纯随机序列的纯随机序列的定义定义纯随机性的纯随机性的性质性质纯随机性纯随机性检验检验时间序列数据的预处理时间序列数据的预处理3 纯随机性检验纯随机性检验第30页,讲稿共187张,创作于星期二3.1 纯随机序列的定义纯随机序列的定义纯随机序列也称为纯随机序列也称为白噪声序列白噪声序列,它满足如下两条性质,它满足如下两条性质 时间序列数据的预处理时间序列数据的预处理第31页,讲稿共187张,创作于星期二标准正态白噪声序列时序图标准正态白噪声序列时序图 时间序列数据的预处理时间序列数据的预处理第32页,讲稿共187张,创作于星期二3.2 白噪声序列的性质白噪声序列的性质 纯随机性纯随机性 各序列值之间没有任何相关关系,即为各序列值之间没有任何相关关系,即为“没有记忆没有记忆”的的序列序列 方差齐性方差齐性 根据马尔可夫定理,只有方差齐性假定成立时,根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、用最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计有效的线性无偏估计时间序列数据的预处理时间序列数据的预处理第33页,讲稿共187张,创作于星期二3.3 纯随机性检验纯随机性检验 检验原理检验原理假设条件假设条件检验统计量检验统计量 判别原则判别原则时间序列数据的预处理时间序列数据的预处理第34页,讲稿共187张,创作于星期二Barlett定理定理 如果一个时间序列是纯随机的,得到一个观察期数为如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那么该序列的延迟非零期的样本自相关的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数系数将近似服从均值为零,方差为序列观察期数倒数的正态分布的正态分布时间序列数据的预处理时间序列数据的预处理第35页,讲稿共187张,创作于星期二假设条件假设条件原假设:延迟期数小于或等于原假设:延迟期数小于或等于 期的序列值之间相互期的序列值之间相互独立独立备择假设:延迟期数小于或等于备择假设:延迟期数小于或等于 期的序列值之间有相关性期的序列值之间有相关性 时间序列数据的预处理时间序列数据的预处理第36页,讲稿共187张,创作于星期二检验统计量检验统计量Q统计量统计量 LB统计量统计量 时间序列数据的预处理时间序列数据的预处理第37页,讲稿共187张,创作于星期二判别原则判别原则拒绝原假设拒绝原假设当检验统计量大于当检验统计量大于 分位点,或该统计量分位点,或该统计量的的P值小于值小于 时,则可以以时,则可以以 的置信水平拒绝原假的置信水平拒绝原假设,认为该序列为非白噪声序列设,认为该序列为非白噪声序列接受原假设接受原假设当检验统计量小于当检验统计量小于 分位点,或该统计量分位点,或该统计量的的P值大于值大于 时,则认为在时,则认为在 的置信水平下的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定机序列的假定 时间序列数据的预处理时间序列数据的预处理第38页,讲稿共187张,创作于星期二样本自相关图样本自相关图例例4 随机生成的随机生成的100个服从标准正态的白噪声序列纯随机性个服从标准正态的白噪声序列纯随机性检验检验时间序列数据的预处理时间序列数据的预处理第39页,讲稿共187张,创作于星期二检验结果检验结果延迟延迟统计量检验统计量检验统计量值统计量值P值值延迟延迟6期期2.360.8838延迟延迟12期期5.350.9454由于由于P值显著大于显著性水平值显著大于显著性水平 ,所以该序列不能,所以该序列不能拒绝纯随机的原假设。换句话说可以认为该序列拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可以停止对的波动没有任何统计规律可循,因此可以停止对该序列的统计分析。该序列的统计分析。时间序列数据的预处理时间序列数据的预处理第40页,讲稿共187张,创作于星期二数据预处理部分的小结:数据预处理部分的小结:序列平序列平稳性与性与纯随机性随机性检验的基本步的基本步骤:1.绘绘制制该该序列序列时时序序图图;2.自相关自相关图检验图检验;3.该该序列若是平序列若是平稳稳序列,序列,进进行行纯纯随机性随机性检验检验.实实例:例:对对1950年年1998年北京市城年北京市城乡乡居民定期居民定期储储蓄所蓄所占比例序列的平占比例序列的平稳稳性与性与纯纯随机性随机性进进行行检验检验。时间序列数据的预处理时间序列数据的预处理第41页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理data a;input year prop;cards;/*数据省略*/;proc gplot;plot prop*year=1;/*所画的图记为图1*/symbol1 v=diamond i=join c=red;proc arima data=a;identify var=prop;run;相应的相应的SAS程序程序第42页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理1.绘制时序图绘制时序图该序列显示北京市城乡居民定期储蓄所占比例序列波动该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似貌似”比较平稳比较平稳 第43页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理2.自相关图进一步检验平稳性自相关图进一步检验平稳性样本自相关图延迟样本自相关图延迟3阶后,自相关系数都落在阶后,自相关系数都落在2倍标准差范围以内,而且自相关系数向倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列稳序列 第44页,讲稿共187张,创作于星期二时间序列数据的预处理时间序列数据的预处理3.序列纯随机性检验序列纯随机性检验第45页,讲稿共187张,创作于星期二结论:结论:由于由于统计量的量的P值0.0001,远远小于小于 0.05,即拒,即拒绝序列序列为纯随机序列的假定。因而随机序列的假定。因而认为京市城京市城乡居民定期居民定期储蓄所占蓄所占比例的比例的变动不属于不属于纯随机波随机波动,各序列,各序列值之之间有相关关系。有相关关系。这说明我明我们可以根据可以根据历史信息史信息预测未来年份的北京市城未来年份的北京市城乡居居民定期民定期储蓄所占比例,蓄所占比例,该平平稳序列属于非白噪声序列,可以序列属于非白噪声序列,可以对其其继续进行研究。行研究。时间序列数据的预处理时间序列数据的预处理第46页,讲稿共187张,创作于星期二平稳时间序列数据分析平稳时间序列数据分析方法性工具与两种相关系数方法性工具与两种相关系数自回归自回归(AutoRegression,AR)模型模型移动平均移动平均(Moving Average,MA)模型模型ARMA模型模型平稳序列建模平稳序列建模 平稳时间序列数据分析平稳时间序列数据分析第47页,讲稿共187张,创作于星期二1.1 方法性工具方法性工具 差分运算差分运算一阶差分一阶差分 阶差分阶差分 步差分步差分平稳时间序列数据分析平稳时间序列数据分析1.方法性工具与两种相关系数方法性工具与两种相关系数第48页,讲稿共187张,创作于星期二延迟算子延迟算子延迟算子类似于一个时间指针,当前序列值乘以一延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻拨了一个时刻 记记 B为延迟算子,有为延迟算子,有 平稳时间序列数据分析平稳时间序列数据分析第49页,讲稿共187张,创作于星期二延迟算子的性质延迟算子的性质平稳时间序列数据分析平稳时间序列数据分析则有(用延迟算子表示差分):则有(用延迟算子表示差分):第50页,讲稿共187张,创作于星期二1.2 两种样本相关系数的基本概念与计算两种样本相关系数的基本概念与计算样本自相关系数样本自相关系数样本偏自相关系数样本偏自相关系数平稳时间序列数据分析平稳时间序列数据分析所谓滞后所谓滞后k阶偏自相关系数就是指阶偏自相关系数就是指在给定中间在给定中间k-1个随机变量个随机变量 xt-1,xt-2,xt-k+1的条件下,或者说,在的条件下,或者说,在剔除了中间剔除了中间k-1个随机变量的干个随机变量的干扰之后,扰之后,xt-k对对xt影响的相关度影响的相关度量。量。第51页,讲稿共187张,创作于星期二样本偏自相关系数的计算样本偏自相关系数的计算平稳时间序列数据分析平稳时间序列数据分析第52页,讲稿共187张,创作于星期二2.AR模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为 阶阶自回归模型自回归模型,简记为,简记为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第53页,讲稿共187张,创作于星期二均均 值值 如果如果AR(p)模型满足平稳性条件,则有模型满足平稳性条件,则有根据平稳序列均值为常数,且根据平稳序列均值为常数,且 为白噪声序列,为白噪声序列,有有推导出推导出平稳时间序列数据分析平稳时间序列数据分析第54页,讲稿共187张,创作于星期二 AR(P)序列中心化变换序列中心化变换称称 为为 的中心化序列的中心化序列 ,令,令平稳时间序列数据分析平稳时间序列数据分析第55页,讲稿共187张,创作于星期二中心化中心化AR(P)模型模型引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 自回归系数多项式自回归系数多项式平稳时间序列数据分析平稳时间序列数据分析第56页,讲稿共187张,创作于星期二AR模型自相关系数的性质模型自相关系数的性质拖尾性拖尾性呈负指数衰减呈负指数衰减平稳时间序列数据分析平稳时间序列数据分析第57页,讲稿共187张,创作于星期二例例5 考察如下考察如下AR模型的自相关图模型的自相关图平稳时间序列数据分析平稳时间序列数据分析第58页,讲稿共187张,创作于星期二自相关系数按复指数单调收敛到零自相关系数按复指数单调收敛到零平稳时间序列数据分析平稳时间序列数据分析第59页,讲稿共187张,创作于星期二自相关系数正负相间的衰减自相关系数正负相间的衰减平稳时间序列数据分析平稳时间序列数据分析第60页,讲稿共187张,创作于星期二自相关系数呈现出自相关系数呈现出“伪周期伪周期”性性平稳时间序列数据分析平稳时间序列数据分析第61页,讲稿共187张,创作于星期二自相关系数不规则衰减自相关系数不规则衰减平稳时间序列数据分析平稳时间序列数据分析第62页,讲稿共187张,创作于星期二偏自相关系数的截尾性偏自相关系数的截尾性AR(p)模型偏自相关系数模型偏自相关系数P阶截尾阶截尾平稳时间序列数据分析平稳时间序列数据分析第63页,讲稿共187张,创作于星期二例例5续续 考察如下考察如下AR模型的偏自相关图模型的偏自相关图平稳时间序列数据分析平稳时间序列数据分析第64页,讲稿共187张,创作于星期二理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第65页,讲稿共187张,创作于星期二理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第66页,讲稿共187张,创作于星期二理论偏自相关系数理论偏自相关系数样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析第67页,讲稿共187张,创作于星期二理论偏自相关系数理论偏自相关系数样本偏自相关系数图样本偏自相关系数图平稳时间序列数据分析平稳时间序列数据分析第68页,讲稿共187张,创作于星期二3.MA模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为 阶阶移动平均模型移动平均模型,简记为,简记为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第69页,讲稿共187张,创作于星期二移动平均系数多项式移动平均系数多项式引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记模型又可以简记为为 阶移动平均系数多项式阶移动平均系数多项式平稳时间序列数据分析平稳时间序列数据分析第70页,讲稿共187张,创作于星期二MA模型的统计性质模型的统计性质常数均值常数均值常数方差常数方差平稳时间序列数据分析平稳时间序列数据分析第71页,讲稿共187张,创作于星期二MA模型的统计性质模型的统计性质MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第72页,讲稿共187张,创作于星期二例例6 考察如下考察如下MA模型的相关性质模型的相关性质平稳时间序列数据分析平稳时间序列数据分析第73页,讲稿共187张,创作于星期二MA模型的自相关系数截尾模型的自相关系数截尾平稳时间序列数据分析平稳时间序列数据分析第74页,讲稿共187张,创作于星期二MA模型的自相关系数截尾模型的自相关系数截尾平稳时间序列数据分析平稳时间序列数据分析第75页,讲稿共187张,创作于星期二MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第76页,讲稿共187张,创作于星期二MA模型的偏自相关系数拖尾模型的偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第77页,讲稿共187张,创作于星期二4.ARMA模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为自回归移动平均模型自回归移动平均模型,简记,简记为为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析第78页,讲稿共187张,创作于星期二系数多项式系数多项式引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 阶自回归系数多项式阶自回归系数多项式 阶移动平均系数多项式阶移动平均系数多项式平稳时间序列数据分析平稳时间序列数据分析第79页,讲稿共187张,创作于星期二ARMA(p,q)模型的统计性质模型的统计性质均值均值协方差协方差自相关系数自相关系数平稳时间序列数据分析平稳时间序列数据分析第80页,讲稿共187张,创作于星期二ARMA模型的相关性模型的相关性自相关系数拖尾自相关系数拖尾偏自相关系数拖尾偏自相关系数拖尾平稳时间序列数据分析平稳时间序列数据分析第81页,讲稿共187张,创作于星期二例例7 考察考察ARMA模型的相关性模型的相关性 拟合模型拟合模型ARMA(1,1):并直观地考察该模型自相关系数和偏自相关系数的并直观地考察该模型自相关系数和偏自相关系数的性质。性质。平稳时间序列数据分析平稳时间序列数据分析第82页,讲稿共187张,创作于星期二自相关系数和偏自相关系数拖尾性自相关系数和偏自相关系数拖尾性样本自相关图样本自相关图样本偏自相关图样本偏自相关图平稳时间序列数据分析平稳时间序列数据分析自相关系数和偏自相关系数拖尾 第83页,讲稿共187张,创作于星期二ARMA模型相关性特征模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾平稳时间序列数据分析平稳时间序列数据分析第84页,讲稿共187张,创作于星期二平稳时间序列数据分析平稳时间序列数据分析平稳时间序列的理论基础平稳时间序列的理论基础对于任何一个离散平于任何一个离散平稳过程程 它都可以分解它都可以分解为两个不相关的平两个不相关的平稳序列之和,其中一个序列之和,其中一个为确确定性的,另一个定性的,另一个为随机性的,不妨随机性的,不妨记作作 其中:其中:为确定性序列,确定性序列,为随机序列,随机序列,它它们需要需要满足如下条件足如下条件(1)(2)(3)Wold分解定理(分解定理(1938):):第85页,讲稿共187张,创作于星期二平稳时间序列数据分析平稳时间序列数据分析ARMA模型分解模型分解确定性序列确定性序列随机序列随机序列第86页,讲稿共187张,创作于星期二5.5.平稳序列建模平稳序列建模 建模步骤建模步骤模型识别模型识别参数估计参数估计模型检验模型检验模型优化模型优化序列预测序列预测平稳时间序列数据分析平稳时间序列数据分析第87页,讲稿共187张,创作于星期二建模步骤建模步骤平平稳稳非非白白噪噪声声序序列列计计算算样样本本相相关关系系数数模型模型识别识别参数参数估计估计模型模型检验检验模模型型优优化化序序列列预预测测YN平稳时间序列数据分析平稳时间序列数据分析第88页,讲稿共187张,创作于星期二模型定阶的困难模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的截尾的完美情况,本应截尾的 或或 仍会呈现出小值振荡仍会呈现出小值振荡的情况的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶由于平稳时间序列通常都具有短期相关性,随着延迟阶数数 ,与与 都会衰减至零值附近作小值波动都会衰减至零值附近作小值波动当当 或或 在延迟若干阶之后衰减为小值波动时,什么情在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?呢?平稳时间序列数据分析平稳时间序列数据分析第89页,讲稿共187张,创作于星期二样本相关系数的近似分布样本相关系数的近似分布BarlettQuenouille平稳时间序列数据分析平稳时间序列数据分析第90页,讲稿共187张,创作于星期二模型定阶经验方法模型定阶经验方法95的置信区间的置信区间模型定阶的经验方法模型定阶的经验方法如如果果样样本本(偏偏)自自相相关关系系数数在在最最初初的的d阶阶明明显显大大于于两两倍倍标标准准差差范范围围,而而后后几几乎乎95的的自自相相关关系系数数都都落落在在2倍倍标标准准差差的的范范围围以以内内,而而且且通通常常由由非非零零自自相相关关系系数数衰衰减减为为小小值值波波动动的的过过程程非非常常突突然然。这这时时,通通常常视视为为(偏偏)自自相相关关系系数截尾。截尾阶数为数截尾。截尾阶数为d。平稳时间序列数据分析平稳时间序列数据分析第91页,讲稿共187张,创作于星期二例例8 选择合适的模型选择合适的模型ARMA拟合拟合1950年年1998年北年北京市城乡居民定期储蓄比例序列。京市城乡居民定期储蓄比例序列。平稳时间序列数据分析平稳时间序列数据分析第92页,讲稿共187张,创作于星期二序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第93页,讲稿共187张,创作于星期二拟合模型识别拟合模型识别自相关图显示延迟自相关图显示延迟3阶之后,自相关系数全部衰减到阶之后,自相关系数全部衰减到2倍倍标准差范围内波动,这表明序列明显地短期相关。但标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟偏自相关图显示除了延迟1阶的偏自相关系数显著大阶的偏自相关系数显著大于于2倍标准差之外,其它的偏自相关系数都在倍标准差之外,其它的偏自相关系数都在2倍标准差倍标准差范围内作小值随机波动,而且由非零相关系数衰减为范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾为一阶截尾 所以可以考虑拟合模型为所以可以考虑拟合模型为AR(1)平稳时间序列数据分析平稳时间序列数据分析第94页,讲稿共187张,创作于星期二例例9 美国科罗拉多州某一加油站连续美国科罗拉多州某一加油站连续57天的天的OVERSHORT序列序列 平稳时间序列数据分析平稳时间序列数据分析第95页,讲稿共187张,创作于星期二序列自相关图序列自相关图平稳时间序列数据分析平稳时间序列数据分析第96页,讲稿共187张,创作于星期二序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第97页,讲稿共187张,创作于星期二拟合模型识别拟合模型识别自相关图显示除了延迟自相关图显示除了延迟1阶的自相关系数在阶的自相关系数在2倍标准差范倍标准差范围之外,其它阶数的自相关系数都在围之外,其它阶数的自相关系数都在2倍标准差范围内倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列性,进一步确定序列平稳。同时,可以认为该序列自相关系数自相关系数1阶截尾阶截尾偏自相关系数显示出典型非截尾的性质。偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为合模型定阶为MA(1)平稳时间序列数据分析平稳时间序列数据分析第98页,讲稿共187张,创作于星期二例例10 1880-1985年全球气表平均温度改变值差分序列年全球气表平均温度改变值差分序列 平稳时间序列数据分析平稳时间序列数据分析第99页,讲稿共187张,创作于星期二序列自相关图序列自相关图平稳时间序列数据分析平稳时间序列数据分析第100页,讲稿共187张,创作于星期二序列偏自相关图序列偏自相关图平稳时间序列数据分析平稳时间序列数据分析第101页,讲稿共187张,创作于星期二拟合模型识别拟合模型识别自相关系数显示出不截尾的性质自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以综合该序列自相关系数和偏自相关系数的性质,可以尝试使用尝试使用ARMA(1,1)模型拟合该序列模型拟合该序列平稳时间序列数据分析平稳时间序列数据分析第102页,讲稿共187张,创作于星期二参数估计参数估计待估参数待估参数 个未知参数个未知参数常用估计方法常用估计方法矩估计矩估计极大似然估计极大似然估计最小二乘估计最小二乘估计平稳时间序列数据分析平稳时间序列数据分析第103页,讲稿共187张,创作于星期二例例8续续 确定确定1950年年1998年北京市城乡居民定期储蓄比年北京市城乡居民定期储蓄比例序列拟合模型的口径例序列拟合模型的口径 拟合模型:拟合模型:AR(1)估计方法:极大似然估计估计方法:极大似然估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第104页,讲稿共187张,创作于星期二例例9续续 确定美国科罗拉多州某一加油站连续确定美国科罗拉多州某一加油站连续57天的天的OVERSHORTS序列拟合模型的口径序列拟合模型的口径 拟合模型:拟合模型:MA(1)估计方法:条件最小二乘估计估计方法:条件最小二乘估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第105页,讲稿共187张,创作于星期二例例10续续 确定确定1880-1985全球气表平均温度改变值差分序列全球气表平均温度改变值差分序列拟合模型的口径拟合模型的口径 拟合模型:拟合模型:ARMA(1,1)估计方法:条件最小二乘估计估计方法:条件最小二乘估计模型口径模型口径平稳时间序列数据分析平稳时间序列数据分析第106页,讲稿共187张,创作于星期二模型检验模型检验模型的显著性检验模型的显著性检验整个模型对信息的提取是否充分整个模型对信息的提取是否充分参数的显著性检验参数的显著性检验模型结构是否最简模型结构是否最简平稳时间序列数据分析平稳时间序列数据分析第107页,讲稿共187张,创作于星期二模型的显著性检验模型的显著性检验目的目的检验模型的有效性(对信息的提取是否充分)检验模型的有效性(对信息的提取是否充分)检验对象检验对象残差序列残差序列判定原则判定原则一个好的拟合模型应该能够提取观察值序列中几乎一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序所有的样本相关信息,即残差序列应该为白噪声序列列 反之,如果残差序列为非白噪声序列,那就意反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效这就说明拟合模型不够有效.平稳时间序列数据分析平稳时间序列数据分析第108页,讲稿共187张,创作于星期二假设条件假设条件原假设:残差序列为白噪声序列原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列备择假设:残差序列为非白噪声序列平稳时间序列数据分析平稳时间序列数据分析第109页,讲稿共187张,创作于星期二检验统计量检验统计量LB统计量统计量平稳时间序列数据分析平稳时间序列数据分析第110页,讲稿共187张,创作于星期二例例8续续 检验检验1950年年1998年北京市城乡居民定期储蓄比例年北京市城乡居民定期储蓄比例序列拟合模型的显著性序列拟合模型的显著性 残差白噪声序列检验结果残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8361平稳时间序列数据分析平稳时间序列数据分析第111页,讲稿共187张,创作于星期二参数显著性检验参数显著性检验目的目的检验每一个未知参数是否显著非零。删除不显著参数使检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简模型结构最精简 假设条件假设条件检验统计量检验统计量平稳时间序列数据分析平稳时间序列数据分析第112页,讲稿共187张,创作于星期二例例8续续 检验检验1950年年1998年北京市城乡居民定期储蓄比例年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著序列极大似然估计模型的参数是否显著 参数检验结果参数检验结果检验参数t统计量P值结论均值46.120.0001显著6.720.0001显著平稳时间序列数据分析平稳时间序列数据分析第113页,讲稿共187张,创作于星期二模型优化模型优化问题提出问题提出当一个拟合模型通过了检验,说明在一定的置当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。波动,但这种有效模型并不是唯