数学建模——时间序列分析-PPT.ppt
《数学建模——时间序列分析-PPT.ppt》由会员分享,可在线阅读,更多相关《数学建模——时间序列分析-PPT.ppt(187页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学建模数学建模时间序列分析时间序列分析7000年前的古埃及人把年前的古埃及人把 尼罗尼罗河涨落的情况逐天记录下来,河涨落的情况逐天记录下来,就构成所谓的时间序列。对这就构成所谓的时间序列。对这个时间序列长期的观察使他们个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文从而创建了埃及灿烂的史前文明。明。引例引例2引例引例3时间序列:某一系序列:某一系统在不同的在不同的时间(地点或其他条件(地点或其他条件等)的响等)的响应(数据)。
2、(数据)。时间序列是按一定的序列是按一定的顺序排列而成,序排列而成,“一定一定顺序序”既既可以是可以是时间顺序,也可以是具有不同意序,也可以是具有不同意义的物理量。的物理量。如:研究高度与气如:研究高度与气压的关系,的关系,这里的高度就可以看作里的高度就可以看作“时间”总而言之,而言之,时间序列只是序列只是强调顺序的重要性,因此又被序的重要性,因此又被称称为“纵向数据向数据”,相,相对于于“横向数据横向数据”而言的。而言的。什么是时间序列什么是时间序列4时间序列数据的预处理时间序列数据的预处理 平稳性检验平稳性检验 纯随机性检验纯随机性检验 平稳时间序列数据分析平稳时间序列数据分析非平稳时间序
3、列数据分析非平稳时间序列数据分析 内容提要内容提要5时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理时间序列数据的预处理基本概念基本概念平稳性检验平稳性检验纯随机性检验纯随机性检验6概率分布的意义概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定联合密度函数决定 时间序列概率分布族的定义时间序列概率分布族的定义几个重要数字特征:均值几个重要数字特征:均值 、方差、自协方差、自相关系、方差、自协方差、自相关系数数时间序列数据的预处理时间序列数据的预处理1 基本概念基本概念1.1 基本的数字特征基本的数字特征7大家
4、应该也有点累了,稍作休息大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流8特征统计量特征统计量均值均值 方差方差自协方差自协方差自相关系数自相关系数时间序列数据的预处理时间序列数据的预处理91.2 平稳时间序列的定义平稳时间序列的定义严平稳严平稳严平稳是一种条件比较苛刻的平稳性定义,它认严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳宽
5、平稳是使用序列的特征统计量来定义的一种平宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶)矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。,就能保证序列的主要性质近似稳定。时间序列数据的预处理时间序列数据的预处理10满足如下条件的序列称为宽平稳序列满足如下条件的序列称为宽平稳序列时间序列数据的预处理时间序列数据的预处理11常数均值和方差常数均值和方差 自协方差函数和自相关函数只依赖于时间的平移长自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起
6、止点无关度,而与时间的起止点无关 延迟延迟k自协方差函数自协方差函数 延迟延迟k自相关系数自相关系数平稳时间序列的统计性质平稳时间序列的统计性质 时间序列数据的预处理时间序列数据的预处理12平稳时间序列的意义平稳时间序列的意义 时间序列数据结构的特殊性时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观可列多个随机变量,而每个变量只有一个样本观察值察值平稳性的重大意义平稳性的重大意义极极大大地地减减少少了了随随机机变变量量的的个个数数,并并增增加加了了待待估估变变量的样本容量量的样本容量极极大大地地简简化化了了时时序序分分析析的的难难度度,同同时时也也提提高高了了对对特征统计量的
7、估计精度特征统计量的估计精度时间序列数据的预处理时间序列数据的预处理13平稳性检验主要有两种方法:平稳性检验主要有两种方法:根据时序图和自相关图显示的特征做出判断的图根据时序图和自相关图显示的特征做出判断的图检验方法检验方法构造检验统计量进行假设检验的方法。构造检验统计量进行假设检验的方法。时间序列数据的预处理时间序列数据的预处理2 平稳性检验平稳性检验14时序图检验时序图检验 根据平稳时间序列均值、方差为常数的性质,平根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明数值附近
8、随机波动,而且波动的范围有界、无明显趋势及周期特征。显趋势及周期特征。自相关图检验自相关图检验 平稳序列通常具有短期相关性。该性质用自相关平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。的自相关系数会很快地衰减向零。2.1 平稳性的图检验平稳性的图检验时间序列数据的预处理时间序列数据的预处理15例例1检验检验1964年年1999年中国纱年产量序列的平稳年中国纱年产量序列的平稳性性例例2检验检验1962年年1月月1975年年12月平均每头奶牛月月平均每头奶牛月产奶量序列的平稳性产奶量序列的
9、平稳性例例3检验检验1949年年1998年北京市每年最高气温序列年北京市每年最高气温序列的平稳性的平稳性平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理16例例1 平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理17平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理18平稳性检验平稳性检验时间序列数据的预处理时间序列数据的预处理19例例2 自相关图自相关图时间序列数据的预处理时间序列数据的预处理20例例3 时序图时序图时间序列数据的预处理时间序列数据的预处理21例例3 自相关图自相关图时间序列数据的预处理时间序列数据的预处理22时间序列数据的预处理时间序列数据
10、的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)23时间序列数据的预处理时间序列数据的预处理等间隔时间数据的录入等间隔时间数据的录入程序说明(数据的录入)程序说明(数据的录入)24时间序列数据的预处理时间序列数据的预处理数据的变换数据的变换程序说明(数据的录入)程序说明(数据的录入)25时间序列数据的预处理时间序列数据的预处理取数据中的子集取数据中的子集程序说明(数据的录入)程序说明(数据的录入)26时间序列数据的预处理时间序列数据的预处理缺失数据的插入缺失数据的插入程序说明(数据的录入)程序说明(数据的录入)27data a;input sha;y
11、ear=intnx(year,1964,_n_-1);format year year4.;dif=dif(sha);cards;97 130 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8501.8 501.5 489.5 542.3 512.2 559.8 542 567;proc gplot;plot sha*year=1 dif*year=2;sym
12、bol1 v=circle i=join c=black;symbol2 v=star i=join c=red;proc arima data=a;identify var=sha nlag=22;run;时间序列数据的预处理时间序列数据的预处理1964年年1999年中国纱年产量年中国纱年产量SAS程序程序28时间序列数据的预处理时间序列数据的预处理1962年年1月月1975年年12月平均每头奶牛月产奶量月平均每头奶牛月产奶量SAS程序程序29时间序列数据的预处理时间序列数据的预处理1949年年1998年北京市每年最高气温年北京市每年最高气温SAS程序程序30纯随机序列的定义纯随机序列的定义
13、纯随机性的性质纯随机性的性质纯随机性检验纯随机性检验时间序列数据的预处理时间序列数据的预处理3 纯随机性检验纯随机性检验313.1 纯随机序列的定义纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性纯随机序列也称为白噪声序列,它满足如下两条性质质 时间序列数据的预处理时间序列数据的预处理32标准正态白噪声序列时序图标准正态白噪声序列时序图 时间序列数据的预处理时间序列数据的预处理333.2 白噪声序列的性质白噪声序列的性质 纯随机性纯随机性 各序列值之间没有任何相关关系,即为各序列值之间没有任何相关关系,即为“没有没有记忆记忆”的序列的序列 方差齐性方差齐性 根据马尔可夫定理,只有方
14、差齐性假定成立时,根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确用最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计的、有效的线性无偏估计时间序列数据的预处理时间序列数据的预处理343.3 纯随机性检验纯随机性检验 检验原理检验原理假设条件假设条件检验统计量检验统计量 判别原则判别原则时间序列数据的预处理时间序列数据的预处理35Barlett定理定理 如果一个时间序列是纯随机的,得到一个观察期数如果一个时间序列是纯随机的,得到一个观察期数为为 的观察序列,那么该序列的延迟非零期的样本的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为
15、零,方差为序列观察自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布期数倒数的正态分布时间序列数据的预处理时间序列数据的预处理36假设条件假设条件原假设:延迟期数小于或等于原假设:延迟期数小于或等于 期的序列值之间相期的序列值之间相互独立互独立备择假设:延迟期数小于或等于备择假设:延迟期数小于或等于 期的序列值之间期的序列值之间有相关性有相关性 时间序列数据的预处理时间序列数据的预处理37检验统计量检验统计量Q统计量统计量 LB统计量统计量 时间序列数据的预处理时间序列数据的预处理38判别原则判别原则拒绝原假设拒绝原假设当检验统计量大于当检验统计量大于 分位点,或该统计分位点,或该
16、统计量的量的P值小于值小于 时,则可以以时,则可以以 的置信水平的置信水平拒绝原假设,认为该序列为非白噪声序列拒绝原假设,认为该序列为非白噪声序列接受原假设接受原假设当检验统计量小于当检验统计量小于 分位点,或该统计量分位点,或该统计量的的P值大于值大于 时,则认为在时,则认为在 的置信水平的置信水平下无法拒绝原假设,即不能显著拒绝序列为下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定纯随机序列的假定 时间序列数据的预处理时间序列数据的预处理39样本自相关图样本自相关图例例4 随机生成的随机生成的100个服从标准正态的白噪声序列纯个服从标准正态的白噪声序列纯随机性检验随机性检验时间序列数
17、据的预处理时间序列数据的预处理40检验结果检验结果延迟延迟统计量检验统计量检验统计量值统计量值P值值延迟延迟6期期2.360.8838延迟延迟12期期5.350.9454由于由于P值显著大于显著性水平值显著大于显著性水平 ,所以该序列,所以该序列不能拒绝纯随机的原假设。换句话说可以认为不能拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可该序列的波动没有任何统计规律可循,因此可以停止对该序列的统计分析。以停止对该序列的统计分析。时间序列数据的预处理时间序列数据的预处理41数数据据预预处处理理部部分分的的小小结结:序序列列平平稳性性与与纯随随机机性性检验的的基基本本步步
18、骤:1.绘制制该序序列列时序序图;2.自自相相关关图检验;3.该序序列列若若是是平平稳序序列列,进行行纯随随机机性性检验.实例例:对1950年年1998年年北北京京市市城城乡居居民民定定期期储蓄蓄所所占占比比例例序序列列的的平平稳性性与与纯随随机机性性进行行检验。时间序列数据的预处理时间序列数据的预处理42时间序列数据的预处理时间序列数据的预处理data a;input year prop;cards;/*数据省略*/;proc gplot;plot prop*year=1;/*所画的图记为图1*/symbol1 v=diamond i=join c=red;proc arima data=a
19、;identify var=prop;run;相应的相应的SAS程序程序43时间序列数据的预处理时间序列数据的预处理1.绘制时序图绘制时序图该序列显示北京市城乡居民定期储蓄所占比例序列波动该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似貌似”比较平稳比较平稳 44时间序列数据的预处理时间序列数据的预处理2.自相关图进一步检验平稳性自相关图进一步检验平稳性样本自相关图延迟样本自相关图延迟3阶后,自相关系数都落在阶后,自相关系数都落在2倍标准差范围以内,而且自相倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储关系数向零衰减的速度非常快。综合前两个
20、步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列蓄所占比例为平稳序列 45时间序列数据的预处理时间序列数据的预处理3.序列纯随机性检验序列纯随机性检验46结论:结论:由于由于统计量的量的P值0.0001,远远小于小于 0.05,即拒,即拒绝序列序列为纯随机序列的假定。因而随机序列的假定。因而认为京市城京市城乡居民居民定期定期储蓄所占比例的蓄所占比例的变动不属于不属于纯随机波随机波动,各序,各序列列值之之间有相关关系。有相关关系。这说明我明我们可以根据可以根据历史信息史信息预测未来年份的北京市未来年份的北京市城城乡居民定期居民定期储蓄所占比例,蓄所占比例,该平平稳序列属于非白序列属于非白噪声序
21、列,可以噪声序列,可以对其其继续进行研究。行研究。时间序列数据的预处理时间序列数据的预处理47平稳时间序列数据分析平稳时间序列数据分析方法性工具与两种相关系数方法性工具与两种相关系数自回归自回归(AutoRegression,AR)模型模型移动平均移动平均(Moving Average,MA)模型模型ARMA模型模型平稳序列建模平稳序列建模 平稳时间序列数据分析平稳时间序列数据分析481.1 方法性工具方法性工具 差分运算差分运算一阶差分一阶差分 阶差分阶差分 步差分步差分平稳时间序列数据分析平稳时间序列数据分析1.方法性工具与两种相关系数方法性工具与两种相关系数49延迟算子延迟算子延迟算子类
22、似于一个时间指针,当前序列值乘以延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻过去拨了一个时刻 记记 B为延迟算子,有为延迟算子,有 平稳时间序列数据分析平稳时间序列数据分析50延迟算子的性质延迟算子的性质平稳时间序列数据分析平稳时间序列数据分析则有(用延迟算子表示差分):则有(用延迟算子表示差分):511.2 两种样本相关系数的基本概念与计算两种样本相关系数的基本概念与计算样本自相关系数样本自相关系数样本偏自相关系数样本偏自相关系数平稳时间序列数据分析平稳时间序列数据分析所谓滞后所谓滞后k阶偏自相
23、关系数就阶偏自相关系数就是指在给定中间是指在给定中间k-1个随机变个随机变量量 xt-1,xt-2,xt-k+1的条件下,的条件下,或者说,在剔除了中间或者说,在剔除了中间k-1个个随机变量的干扰之后,随机变量的干扰之后,xt-k对对xt影响的相关度影响的相关度量。量。52样本偏自相关系数的计算样本偏自相关系数的计算平稳时间序列数据分析平稳时间序列数据分析532.AR模型的定义模型的定义具有如下结构的模型称为具有如下结构的模型称为 阶自回归模型,简记阶自回归模型,简记为为特别当特别当 时,称为中心化时,称为中心化 模型模型平稳时间序列数据分析平稳时间序列数据分析54均均 值值 如果如果AR(p
24、)模型满足平稳性条件,则有模型满足平稳性条件,则有根据平稳序列均值为常数,且根据平稳序列均值为常数,且 为白噪声序为白噪声序列,有列,有推导出推导出平稳时间序列数据分析平稳时间序列数据分析55 AR(P)序列中心化变换序列中心化变换称称 为为 的中心化序列的中心化序列 ,令,令平稳时间序列数据分析平稳时间序列数据分析56中心化中心化AR(P)模型模型引进延迟算子,中心化引进延迟算子,中心化 模型又可以简记为模型又可以简记为 自回归系数多项式自回归系数多项式平稳时间序列数据分析平稳时间序列数据分析57AR模型自相关系数的性质模型自相关系数的性质拖尾性拖尾性呈负指数衰减呈负指数衰减平稳时间序列数据
25、分析平稳时间序列数据分析58例例5 考察如下考察如下AR模型的自相关图模型的自相关图平稳时间序列数据分析平稳时间序列数据分析59自相关系数按复指数单调收敛到零自相关系数按复指数单调收敛到零平稳时间序列数据分析平稳时间序列数据分析60自相关系数正负相间的衰减自相关系数正负相间的衰减平稳时间序列数据分析平稳时间序列数据分析61自相关系数呈现出自相关系数呈现出“伪周期伪周期”性性平稳时间序列数据分析平稳时间序列数据分析62自相关系数不规则衰减自相关系数不规则衰减平稳时间序列数据分析平稳时间序列数据分析63偏自相关系数的截尾性偏自相关系数的截尾性AR(p)模型偏自相关系数模型偏自相关系数P阶截尾阶截尾
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 时间 序列 分析 PPT
限制150内