数学建模-时间序列分析模型教学提纲.ppt
数学建模-时间序列分析模型时间序列的定义时间序列的定义v随机序列随机序列:按时间顺序排列的一组随机变量按时间顺序排列的一组随机变量v观察值序列观察值序列:随机序列的随机序列的 个有序观察值,称之为序个有序观察值,称之为序列长度为列长度为 的观察值序列的观察值序列v随机序列和观察值序列的关系随机序列和观察值序列的关系观察值序列是随机序列的一个实现观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质我们研究的目的是想揭示随机时序的性质实现的手段都是通过观察值序列的性质进行推断实现的手段都是通过观察值序列的性质进行推断vv时间序列预测方法,是把统计资料按时间发生的先时间序列预测方法,是把统计资料按时间发生的先后进行排序得出的一连串数据,利用该数据序列外后进行排序得出的一连串数据,利用该数据序列外推到预测对象未来的发展趋势。一般可分为确定性推到预测对象未来的发展趋势。一般可分为确定性时间序列预测法和随机时间序列预测法。时间序列预测法和随机时间序列预测法。vv确定性时间序列法有:移动平均法、指数平滑法、确定性时间序列法有:移动平均法、指数平滑法、差分指数平滑法、自适应过滤法、直线模型预测法、差分指数平滑法、自适应过滤法、直线模型预测法、成长曲线模型预测和季节变动预测法等等。成长曲线模型预测和季节变动预测法等等。vv随机时间序列是通过建立随机时间序列模型来预测,随机时间序列是通过建立随机时间序列模型来预测,方法和数据要求都很高,精度也很高,应用非常广方法和数据要求都很高,精度也很高,应用非常广泛。泛。v时间序列预测法的优缺点时间序列预测法的优缺点优点:在分析现在、过去、未来的联系时,以及未来的结果与过去、现在的各种因素之间的关系时,效果比较好。数据处理时,并不十分复杂缺点:反映了对象线性的、单向的联系预测稳定的、在时间方面稳定延续的过程并不适合进行长期预测1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 ARMA模型是一模型是一类类常用的随机常用的随机时间时间序列模型,序列模型,是一种精度是一种精度较较高的高的时间时间序列短期序列短期预测预测方法,其基本思方法,其基本思想是:某些想是:某些时间时间序列是依序列是依赖赖于于时间时间 的一族随机变的一族随机变量,构成该时间序列的单个序列值虽然具有不确定性,量,构成该时间序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述数学模型近似描述.通过对该数学模型的分析研究,能够更本质地认通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最小方差意义下的最识时间序列的结构与特征,达到最小方差意义下的最优预测优预测.ARMAARMA模型有三种基本类型:模型有三种基本类型:模型有三种基本类型:模型有三种基本类型:自回归(自回归(自回归(自回归(ARAR:Auto-regressiveAuto-regressive)模型)模型)模型)模型移动平均(移动平均(移动平均(移动平均(MAMA:Moving AverageMoving Average)模型)模型)模型)模型自回归移动平均(自回归移动平均(自回归移动平均(自回归移动平均(ARMAARMA:Auto-regressive Moving AverageAuto-regressive Moving Average)模型)模型)模型)模型 一、概一、概 述述1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 1 1、自回归【、自回归【、自回归【、自回归【AR AR】模型】模型】模型】模型自回归序列:如果时间序列 是它的前期值和随机项的线性函数,即可表示为【1】【1】式称为阶自回归模型,记为AR()注注1:实参数:实参数 称为自回归系数,是待估参数称为自回归系数,是待估参数.随机项随机项 是相互独立的白噪声序列,且服从均值为是相互独立的白噪声序列,且服从均值为0、方差为方差为 的正态分布的正态分布.随机项与滞后变量不相关。随机项与滞后变量不相关。注注2:一般假定:一般假定 均值为均值为0,否则令,否则令 1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 记 为 步滞后算子,即 ,则模型【1】可表示为令 ,模型可简写为AR()过程平稳的条件是滞后多项式的根均在单位圆外,即的根大于1【2】1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 2 2、移动平均【、移动平均【、移动平均【、移动平均【MAMA】模型】模型】模型】模型移动平均序列移动平均序列移动平均序列移动平均序列 :如果时间序列 是它的当期和前期的随机误差项的线性函数,即可表示为【3】式【3】称为阶移动平均模型,记为MA()注:实参数为移动平均系数,是待估参数1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 引入滞后算子,并令则模型【3】可简写为注1:移动平均过程无条件平稳注2:滞后多项式的根都在单位圆外时,AR过程与MA过程能相互表出,即过程可逆,【4】即为MA过程的逆转形式,也就是MA过程等价于无穷阶的AR过程注3:【2】满足平稳条件时,AR过程等价于无穷阶的MA过程,即1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 3 3、自回归移动平均【、自回归移动平均【、自回归移动平均【、自回归移动平均【ARMAARMA】模型】模型】模型】模型【B-JB-J方法建模】方法建模】方法建模】方法建模】自回归移动平均序列自回归移动平均序列 :如果时间序列是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为【5】式【5】称为阶的自回归移动平均模型,记为ARMA注1:实参数称为自回归系数,为移动平均系数,都是模型的待估参数注2:【1】和【3】是【5】的特殊情形注3:引入滞后算子,模型【5】可简记为【6】注4:ARMA过程的平稳条件是滞后多项式的根均在单位圆外可逆条件是滞后多项式的根都在单位圆外1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 二、随机时间序列的特性分析二、随机时间序列的特性分析二、随机时间序列的特性分析二、随机时间序列的特性分析1 1、时序特性的研究工具、时序特性的研究工具、时序特性的研究工具、时序特性的研究工具(1 1)自相关)自相关)自相关)自相关构成构成时间时间序列的每个序列序列的每个序列值值相关关系称相关关系称为为自相关。自相关程度由自相关系数自相关。自相关程度由自相关系数表示表示时间时间序列中相隔序列中相隔期的期的观测值观测值之之间间的相关程度。的相关程度。之间的简单之间的简单度量,度量,注1:是样本量,为滞后期,代表样本数据的算术平均值注2:自相关系数的取值范围是且越接近1,自相关程度越高1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (2 2)偏自相关)偏自相关)偏自相关)偏自相关偏自相关是指对于时间序列,在给定的条件下,与之间的条件相关关系。其相关程度用度量,有偏自相关系数其中是滞后期的自相关系数,1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 2 2、时间序列的特性分析、时间序列的特性分析、时间序列的特性分析、时间序列的特性分析(1 1)随机性)随机性)随机性)随机性如果一个时间序列是纯随机序列,意味着序列没有任何规律性,序列诸项之间不存在相关,即序列是白噪声序列,其自相关系数应该与0没有显著差异。可以利用置信区间理论进行判定。在B-J方法中,测定序列的随机性,多用于模型残差以及评价模型的优劣。(2 2)平稳性)平稳性)平稳性)平稳性若时间序列满足1)对任意时间,其均值恒为常数;2)对任意时间和,其自相关系数只与时间间隔有关,而与的起始点无关。那么,这个时间序列就称为平稳时间序列。和时间序列的随机性,是指时间序列各项之间没有相关关系的特征。使用自相关分析图判断时间序列的随机性,一般给出如下准则:q若时间序列的自相关函数基本上都落入 置信区间,则该时间序列具有随机性;q 若较多自相关函数落在置信区间之外,则认为该时间序列不具有随机性。判断时间序列是否平稳,是一项很重要的工作。运用自相关分析图判定时间序列平稳性的准则是:若时间序列的自相关函数在k3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 序列的平稳性也可以利用置信区间理论进行判定.需要注意的是,在B-J方法中,只有平稳时间序列才能直接建立ARMA模型,否则必须经过适当处理使序列满足平稳性要求在实际中,常见的时间序列多具有某种趋势,但很多序列通过差分可以平稳判断时间序列的趋势是否消除,只需考察经过差分后序列的自相关系数自相关系数(3 3)季节性)季节性)季节性)季节性时间序列的季节性是指在某一固定的时间间隔上,序列重复出现某种特性.比如地区降雨量、旅游收入和空调销售额等时间序列都具有明显的季节变化.一般地,月度资料的时间序列,其季节周期为12个月;季度资料的时间序列,季节周期为4个季.1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 判断时间序列季节性的标准为:月度数据,考察时的自相关系数是否与0有显著差异;季度数据,考察系数是否与0有显著差异。时的自相关说明各年中同一月(季)不相关,序列不存在季节性,否则存在季节性.若自相关系数与0无显著不同,实际问题中,常会遇到季节性和趋势性同时存在的情况,这时必须事先剔除序列趋势性事先剔除序列趋势性事先剔除序列趋势性事先剔除序列趋势性再用上述方法识别序列的季节性识别序列的季节性识别序列的季节性识别序列的季节性,否则季节性会被强趋势性所掩盖,以至判断错误.包含季节性的时间序列也不能直接建立ARMA模型,需进行季节差分消除序列的季节性,差分步长应与季节周期一致.1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 三、模型的识别与建立三、模型的识别与建立三、模型的识别与建立三、模型的识别与建立在需要对一个时间序列运用B-J方法建模时,应运用序列的自相关与偏自相关对序列适合的模型类型进行识别,确定适宜的阶数以及(消除季节趋势性后的平稳序列)1 1、自相关函数与偏自相关函数、自相关函数与偏自相关函数、自相关函数与偏自相关函数、自相关函数与偏自相关函数(1 1)MAMA()的自相关与偏自相关函数)的自相关与偏自相关函数自协方差函数自协方差函数 是白噪声序列的方差是白噪声序列的方差 1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 样本自相关函数样本自相关函数 MA()序列的自相关函数在这种性质称为自相关函数的步截尾性;以后全都是0,随着滞后期这种特性称为偏自相关函数的拖尾性的增加,呈现指数或者正弦波衰减,趋向于0,偏自相关函数记为ACF(k)1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (2 2)ARAR()序列的自相关与偏自相关函数)序列的自相关与偏自相关函数偏自相关函数是步截尾的;自协方差函数满足自相关函数满足它们呈指数或者正弦波衰减,具有拖尾性(3 3)ARMAARMA()序列的自相关与偏自相关函数均是拖尾的)序列的自相关与偏自相关函数均是拖尾的记为PACF(k)ARMA模型相关性特征模型相关性特征v拖尾拖尾:系数始终有非零取值,不会在系数始终有非零取值,不会在k大于某个常数之后就恒等大于某个常数之后就恒等于零(于零(截尾截尾),这个性质就是拖尾性。),这个性质就是拖尾性。模型模型自相关系数自相关系数偏自相关系偏自相关系数数AR(P)拖尾拖尾P阶截尾阶截尾MA(q)q阶截尾阶截尾拖尾拖尾ARMA(p,q)拖尾拖尾拖尾拖尾1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 2 2、模型的识别、模型的识别、模型的识别、模型的识别自相关函数与偏自相关函数是识别ARMA模型的最主要工具,B-J方法主要利用相关分析法确定模型的阶数.若样本自协方差函数在步截尾,则判断是MA()序列若样本偏自相关函数在步截尾,则可判断是AR()序列若,都不截尾,而仅是依负指数衰减,这时可初步认为ARMA序列,它的阶要由从低阶到高阶逐步增加,再通过检验来确定.在,是但实际数据处理中,得到的样本自协方差函数和样本偏自相关函数只是和的估计,要使它们在某一步之后全部为0几乎是而只能是在某步之后围绕零值上下波动,故对于和不可能的,的截尾性只能借助于统计手段进行检验和判定。1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (1)的截尾性判断对于每一个,计算(一般取左右),考察其中满足或的个数是否为的68.3%或95.5%。如果当时,明显地异于0,而近似为0,且满足上述不等式的个数达到了相应的比例,则可近似地认为在步截尾1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (2)的截尾性判断作如下假设检验:存在某个,使,且统计量表示自由度为的分布的上侧分位数点对于给定的显著性水平,若,则认为样本不是来自AR()模型;,可认为样本来自AR()模型。注:实际中,此判断方法比较粗糙,还不能定阶,目前流行的方法是H.Akaike信息定阶准则(AIC)1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (3)AIC准则确定模型的阶数AIC定阶准则:是模型的未知参数的总数是用某种方法得到的方差的估计为样本大小,则定义AIC准则函数用AIC准则定阶是指在的一定变化范围内,寻求使得最小的点作为的估计。AR()模型:ARMA模型:相关图检验v2.MA、AR、ARMA过程自相关函数及偏自相关函过程自相关函数及偏自相关函数的特点数的特点vMA(q)过程的自相关函数v1jqvvjq时,ACF(j)=0,此现象为截尾,是MA(q)过程的一个特征v如下图:v AR(p)过程的偏自相关函数过程的偏自相关函数vj=p时,偏自相关函数的取值不为0v时,偏自相关函数的取值为0vAR(p)过程的偏自相关函数p阶截尾v如下图:AR(p)过程的自相关函数以及过程的自相关函数以及MA(q)过过程的偏自相关函数程的偏自相关函数v平稳的AR(P)过程可以转化为一个MA()过程,则AR(P)过程的自相关函数是拖尾的v一个可逆的MA(q)过程可转化为一个AR()过程,因此其偏自相关函数是拖尾的。ARMA(p,q)过程的自相关函数和偏自相过程的自相关函数和偏自相关函数关函数vARMA过程的自相关函数和偏自相关函数都是拖尾的v如下图:例例 选择合适的模型选择合适的模型ARMA拟合拟合1950年年1998年北京市城乡居民年北京市城乡居民定期储蓄比例序列。定期储蓄比例序列。1.自相关图显示延迟自相关图显示延迟3阶之后,自相关系数全部衰减到阶之后,自相关系数全部衰减到2倍标准差范围内倍标准差范围内波动,这表明序列明显地短期相关。波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,相当缓慢,该自相关系数可视为不截尾该自相关系数可视为不截尾2.偏自相关图显示除了延迟偏自相关图显示除了延迟1阶的偏自相关系数显著大于阶的偏自相关系数显著大于2倍标准差之倍标准差之外,其它的偏自相关系数都在外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾系数可视为一阶截尾,所以可以考虑拟合模型为所以可以考虑拟合模型为AR(1)。v例例 1880-1985全球气表平均温度改变值差分全球气表平均温度改变值差分序列序列序列自相关图序列自相关图1.自相关系数显示出不截尾的性质自相关系数显示出不截尾的性质序列偏自相关图序列偏自相关图2.偏自相关系数也显示出不截尾的性质偏自相关系数也显示出不截尾的性质3.综合该序列自相关系数和偏自相关系数的性综合该序列自相关系数和偏自相关系数的性质,可以尝试使用质,可以尝试使用ARMA(1,1)模型拟合该序列。模型拟合该序列。模型定阶的困难模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的理论截尾的完美情况,本应截尾的 或或 仍会呈仍会呈现出小值振荡的情况现出小值振荡的情况 由于平稳时间序列通常都具有短期相关性,随着由于平稳时间序列通常都具有短期相关性,随着延迟阶数延迟阶数 ,与与 都会衰减至零值附近作小都会衰减至零值附近作小值波动。值波动。当当 或或 在延迟若干阶之后衰减为小值波动在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?零值附近作拖尾波动呢?模型定阶的经验方法模型定阶的经验方法 如如果果样样本本(偏偏)自自相相关关系系数数在在最最初初的的d阶阶明明显显大大于于两两倍倍标标准准差差范范围围,而而后后几几乎乎95的的自自相相关关系系数数都都落落在在2倍倍标标准准差差的的范范围围以以内内,而而且且通通常常由由非非零零自自相相关关系系数数衰衰减减为为小小值值波波动动的的过过程程非非常常突突然然。这这时时,通通常常视视为为(偏偏)自自相相关关系系数截尾,截尾阶数为数截尾,截尾阶数为d。1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 3 3、参数估计、参数估计、参数估计、参数估计在阶数给定的情形下模型参数的估计有三种基本方法:矩估计法、逆函数估计法和最小二乘估计法,这里仅介绍矩估计法(1)AR()模型白噪声序列的方差的矩估计为1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 (2)MA()模型(3)ARMA模型的参数矩估计分三步:i)求的估计1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 ii)令,则的自协方差函数的矩估计为iii)把近似看作MA()序列,利用(2)对MA()序列的参数估计方法即可1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 4 4、模型检验、模型检验、模型检验、模型检验对于给定的样本数据AIC准则确定了模型的类型和阶数,用矩估计法确定了模型中的参数,从而建立了一个ARMA模型,来拟合真正的随机序列。但这种拟合的优劣程度如何,主要应通过实际应用效果来检验,也可通过数学方法来检验。,我们通过相关分析法和下面介绍模型拟合的残量自相关检验,即白噪声检验:下面介绍模型拟合的残量自相关检验,即白噪声检验:对于ARMA模型,应逐步由ARMA(1,1),ARMA(2,1),ARMA(1,2),ARMA(2,2),依次求出参数估计,对AR()和MA()模型,先由和初步定阶,再求参数估计。的截尾性1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 一般地,对ARMA模型取初值和它们均值为0),可递推得到残量估计现作假设检验:(可取它们等于0,因为是来自白噪声的样本令1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 其中取左右。则当成立时,服从自由度为的分布。对给定的显著性水平,若,则拒绝,即模型与原随机序列之间拟合得不好,则认为模型与原随机序列之间拟合需重新考虑得较好,模型检验被通过。建模;若1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 四、模型的预测四、模型的预测四、模型的预测四、模型的预测若模型经检验是合适的,也符合实际意义,可用作若模型经检验是合适的,也符合实际意义,可用作短期预测短期预测.B-J方法采用L步预测,即根据已知个时刻的序列观测值,对未来的个时刻的序列值做出估计,线性最小方差预测是常用的一种方法.误差的方差达到最小.其主要思想是使预测若表示用模型做的L步平稳线性最小方差预测,那么,预测误差并使达到最小.1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 1 1、ARAR()序列)序列预测预测模型(1):的L步预测值为其中()1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 2 2、MAMA()的)的预测预测对模型(3):当时,由于可见所有白噪声的时刻都大于,故与历史取值无关,;从而当时,各步预测值可写成矩阵形式:1 1 时间序列分析模型【时间序列分析模型【时间序列分析模型【时间序列分析模型【ARMAARMA模型模型模型模型】简介】简介】简介】简介 递推时,初值均取为0。2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】题中给出了题中给出了“19952004年长江流域水质报告年长江流域水质报告”中中的主要统计数据和关于地表水环境质量标准的的主要统计数据和关于地表水环境质量标准的国标(国标(GB3838-2002)中)中4个主要项目标准限值个主要项目标准限值(见(见附录附录1),其中),其中I、II、III类为可饮用水类为可饮用水.假如不假如不采取更为有效的治理措施,根据过去采取更为有效的治理措施,根据过去10年的主要统年的主要统计数据(见计数据(见附录附录2),对长江未来水质污染的发展),对长江未来水质污染的发展趋势做出预测分析,比如研究未来趋势做出预测分析,比如研究未来10年的情况年的情况.2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】一、问题分析一、问题分析一、问题分析一、问题分析 为了分析长江水质的发展变化情况,对未来为了分析长江水质的发展变化情况,对未来10年全流域、年全流域、支流、干流中三类水所占的比例做出预测支流、干流中三类水所占的比例做出预测.考虑到若仅用考虑到若仅用10年水年水文年的观测数据来预测后文年的观测数据来预测后10年的数据,显然可利用的数据量太年的数据,显然可利用的数据量太少,所以我们将充分利用枯水期、丰水期和水文年的数据少,所以我们将充分利用枯水期、丰水期和水文年的数据.由于建立时间序列模型需要相等的时间间隔,所以我们将由于建立时间序列模型需要相等的时间间隔,所以我们将一年分为三段,一年分为三段,1-4月、月、5-8月、月、9-12月月.对于每一年,对于每一年,1-4月的平均数据可直接取为枯水期的数据,月的平均数据可直接取为枯水期的数据,5-8月的平均数据可直接取为丰水期的数据,而月的平均数据可直接取为丰水期的数据,而9-12月的数据可月的数据可用【(水文年用【(水文年*12-枯水期枯水期*4-丰水期丰水期*4)/4=水文年水文年*3-枯水期枯水期-丰水期】来估计(具体数据见丰水期】来估计(具体数据见附录附录3).我们分别对全流域、干我们分别对全流域、干流、支流来建立时间序列模型,并将水质分为饮用水(流、支流来建立时间序列模型,并将水质分为饮用水(I、II、III类)、污水(类)、污水(IV、V类)和劣类)和劣V类水三类,注意到饮用水的比类水三类,注意到饮用水的比例可由其它两类水的比例推算出来例可由其它两类水的比例推算出来.2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】二、模型假设二、模型假设二、模型假设二、模型假设(2)假设枯水期、丰水期和水文年中,每个月各类水质的百分比不变.(1)问题中所给出的数据能客观反映现实情况;2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】三、模型建立三、模型建立三、模型建立三、模型建立对于各类水,根据它在各个时期所占的比例,通过作图容易观察发现,时间序列是非平稳的,而通过适当差分则会显示出平稳序列的性质,所以我们将建立自回归移动平均模型ARIMA()d代表差分阶数.在实际建模中,考虑到一期的数据应该与前期的数据有关,在实际建模中,考虑到一期的数据应该与前期的数据有关,所以对差分后的平稳序列我们建立所以对差分后的平稳序列我们建立ARMA模型模型.在这里,我们不考虑随机干扰项,即,因此建立ARAR模型模型模型模型仅以预测干流中劣仅以预测干流中劣类水所占比例的类水所占比例的 ARIMA 模型为例,模型为例,详细叙述一下详细叙述一下 ARIMA 建模过程。建模过程。2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】1 1、数据筛选与处理、数据筛选与处理、数据筛选与处理、数据筛选与处理 根据需要,我们将数据筛选并处理得到干流中劣类水所占比例的时间序列:=0,4,-4,0,1.5,-1.5,0,0,0,0,0,0,0,0,0,0,0,0,6.9,5.1,5.4,7.9,4.8,13.4,0,0,0,14.2,9.3,3.5,2 2、对序列平稳化、对序列平稳化、对序列平稳化、对序列平稳化观察序列时序图,发现序列有递增趋势,因此,我们对序,得到序列列进行一阶差分2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】0,4,-8,4,1.5,-3,1.5,0,0,0,0,0,0,0,0,0,0,0,6.9,-1.8,0.3,2.5,-3.1,8.6,-13.4,0,0,14.2,-4.9,-5.8 劣劣劣劣类水所占比例时序图类水所占比例时序图类水所占比例时序图类水所占比例时序图2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】利用公式计算此序列的自相关系数可看出,明显异于0,说明此序列短期内具有很强的相关性因此可初步认为经1阶差分后的序列平稳,即1阶差分后的白噪声检验结果如下:延延迟阶迟阶数数 统计统计量量P P值值6 610.7610.760.09600.0960在检验的显著性水平取为0.05的条件下,P值大于0.05,故该差分后序列可视为白噪声序列2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】3 3 3 3、对对对对序列序列序列序列进进进进行零均行零均行零均行零均值值值值化化化化对序列进行零均值化,得到新序列=-0.11667,3.88333,-8.11667,3.88333,1.38333,-3.11667,1.38333,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,-0.11667,6.78333,-1.91667,0.18333,2.38333,-3.21667,8.48333,-13.51667,-0.11667,-0.11667,14.08333,-5.01667,-5.916672 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】4 4、对对对对序列序列序列序列求求求求样样样样本自本自本自本自协协协协方差函数与方差函数与方差函数与方差函数与样样样样本偏自相关函数本偏自相关函数本偏自相关函数本偏自相关函数 利用()得样本自协方差函数估计利用,()计算样本自相关函数通过估计样本偏自相关函数,得到2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】当当时时,具有截尾性具有截尾性 用AR(3)模型拟合序列模型拟合原序列。对残差序列进行检验,得到,即用ARIMA(3,1,0)残差白噪声残差白噪声检验检验参数参数显显著性著性检验检验延延迟阶迟阶数数 统计统计量量P P值值待估参数待估参数t t统计统计量量P P值值6 63.073.070.38030.3803AR1.1AR1.1-3.16-3.160.00390.003912123.603.600.93600.9360AR1.2AR1.2-2.75-2.750.01600.016018186.806.800.96290.9629AR1.3AR1.3-3.30-3.300.00280.0028 拟合检验统计量的概率拟合检验统计量的概率拟合检验统计量的概率拟合检验统计量的概率P P值都显著大于显著性检验水平值都显著大于显著性检验水平值都显著大于显著性检验水平值都显著大于显著性检验水平0.050.05,可,可,可,可认为该残差序列为白噪声序列,认为该残差序列为白噪声序列,认为该残差序列为白噪声序列,认为该残差序列为白噪声序列,系数显著性检验显示三个参数均系数显著性检验显示三个参数均系数显著性检验显示三个参数均系数显著性检验显示三个参数均显著。从而显著。从而显著。从而显著。从而ARIMAARIMA(3 3,1 1,0 0)模型对该序列建模成功。)模型对该序列建模成功。)模型对该序列建模成功。)模型对该序列建模成功。2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】5 5、模型参数估计、模型参数估计、模型参数估计、模型参数估计通过公式得到与上述参数显著性检验一样的结果:=-3.16,=-2.75,=-3.30,因此ARIMA(3,1,0)模型即为:注:利用同样的方法可以建立预测干流中其他两类水、全流注:利用同样的方法可以建立预测干流中其他两类水、全流注:利用同样的方法可以建立预测干流中其他两类水、全流注:利用同样的方法可以建立预测干流中其他两类水、全流域和支流中的三类水所占比例的时间序列分析模型。域和支流中的三类水所占比例的时间序列分析模型。域和支流中的三类水所占比例的时间序列分析模型。域和支流中的三类水所占比例的时间序列分析模型。2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】四、模型预测四、模型预测四、模型预测四、模型预测利用上述模型,预测干流中劣类水未来10年所占比例,得到:年份年份月份月份劣劣V V类类水水年份年份月份月份劣劣V V类类水水200520051-41-40.21110.2111200620061-41-40.22920.22925-85-80.27790.27795-85-80.29300.29309-129-120.27660.27669-129-120.29230.2923200720071-41-40.24450.2445200820081-41-40.25990.25995-85-80.30840.30845-85-80.32380.32389-129-120.30780.30789-129-120.32320.3232200920091-41-40.27530.2753201020101-41-40.29070.29075-85-80.33920.33925-85-80.35460.35469-129-120.33590.33599-129-120.35400.3540201120111-41-40.30610.3061201220121-41-40.32140.32145-85-80.37000.37005-85-80.38540.38549-129-120.36910.36919-129-120.38460.3846201320131-41-40.33680.3368201420141-41-40.35220.35225-85-80.40070.40075-85-80.41610.41619-129-120.40010.40019-129-120.41550.41552 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 2005ACUMCM 2005A】五、结果分析五、结果分析五、结果分析五、结果分析在上述模型预测结果中,我们得到的数据为枯水期、丰水期和8-12月的平均值,并不包含水文年的数据,故还需要还原水文年的数据,可以通过公式:水文年=(枯水期+丰水期+8-12月平均值)/3对于三类水所占的比例满足:饮用水+污水+劣V类水=100%.具体预测结果见附录4。从预测结果中可以看出,干流中污水和劣V类水所占的比例只有微小的增长,支流中劣V类水的比例增长速度较快。全流域中劣V类水所占比例增长速度也较快。尽管干流中和全流域中污水所占比例增长并不大,但长期发展下去,全流域和支流中可饮用水的比例将低于50%,而在干流中可饮用水比例也仅仅是略高于50%,若不采取措施防污治污,后果不堪设想!2 2 长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测长江水质污染的发展趋势预测 【CUMCM 20