事故统计预测与安全决策.ppt
第五章第五章 事故统计预测与安全决策事故统计预测与安全决策本章主要内容本章主要内容 第一节第一节 事故预测概述事故预测概述 第二节第二节 事故统计预测原理事故统计预测原理 第三节第三节 事故统计预测方法事故统计预测方法 第四节第四节 安全决策过程与决策要素安全决策过程与决策要素 第五节第五节 定性属性的量化定性属性的量化 第六节第六节 安全决策方法安全决策方法 第七节第七节 模糊决策评价模糊决策评价第五章第五章 事故统计预测与安全决策事故统计预测与安全决策第一节第一节 事故预测概述事故预测概述 事故预测就是对系统未来的安全状况进行分析和测算。针对事故分析对象的不同,事故预测简单分为宏观预测宏观预测和微观预测微观预测。宏观预测宏观预测研究事故的变化趋势,根据过去和现在的事故统计资料,分析近期和未来的事故发展态势,为宏观决策提供科学依据。微观预测微观预测分析系统的不安全隐患,研究、评价系统的安全状况,采取相应的安全技术措施,消除事故隐患,提高系统安全性能,避免事故发生。由于研究的对象不同,目的不同,采用的方法也不一样。事故预测的起源可以追溯到20世纪30年代美国保险业所开展的安全分析评价工作。几十年来,随着预测决策理论和技术的日趋成熟,特别是随着现代数学方法和计算机技术的发展,灰色预测决策、模糊分析评价、模糊灰色预测决策、模糊分析评价、模糊概率分析、事故突变原理、计算机专家系统概率分析、事故突变原理、计算机专家系统等新理论在经济发展中的广泛应用,使现代安全分析评价以及预测决策技术方法在一些工业发达国家的核工业、化工、环境等领域得到了广泛应用。就目前而言,工业事故的预测分析与预防决策控制技工业事故的预测分析与预防决策控制技术已成为现代安全管理的核心术已成为现代安全管理的核心。以现代安全系统工程理论为基础,将各种现代数学方法和计算机技术相结合,建立以隐患分析、事故预测、安全评价、安全决策为内建立以隐患分析、事故预测、安全评价、安全决策为内容的工业安全决策支持系统,将成为工业安全研究的发容的工业安全决策支持系统,将成为工业安全研究的发展趋势展趋势。第二节第二节 事故统计预测原理事故统计预测原理一、事故统计的规律性一、事故统计的规律性 工业事故的发生表面上具有随机性和偶然性,但其本质上更具有因果性和必然性。对于个别事故具有不确定性,但对大样本则表现出统计规律性。事故统计预测属于预测方法的研究范畴,即如何用科学的统计方法对事故未来发展进行定量推测如何用科学的统计方法对事故未来发展进行定量推测。在事故预测中,不仅要有数学计算,而且还要有经验判断。应该讲,事故统计预测的方法与统计学理论性质是一致的。但事故统计预测需结合事故特点建立和完善事故统计预测需结合事故特点建立和完善事故统计分析指标事故统计分析指标。只有这样,才能将统计学的理论在事故统计工作中得到推广和应用,才能为安全生产监督管理工作提供科学依据,以便采取有效措施,推动我国经济持续、健康、快速发展。第二节第二节 事故统计预测原理事故统计预测原理二、事故指标二、事故指标 事故指标事故指标是衡量系统安全的重要参数,国家进行宏观决策和规划或有关部门制定安全管理目标时,通常要考虑各项事故指标的现状和未来达到要考虑各项事故指标的现状和未来达到的目标的目标。因此,进行事故指标预测可为国家的宏观安全决策和事故控制提供重要科学依据,使其决策合理,控制正确。同时,事故指标的高低取决于系统中人员、机械(物质)、环境(媒介)、管理四个元素的交互作用,是人机环管系统内异常状况的结果。进行事故指标预测事故指标预测,有助于进一步开展事故隐患分析和系统安全评价。它对安全管理与决策有重要指导作用。一些重要的事故指标:一些重要的事故指标:煤矿煤矿:百万吨死亡率;:百万吨死亡率;特种设备特种设备:万台设备死亡人数;:万台设备死亡人数;火灾火灾(消防消防):十万人口死亡率;:十万人口死亡率;道路交通道路交通:万车死亡率;:万车死亡率;民航飞行民航飞行:民航运输飞行百万飞行小时重:民航运输飞行百万飞行小时重 大事故率。大事故率。第二节第二节 事故统计预测原理事故统计预测原理三、事故统计的科学基础三、事故统计的科学基础 概率论、数理统计与随机过程等数学理论,是研究具有统计规律性的随机现象的有力工具。惯性原理、相似性原则、相关性原则,为事故指标预测提供了良好的基础。事故指标预测的成败,关键在于对系统结构特征的分析和预测模型的建立。结合事故分析技术和事故统计分析工作需要,通过学习经济统计学理论,归纳分析事故预测理论和方法,可以提高事故统计分析预测工作的科学性,从而推动事故统计分析工作的开展。第三节第三节 事故统计预测方法事故统计预测方法一、直观预测法一、直观预测法 直观预测法直观预测法是依靠专家的知识和经验进行预测的一种定性预测方法。其准确性取决于专家知识的广度、深度和经验。专家主要指在某个领域中或某个预测问题上有专门知识和特长的人员。直观预测典型的方法有直观预测典型的方法有德尔菲德尔菲法法,另外还有另外还有情景预测法情景预测法和头脑风暴法头脑风暴法等。德尔菲法德尔菲法是根据专家的直接经验,对研究的问题进行判断、预测的一种方法,也称专家调查法也称专家调查法。它是美国兰德公司于1964年首先用于预测领域的。德尔菲是古希腊传说中的神谕之地,城中有座阿波罗神殿可以预卜未来,因而借用其名。德尔菲法一般适用于长期预测。德尔菲法一般适用于长期预测。1.1.德尔菲法特点德尔菲法特点(1)(1)反馈性反馈性 反馈表现在多次作业、反复、综合、整理、归纳和修正,但不是漫无边际,而是有组织、有步骤地进行。(2)(2)匿名性匿名性 由于专家是背靠背提出各自的意见的,因而可免除心理干扰影响。把专家看成相当于一架电子计算机,脑子里贮存着许多数据资料,通过分析、判断和计算,可以确定比较理想的预测值。(3)(3)统计性统计性 对各位专家的估计或预测数进行统计,然后采用平均数或中位数统计出量化结果。2.2.德尔菲法预测程序德尔菲法预测程序 第一步第一步:提出要求,明确预测目标,用书面通知被选提出要求,明确预测目标,用书面通知被选定的专家定的专家。专家人数不宜过多,一般在8人20人左右为宜。要求每一位专家讲明有什么特别资料可用来分析这些问题以及这些资料的使用方法。同时,也向专家提供有关背景资料,并请专家提出进一步需要哪些资料。2.2.德尔菲法预测程序德尔菲法预测程序 第二步第二步:专家专家接到通知后,根据自己的知识和经验,对所预测事物的未来发展趋势作出自己的预测作出自己的预测,并说明其依据和理由,书面答复主持预测的单位。第三步第三步:主持预测单位或领导小组主持预测单位或领导小组根据专家的预测意见,加以归纳整理加以归纳整理,对不同的预测值,分别注明预测值的依据和理由(根据专家意见,但不注明哪个专家的意见),然后再寄给各位专家,要求专家修改自己原有的预测,以及提出还有什么要求。第四步第四步:专家等人接到第二次通知后专家等人接到第二次通知后,就各种预测意见及其依据和理由进行分析,再次进行预测再次进行预测,提出自己的修改预测意见及其依据和理由。如此反复往返征询、归纳、修改,直到意见基本一致为止。修改的次数,根据需要决定。3.3.运用德尔菲法预测时应遵循的原则运用德尔菲法预测时应遵循的原则问题要集中,要有针对性,不要过分分散问题要集中,要有针对性,不要过分分散,以 便使各个事件构成一个有机整体。问题要按等 级排队,先简单,后复杂;先综合,后局部,这样易于引起专家回答问题的兴趣。调查单位或领导小组意见不应强加于调查的意调查单位或领导小组意见不应强加于调查的意 见之中见之中,要防止出现诱导现象,避免专家的评避免专家的评 价向领导小组靠拢价向领导小组靠拢。避免组合事件避免组合事件。如果一个事件包括两个方面,一方面是专家同意的,另一方面则是不同意的,这样,专家就难以作出回答。德尔菲法目前正在成为重要的决策工具,在缺少历史数据或涉及决策的数据量较大时,往往应用这种方法,避免了花费大量的时间和精力来处理数据,对于受相关因素影响变动大的决策问题,更体现出这种方法的可行性。对于国家的重大安全决策问题,可以汇同有关专家,采用德尔菲法进行调查,同时可以与一些定量的方法相结合,进一步提高决策的效果。由于我国安全生产工作基础薄弱,目前安全生产宏观预测大都采用直观预测法,即,聘请各方面的安全生产专家,形成安全生产专家组预测安全生产专家组预测。德尔菲法缺点缺点是责任比较分散,专家由于背景责任比较分散,专家由于背景不同,意见有时可能不完整或不切合实际不同,意见有时可能不完整或不切合实际。二、回归预测法二、回归预测法 除了预测对象随时间自变量变化外,许多预测对象的变化因素之间是相互关联的,它们之间往往存在着互相依存的关系,将这些相关因素联系起来,进行因果关系分析,才可能进行预测。回归预测方法回归预测方法就是因果法中常用的一种分析方法,它以事物发展的因果关系为依据,抓住事物发展的主要矛盾因素和它们之间的关系,建立数学模型,进行预测。应用回归分析可以从一个或几个自变量的值去预测因变量将取得的值。同时间序列预测模型类似,使用回归预测模型时,预测对象与影响因素之间必须存在因果关预测对象与影响因素之间必须存在因果关系,且数据量不宜太少,通常应多于系,且数据量不宜太少,通常应多于2020个,过去和现在个,过去和现在数据的规律性应适用于未来数据的规律性应适用于未来。具体方法具体方法主要有一元线性回归预测法一元线性回归预测法和非线性回归预非线性回归预测法测法。1.1.一元线性回归模型一元线性回归模型 一元线性回归模型可表述为:式中:b0、b1是未知参数;u1为剩余残差项或称随机扰动 项目。在运用回归预测法时,要求满足一定的假定条件,其中最重要的是关于u1须具有的须具有的5 5个特征个特征:u1是一个随机变量;u1的平均值为零;在每个时期中,u1的方差是一个常数;各个u1间互相独立;u1与自变量无关。线性回归模型参数的估计方法通常用最小二乘法。最小二乘法的意义在于使:达到最小。目前回归模型最多的一个用途是用来通过给定的值来预测值。预测值与真实值常常是不相等的,这就需要一个置信区间来确立用每个给定的值预测到的平均值的范围,同时也要给出单个值的估计区间。事物的变化往往受到多个因素的影响,因此,一般要进行多元回归分析,把包括两个或两个以上自变量的回归称为多元回归。多元回归与一元回归类似,可以用最小二乘法估计模型参数。也需对模型及模型参数进行统计检验。选择合适的自变量是正确进行多元回归预测的前提之一,多元回归模型自变量的选择可以利用变量之间的相关矩阵来解决。实际中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归。因而,可以用线性回归方法解决非线性回归预测问题。2.2.非线性回归预测模型非线性回归预测模型 有些现象两个因素之间的关系并不是呈线性的关系,这时就要选配适当类型的曲线才符合实际情况就要选配适当类型的曲线才符合实际情况。2.2.非线性回归预测模型非线性回归预测模型 选择曲线通常可以分下列两个步骤:确定变量间函数的类型确定变量间函数的类型 变量间函数关系的类型有的可根据理论或过去积累的经验,事前予以确定。但是有时不能事先确定变量之间的函数关系的类型时,就需要根据实际资料作散点图,从散点图中的分布形状选择适当的曲线。确定相关函数中的未知参数确定相关函数中的未知参数 函数类型确定以后,接下来就需要确定函数关系式的未知参数。最小二乘法是确定未知参数最常用的方法。但在具体运用时,必须先通过变量变换,把非线性函数关系转化成线性关系。例:y=ax2,因:lny=lna+2lnx,令:Y=lny,A=lna,X=lnx,即可将其化成线性关系。3.3.应用回归预测时应注意的问题应用回归预测时应注意的问题 在具体运用时,应注意以下几个问题:定性分析问题定性分析问题 依靠研究人员的理论知识、专业知识、实际经验和分析研究能力确定现象之间的相互关系和发展规律性,并且在多数情况下,现象之间只是在一定范围内才具有相关关系。回归预测不能任意外推回归预测不能任意外推 回归分析的应用,仅仅是限于原来数据所包括的范围内。所谓外推,就是指把相关关系或回归关系用于超出上述范围之外。由于原来资料只提供了一定范围内的数量关系,在此范围以外是否存在着同样的关系,尚未得知。如果有进行外推的充分根据和需要,也应十分慎重,而且不能离开原来的范围太远不能离开原来的范围太远。关于对数据资料的要求问题关于对数据资料的要求问题 在利用回归分析进行预测时,还必须注意数据资料的准确准确、可比性可比性和独立性独立性问题。数据资料的准确性容易理解,只有借以预测的资料是正确可靠的,才能保证分析和预测结果的可靠性。如果数据是凭经验、拍脑袋估计出来的,那么就不能得出科学的分析结论。在整理资料过程中,如发现个别因素缺如发现个别因素缺少某些年度的数字,可采用一定的统计方法(如比例推少某些年度的数字,可采用一定的统计方法(如比例推算法、统计插值法、调查估算法等)予以补齐。如发现算法、统计插值法、调查估算法等)予以补齐。如发现某一年度的数字畸高畸低,可利用数理统计中的控制理某一年度的数字畸高畸低,可利用数理统计中的控制理论论,按照按照33原则对该数字进行检验,如与总体平均数的原则对该数字进行检验,如与总体平均数的离差超过离差超过33,那么该数值就不能用来分析和推断,那么该数值就不能用来分析和推断。数据资料的可比性和独立性问题应该保证指标数值所包含的专业内容、指标的口径、范围、计算方法和计量单位的一致性。事物的基本稳定问题事物的基本稳定问题 回归分析是在假定事物没有发生重大变化的情况下进行的,如果事物发展中发生重大变化,变化前后的数字就不能合并在一起进行回归预测。在进行回归预测时,必须考虑未来因素的变化,修正分析的结论。应用回归分析可以寻找一个或几个自变量和因变量之间的关系。事故原因分析可知,事故的发生受诸多因素的影响。从宏观上讲分为三类,即人为原因、物及技术原因和管理原因。具体到每一类事故,情况又很复杂。只有通过大量的事故分析,详细搜集事故相关因素的数据,然后利用这些数据对事故情况进行回归分析,才能预测事故发展规律。三、时间序列预测法三、时间序列预测法 时间序列时间序列是指一组按时间顺序排列的数据序列数据序列。时间序列预测,是从分析时间序列的变化特征等信息中,选择适当的模型和参数,建立预测模型,并根据惯性原则惯性原则,假定预测对象以往的变化趋势会延续到未来,从而作出预测。该预测方法的一个明显特征是所用的数据都是有数据都是有序的。序的。这类方法预测精度偏低,通常要求研究系统相当稳定,历史数据量要大,数据的分布趋势较为明显。1.1.时间序列分解法时间序列分解法时间序列的分解时间序列的分解 时间序列的变化受许多因素的影响,概括地讲,可以将影响时间序列变化的因素分为四种,即长期趋势因素长期趋势因素、季节变动因素季节变动因素、周期变动因素周期变动因素和不规则变动因素不规则变动因素。长期趋势因素长期趋势因素 长期趋势因素长期趋势因素反映了社会经济现象在一个较长时间内的发展趋势,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。在某种情况下,它也可以表现为某种类似指数趋势或其他曲线趋势的形式。季节变动因素季节变动因素 季节变动因素季节变动因素是社会经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。周期变动因素周期变动因素 周期变动因素周期变动因素也称循环变动因素,它是受各种社会经济因素影响形成的上下起伏不定的波动。不规则变动因素不规则变动因素 不规则变动不规则变动又称随机变动,它是受各种偶然因素影响所形成的不规则波动。时间序列分解模型时间序列分解模型 将时间序列分解成长期趋势长期趋势T T、季节变动季节变动S S、周周期变动期变动C C和不规则变动不规则变动I I四个因素后,可以认为时间序列是这四个因素的函数,即:时间序列分解的方法有很多,较常用的模型有加法模型加法模型和乘法模型乘法模型。加法模型加法模型为:乘法模型乘法模型为:时间序列分解法将时间序列进行分解,对于趋势性和周期性明显的时间序列十分有效,由于微观的个体企业安全生产的活动数据一般具有大量性、周期性的特点,所以时间序列分解法可以尝试地应用于微观的安全生产决策;反之由于宏观的安全生产活动受我国的政策和监管、市场需求变化、生产结构、劳动者素质等诸多因素的影响,一般不具有加法模型或乘法模型的特点,所以一般不直接使用此模型。2.2.趋势外推法趋势外推法 当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可用时间为自变量,时序数值Y Y为因变量,建立趋势模型趋势模型。当有理由相信这种趋势能够延伸到未来时,赋予变量所需要的值,可以得到相应时刻的时间序列未来值。这就是趋势外推法。趋势外推法的假设条件趋势外推法的假设条件 假设假设事物发展过程没有跳跃式变化没有跳跃式变化,一般属于渐进变化。假设假设事物的发展因素也决定事物未来的发展,其条条件不变或变化不大件不变或变化不大。也就是说,假定根据过去资料建立的趋势外推模型能适合未来,能代表未来趋势变化的情况,即未来和过去的规律一样。由以上两个假设条件可知,趋势外推法趋势外推法是事物发展渐进过程的一种统计预测方法。它的主要优点优点是可以揭示事物发展的未来,并定量地估计其功能特性。趋势模型的种类趋势模型的种类 趋势外推法的实质就是利用某种函数分析描述预测对象某一参数的发展趋势,有以下四种趋势预测模型四种趋势预测模型最为常用。多项式曲线预测模型多项式曲线预测模型 很多事物发展的模型可用多项式表示,常用的多项式预测模型有:一次(线性)预测模型 二次(二次抛物线)预测模型 三次(三次抛物线)预测模型 n次(n次抛物线)预测模型式中:式中:t t代表时间自变量代表时间自变量。指数曲线预测模型指数曲线预测模型 常见的指数曲线预测模型有:指数曲线预测模型 修正指数曲线预测模型对数曲线预测模型对数曲线预测模型 常见的对数曲线预测模型有:生长曲线预测模型生长曲线预测模型 皮尔曲线预测模型皮尔曲线预测模型:式中:式中:L L为变量为变量Y Yt t的极限值;的极限值;a a、b b为常数;为常数;t t为时间为时间。龚珀兹曲线预测模型龚珀兹曲线预测模型:趋势模型的选择趋势模型的选择 趋势外推法趋势外推法主要利用图形识别图形识别和差分法差分法差分法差分法计算计算来进行模型的基本选择。图形识别法图形识别法 这种方法是通过绘制散点图绘制散点图来进行的,即将时间序列的数据绘制成以时间t为横轴,时序观察值Yt为纵轴的图形,观察并将其变化曲线与各类函数曲线模型的图形进行比较,以便选择较为适宜的模型。差分法差分法 由于模型种类很多,为了根据历史数据正确选择模型,常常利用差分法把原时间序列转换为平衡序列,即利用差分法把数据修匀,使非平稳序列达到平稳序列。这里最常用的是一阶向后差分法。其定义为:一阶向后差分实际上是当时间由t t推到t-1t-1时Y Yt t的增量。二阶向后差分的定义为:k阶向后差分的定义为:计算时间序列的差分并将其与各类模型差分特计算时间序列的差分并将其与各类模型差分特点进行比较,就可以选择适宜的模型点进行比较,就可以选择适宜的模型。a.当时间序列各期数值的一阶差分相等或大致相等,就可以匹配一次(线性)模型进行预测;b.当时间序列各数值的二阶差分相等或大致相等,就可以匹配二次(抛物线)模型进行预测;c.当时间序列各期数值的一阶差比率差比率相等或大致相等,就可以匹配指数曲线模型;d.当时间序列各期数值一阶差的一阶比率相等或大致相等,就可以匹配修正指数曲线模型进行预测。3.3.时间序列平滑预测法时间序列平滑预测法一次移动平均法一次移动平均法 一次移动平均的方法是收集一组观察值,计算这组观一次移动平均的方法是收集一组观察值,计算这组观察值的均值,利用这一均值作为下一期的观察值,也可察值的均值,利用这一均值作为下一期的观察值,也可以利用这一均值作为下一期的预测值以利用这一均值作为下一期的预测值。在移动平均值的计算中包括过去观察值的实际个数,必须从一开始就确定。每出现一个新观察值,就要从移动平均中减去一个最早的观察值,再加上一个最新的观察值,计算移动平均值,这一新的移动平均值就作为下一期的观察值,计算移动平均值。因此,移动平均从数列中所取数据点数移动平均从数列中所取数据点数一直不变,只是包括最新的观察值一直不变,只是包括最新的观察值。移动平均法有两种极端情况移动平均法有两种极端情况:在移动平均值的计算中包括的过去观察值的实际个数N=1,这时利用最新的观察值作为下一期的预测值;Nn,这时利用全部n个观察值的算术平均值作为预测值。当数据的随机因素较大时,宜选用大的N,这样有利于较大限度地平滑随机性所带来的严重偏差;反之,当数据的随机因素较小时,宜选用小的N,这有利于跟踪数据的变化,并且预测值滞后的期数也少。如果数据是纯随机的,则全部历史数据的均值是最好的预测值。设时间序列为X1,X2,移动平均法可以表示为:式中:xt为最新观察值;Ft+1为下一期的预测值。移动平均法具有两个优点两个优点:计算量少;计算量少;移动平均线能较好地反映时序趋势及其变化移动平均线能较好地反映时序趋势及其变化。移动平均法的两个主要限制两个主要限制:计算移动平均必须具有计算移动平均必须具有N N个过去观察值个过去观察值,当需要预测大量数值时,就必须存贮大量数据。在平均值的计算中,将过去的每个观察值的权重认将过去的每个观察值的权重认为是一样的为是一样的,其实,对未来的情况,最新的观察值比较早期的数据含有更多的信息,应赋予相对大的权重。线性二次移动平均法线性二次移动平均法 一次移动平均法当用来预测一组具有趋势的数据时,估计值往往比实际值偏低(或偏高)。为了避免利用线性一次移动平均法预测有趋势的数据时产生系统误差,发展了线性二次移动平均线性二次移动平均。该方法是在对实际值进行一次移动平均的基础上,再进行一次移动平均。二次移动平均对一次移动平均的滞后量与一次移动平均对实际值的滞后量大致相等。因此,二次移动平均值并不直接用于预测。线性二次移动平均法线性二次移动平均法 为了消除预测的系统误差,可将一次移动平均值,加上一次移动平均值与二次移动平均值之差。这样,线性二次移动平均法预测的通式为:式中:m为预测超前期数。一次线性平均法的两个限制因素在线性二次移动平均法中也存在,只是后者需要数据点是后者需要数据点是2N2N。一次指数平滑法一次指数平滑法 时间序列平滑法时间序列平滑法是利用时间序列资料进行短期预测短期预测的一种方法。其基本思想在于其基本思想在于:除一些不规则变动外,过除一些不规则变动外,过去的时序数据存在着某种基本形态,假设这种形态在短去的时序数据存在着某种基本形态,假设这种形态在短期内不会改变,可以作为下一期预测的基础期内不会改变,可以作为下一期预测的基础。平滑的主要目的,在于消除时序的极端值,以某些较平滑的中间值作为预测的根据。客观事物的发展是在时间上展开的,任一事物随时间的流逝,都可以得到一系列依赖于时间t的数据。其中,t代表时间,单位可以是年、季、月、日或小时。依赖于时间变化的变量t称之为时间序列,简称时序列。记为:若事物的发展过程具有某种确定的形式,随时间的变化规律可以用时间t的某种确定函数关系加以描述,这类时序称为确定型时序确定型时序,以时间t为自变量建立的函数模型为确定型时序模型确定型时序模型。事物发展过程若是一个随机过程,无法用时间t的确定函数关系加以描述,称为随机型时序随机型时序,建立的与随机过程相适应的模型为随机型时序模型随机型时序模型。指数平滑预测法指数平滑预测法,是在加权平均法的基础上发展起来的,也是移动平均法的改进。一次移动平均法假定近期N个数据同等重要。从加权的观点来看,即认为预测值 是前N个数据以等权系数1/N的加权平均值。这里个数据的权重系数之和为1。然而,越近期的数据反映的信息越新,在预测研究中也应更受到重视。基于这种思想,指数平滑法认为,数数据的重要程度按时间上的远近成非线性递减据的重要程度按时间上的远近成非线性递减。若以第周期的权bi来刻划这种关系,即指数平滑值可以看成是时间序列数据的非等权bi的加权平均值。指数平滑又称指数修匀。可以消除时间序列的偶然性变动,进而寻找预测对象的变化特征和趋势。一次指数平滑法用于实际一次指数平滑法用于实际数据序列以随机变动为主的场合数据序列以随机变动为主的场合。一次指数平滑值的计一次指数平滑值的计算公式为算公式为:第t周期的一次指数平滑值第t-k周期的实际值(k=0,1,2,)(k=0,1,2,)平滑系数(01)观察上式,实际值Yt、Yt-1、Yt-2的权系数分别为、(1-)、(1-)2。依此类推,离现时刻越远的数据,其权系数越小。指数平滑法就是用平滑系数指数平滑法就是用平滑系数来实现不来实现不同时间的数据的非等权处理同时间的数据的非等权处理。因为权系数是指数几何等级数,指数平滑法也由此而得名。上式略加变换,得上式略加变换,得:式中:第t-1周期的指数平滑值。一次指数平滑法是以最近周期的一次指数平滑值作为一次指数平滑法是以最近周期的一次指数平滑值作为下一周期的预测值的下一周期的预测值的。即:。即:式中:第t+T周期的预测值。一次指数平滑法有两个基本特点两个基本特点:指数平滑法对实际序列有平滑作用,平滑系数越小,平滑作用越强,但对实际数据的变动反应较迟缓。在实际序列的线性变动部分线性变动部分,指数平滑值序列出现一定的滞后偏差滞后偏差。滞后偏差的程度随着平滑系数的增大而减少。指数平滑法的主要优点有主要优点有:对不同时间的数据的非等权处理非等权处理较符合实际情况;实用中仅需要选择一个模型参数仅需要选择一个模型参数即可预测即可预测,简便易行;具有适应性具有适应性,也就是说预测模型能自动识别数据模能自动识别数据模式的变化而加以调整式的变化而加以调整。指数平滑法的缺点缺点是,对数据的转折点缺乏鉴别能力,这可通过调查预测法或专家预测法加以弥补;另一缺点是长期预测的效果比较差长期预测的效果比较差,故多用于短期预测。如果实际的数据序列如果实际的数据序列具有较明显的线性增长倾向,则具有较明显的线性增长倾向,则不宜用一次指数平滑法,不宜用一次指数平滑法,因为滞后偏差将会使预测值偏因为滞后偏差将会使预测值偏低低。此时,通常可采用二次指数平滑法二次指数平滑法来建立线性预测模型,然后再用模型预测。二次指数平滑二次指数平滑 二次指数平滑二次指数平滑,是对一次指数平滑值序列再作一次指数平滑。二次指数平滑值的计算公式为:二次指数平滑值并不直接用于预测,而是仿照二次移动平均法,根据滞后偏差的演变规律建立线性预测模型。线性预测模型为线性预测模型为:模型中参数at、bt可按下述关系得到:布朗三次指数平滑布朗三次指数平滑 如果实际数据序列具有非线性增长倾向具有非线性增长倾向,则一次、二次指数平滑法都不适用了。此时应采用三次指数平滑法建立非线性预测模型,再用模型进行预测。三次指数平滑也称三重指数平滑三重指数平滑,它与二次指数平滑一样,不是以平滑值直接作为预测值,而是为建立模型所用。布朗三次指数平滑是对二次平滑值再进行一次平布朗三次指数平滑是对二次平滑值再进行一次平滑滑,并用以估计二次多项式参数的一种方法,所律立的模型为:这是一个非线性平滑模型,它类似于一个二次多项式,能表现时序的一种曲线变化趋势,故常用于非线性变化时序的短期预测短期预测。布朗三次指数平滑也被称作布朗单一参数二次多项式指数平滑。参数分别由下式得出参数分别由下式得出:各次指数平滑值分别为:三次指数平滑比一次、二次指数平滑复杂得多,但三者目的一样,即修正预测值,使其跟踪时序的变化,三三次指数平滑跟踪时序的非线性变化趋势次指数平滑跟踪时序的非线性变化趋势。平滑常数的选择平滑常数的选择 指数平滑常数指数平滑常数值代表对时序变化的反应速度,又决值代表对时序变化的反应速度,又决定预测中修匀随机误差的能力定预测中修匀随机误差的能力。若选0,StSt-1,这是充分相信初始值,预测过程中不需要引进任何新信息。若选1,平滑值就是St,也就是实际观察值Yt,这是完全不相信过去信息。这两种两种选择都是极端情况极端情况。实际上实际上值应在值应在0 01 1之间选择之间选择。从理论上说,选取01之间任意数值均可以。其选择原则是使预测值与实际观测值之间的均方误差使预测值与实际观测值之间的均方误差(MSE)(MSE)和平均绝对百分误差和平均绝对百分误差(MAPE)(MAPE)最小最小。但在实际预测时,还必须考虑时序数据本身的特征,当选当选值接近于值接近于1 1为最优为最优值时,常常预示着时序数据有明显的趋势变动或季节性值时,常常预示着时序数据有明显的趋势变动或季节性变动变动。在这种情况下,采用一次指数平滑法或非季节性的平滑方法,都难以得到有效的预测结果。平滑常数平滑常数的选择主要还是依靠经验的选择主要还是依靠经验。通常,有以下几条准则可供参考。如果时间序列虽然有不规则变动,但长期变化接近某一稳定常数,值一般取值一般取0.050.050.20.2,以使各观察值在现时的指数平滑中有大小接近的权数。如果时间序列具有迅速和明显的趋势变动,宜取宜取稍大的值,一般为稍大的值,一般为0.30.30.50.5,以使近期数据对现时的指数平滑值有较大的作用,从而将近期的变动趋势充分地反映在预测值中。如果时间序列的变化很小,宜取稍小的值,一般宜取稍小的值,一般为为0.10.10.40.4,以使较早的观测值也能充分反映在现时的指数平滑值中。根据实际预测经验,适用指数平滑法进行预测的时序,通常可在0.050.05,0.10.1,0.20.2,0.30.3之间选择到一个较为理想的值。时间序列平滑法具有使用方便、计算和存储费用低、使用方便、计算和存储费用低、模型参量直观的特点模型参量直观的特点,近年来在我国的许多研究领域具有广泛的应用。结合近年来我国宏观安全生产事故非线性变化的特点,可以对不同的年份取不同的权重,采用“重近轻远重近轻远”的策略,使其跟踪时序的变化。时间序列时间序列平滑法不但可以应用于宏观的安全生产预测与决策,同平滑法不但可以应用于宏观的安全生产预测与决策,同时也可以应用于微观的安全生产预测与决策时也可以应用于微观的安全生产预测与决策。四、博克斯詹金斯法四、博克斯詹金斯法 博克斯詹金斯法,简称B-J法或ARMA模型法,是以美国统计学家Geogre和英国统计学家Gwilym M.Jenkins的名字命名的一种时间序列预测方法。它主要试图解决以下两个问题以下两个问题:一是一是分析时间序列的随机性随机性、平稳性平稳性和季节性季节性;二是二是在对时间序列分析的基础上,选择适当的模型进行预测。四、博克斯詹金斯法四、博克斯詹金斯法 其模型可分为:(1)(1)自回归模型自回归模型(简称简称ARAR模型模型);(2)(2)滑动平均模型滑动平均模型(简称简称MAMA模型模型);(3)(3)自回归滑动平均混合模型自回归滑动平均混合模型(简称简称ARMAARMA模型模型)。自回归模型的公式为:自回归模型的公式为:式中:p是自回归模型的阶数;Yt是时间序列在t期的观 测值,Yt-1是该时间序列在t-1期的观测值,类似 地,Yt-p是时间序列在t-p期的观测值;et是误差 或偏差,表示不能用模型说明的随机因素。滑动平均模型的公式为:滑动平均模型的公式为:式中:Yt是预测所用的时间序列在t期的观测值;q是滑 动平均模型的阶数;et是时间序列模型在t期的误 差或偏差,et-1是时间序列模型在t-1期的误差或 偏差,类似地,et-q是其在t-q期的误差或偏差。自回归模型与滑动平均模型的有效组合,便构成了自自回归模型与滑动平均模型的有效组合,便构成了自回归滑动平均混合模型回归滑动平均混合模型,即:博克斯詹金斯法依据的基本思想是博克斯詹金斯法依据的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列数据序列视为一个随机序列,即除去个别的偶然原因引起的观测值外,时间序列是一组依赖于时间t的随机变量。这组随机变量所具有的依存关系依存关系或自相关性表征了预测对象发展的延续性或自相关性表征了预测对象发展的延续性,而这种自相关性一旦被相应的数学模型描述出来,就可以从时间序列的过去值及现在值预测其未来值。1.1.博克斯詹金斯法的前提条件博克斯詹金斯法的前提条件 运用博克斯詹金斯法的前提条件是:作为预测对象作为预测对象的时间序列是一零均值的平稳随机序列。平稳随机序列的时间序列是一零均值的平稳随机序列。平稳随机序列的统计特性不随时间的推移而变化的统计特性不随时间的推移而变化。直观地说,平稳随机序列的折线图无明显的上升或下降趋势。但是,大量数据总表现出某种上升或下降趋势,构成非零均值的非非零均值的非平稳的时间序列平稳的时间序列。对此的解决方法是在应用ARMA模型前,对时间序列先进行零均值化零均值化和差分平稳化差分平稳化处理。所谓零均值化零均值化处理,是指对均值不为零的时间序列中的每一项数值每一项数值都减去该序列的平均数,构成一个均值为零的新的时间序列。即:式中:,是时间序列的平均值,n是该序列数据 的个数。所谓差分平稳化差分平稳化处理,就是指对均值为零的非平稳的对均值为零的非平稳的时间序列时间序列进行差分,使之成为平稳时间序列平稳时间序列,即对序列 Yt进行一阶差分,得到一阶差分序列Yt:对一阶差分序列Yt再进行一阶差分,得到二阶差分序列2Yt:依此类推,可以差分下去,得到各阶差分序列各阶差分序列。一般情况下,非平稳序列在经过一阶差分或二阶差分后都可非平稳序列在经过一阶差分或二阶差分后都可以平稳化以平稳化。2.2.博克斯詹金斯法的预测过程博克斯詹金斯法的预测过程 博克斯詹金斯预测法把预测问题划分为三个阶段:模型的识别;模型中参数的估计和模型的检验;预测应用。2.2.博克斯詹金斯法的预测过程博克斯詹金斯法的预测过程 第一阶段第一阶段:利用自相关分析和偏相关分析等方法,分析时间序列的随机性、平稳性及季节性,并选定一个特选定一个特定的模型以拟合所分析的时间序列数据定的模型以拟合所分析的时间序列数据。模型识别是博克斯-詹金斯法预测中至关重要的一步。识别模型是否恰当给出的比较标准是给出的比较标准是:对一般ARMA模型体系中的一些特征,分析其理论特征,把这种特定模型的理论特征作为鉴别实际模型的标准,观测实际资料与理论特征的接近程度。最后,根据这种分类比较分析的结果,来判定实际模型的类型。第二阶段第二阶段:用时间序列的数据,估计模型的参数,并用时间序列的数据,估计模型的参数,并进行检验,以判定该模型是否恰当进行检验,以判定该模型是否恰当。如不恰当,则返回第一阶段,重新选定模型。这个阶段是博克斯詹金斯法中最复杂繁琐的一步。借助于统计分析软件包如SCA、TSP、SPSS等,可以方便地在计算机上实现对ARMA模型的估计,并对模型进行检验。第三阶段第三阶段,对将来的某个时期的数值作出预测对将来的某个时期的数值作出预测。3.3.博克斯詹金斯法的评价博克斯詹金斯法的评价 博克斯詹金斯法是最通用的时间序列预测法。一般的时间序列预测法,需先假设数据资料存在着什么样的模式,然后根据这个模式建模,实现预测,因而预测结果受到这个先验假设的局限。博克斯詹金斯法则是根据对时间序列的具体分析,初步选定一个试用模型,然后用一系列统计方法来检验这个试用模型是否适用。如果证明这个模型是适用的,如果证明这个模型是适用的,就可利用这个模型进行预测;如果证明这个试用模型不就可利用这个模型进行预测;如果证明这个试用模型不适用于所用的时间序列数据,可以对这适用于所用的时间序列数据,可以对这个模型作必要的个模型作必要的调整,或基于已有的统计检验的结果,并结合试用模型调整,或基于已有的统计检验的结果,并结合试用模型与实际资料的偏差,重新选用新的试用模型与实际资料的偏差,重新选用新的试用模型。这一程序可以反复进行,其最终结果可以保证所选用的模型的预测误差达到最