数学建模大赛一等奖作品.doc

收藏

编号:2610939    类型:共享资源    大小:1.17MB    格式:DOC    上传时间:2020-04-24
10
金币
关 键 词:
数学 建模 大赛 一等奖 作品
资源描述:
-* 数学建模论文 队伍名称 三人行 姓名 院、系、专业 联系方式 队伍成员 交通与物流工程 交通与物流工程 交通与物流工程 高速公路道路交通事故分析预测 摘 要 我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。针对这样的现状,我们必须进行高速公路交通事故的预测,从而及早采取措施进行预防工作,从而减少事故发生次数及损失程度。 针对此次建模的要求,在对此问题的深入研究下,我们提出了合理的假设,将本问题归结为一个预测分析的问题,其基本思想是通过聚类分析、SPSS软件求解、GM(1,1)灰色预测模型、多元线性回归分析,组合模型等方法的运用得到最优的预测结果。 针对问题一,我们首先运用了聚类分析的思想,建立了基于聚类分析的模型Ⅰ,通过聚类分析方法对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。 针对问题二,本文选取受伤人数这一单项指标作为预测的对象,首先运用了GM(1,1)灰色预测模型,建立模型Ⅱ,通过对给定的事故原始数据,通过MATLAB软件预测了五年内的交通事故受伤人数;运用多元线性回归方法建立模型Ⅲ,在模型Ⅱ和模型Ⅲ的基础之上,通过基于组合模型思想的模型Ⅳ,求解得出了交通事故受伤人数在五年内的预测。 关键词:SPSS聚类分析 GM(1,1)灰色预测模型 组合预测模型 MATLAB 目录 一.问题重述 3 二.问题的分析 4 三.模型假设与符号系统 5 3.1模型假设 5 3.2符号系统 6 四.模型的建立及求解 7 4.1 问题一 7 4.1.1建立模型Ⅰ 7 4.1.2模型Ⅰ的求解及结果 8 4.1.3实验结果的分析说明 9 4.2 问题二 12 4.2.1建立GM(1,1)模型Ⅱ 12 4.2.2 用MATLAB求解模型Ⅱ 16 4.2.3 建立模型Ⅲ 19 4.2.4 建立优化模型Ⅳ 20 4.2.5最优组合模型的求解 21 五.模型的评价 22 参考文献 23 附录 24 一.问题重述 随着道路交通事业的发展,高速公路交通事故也在不断增加,对人类的生命和财产安全构成了极大的威胁。我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。 高速公路交通事故往往造成人员伤亡,车辆损毁、道路堵塞等严重后果,为探索高速公路道路交通事故发生的规律,分析现有道路交通条件下未来高速公路交通事故的发展趋势,以便及早采取措施进行预防,减少事故发生次数及损失程度,必须进行高速公路交通事故预测。另外,高速公路道路交通事故分析预测是道路交通安全规划,决策及高速公路交通工程项目效益评价中的一个关键性问题,分析预测正确与否直接关系到高速公路交通设施的建设,高速公路交通管理政策的制定和高速公路交通建设资金的投资分配,具有重要的现实意义。 为了解决此问题,现利用已收集到的A省高速公路交通事故数据(见附件)、建立针对该省具体情况的数学模型,预测该省未来的交通事故情况,解决下面几个问题: 1、目前国内外用于统计道路交通事故状况的四项绝对指标为交通事故次数、死亡人数、受伤人数以及直接经济损失,这四项统计指标既是认识交通事故的起点,又是构造其它交通事故统计指标的基础,基本涵盖了道路交通事故所造成各种损害的主要方面,因此选用这四项指标,试探讨以聚类分析作为理论基础的高速公路公路交通事故统计分析方法,然后从附件中所给A省高速公路交通事故四项指标的历史统计数据出发,对该省公路交通事故进行聚类分析研究,以期该省获得该省高速公路交通事故基于四项指标的时间、空间分布规律。 2、高速公路交通事故预测是高速公路安全评价、规划及决策的基础,国内外关于道路交通事故的预测有多种方法,鉴于高速公路交通事故具有复杂性、随机性和灰色性的基本特征,对高速公路公路交通事故预测时选用时间序列分析,灰色分析、神经网络等分析方法。根据高速公路交通事故的分布规律,构建高速公路交通事故发生次数、死亡人数、受伤人数、直接经济损失的预测模型。以A省公路交通事故的历史统计数据为基础,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对A省公路交通事故未来五年的发展趋势做出科学预测,为高速公路交通安全管理部门提前预防和控制交通事故提供决策依据。 二.问题的分析 2.1(问题一) 本小问主要解决对该省公路交通事故四项指标进行的聚类分析。此小问属于统计问题,因此由附件的相关数据信息,我们首先将附件中高速公路事故24时分布、月统计、辖区统计进行整理,得出四项指标在六年中小时段、月份、辖区分布总量。 本问题主要解决该省高速公路交通事故基于四项指标的时间、空间分布规律。本问题为聚类分析的思想,由题目可以知道对于A省高速公路交通事故分布规律需要分别对四项指标进行聚类分析,找出各个指标内的能够度量不同小时段、不同月份、不同辖区之间的相似度的统计量。并将其聚合到不同类中。 因此,用SPSS的K-means Cluster过程即逐步聚类法,按照预定的分类数量,按照既定的原则选择凝聚点,得到一个初始分类方案,并计算出各个初始分类的中心位置(均值);最后,使用计算出的中心位置重新进行聚类,因此在该方法中,各指标的分类情况会在运算中不断改变,分类完毕后再次计算各类的中心位置。如此反复循环,直到凝聚点位置改变很小为止。 2.2 (问题二) 由对题目的第二问分析,可知第二问分为两小问。 第一小问:选用灰色分析、多元线性回归分析等分析方法构建高速公路交通事故受伤人数预测模型。交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性 ;具有明显的不确定性特征。因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统的理论进行研究。用G(1,1)灰色建立受伤人数指标的预测模型,在GM(1,1)模型及相关模型灰色预测过程中要大量进行数列和矩阵运算将MATLAB软件和GM(1,1)结合,实现灰色预测算法;建立多元线性回归模型。 第二小问:本小问为优化问题,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对A省公路交通事故未来五年的发展趋势做出科学预测。 对四项指标分别用灰色分析和多元线性回归模型结果进行精确度比较,并且构建最优组合预测模型。利用以上两种不同的单项预测法对受伤人数指标进行预测,然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。本文采用简单实用的求方差极小值法,获得组合预测模型。 三.模型假设与符号系统 3.1模型假设 (1)假设在受伤人数统计时,以伤残等级三级以上归为受伤。 (2)假设在财产损失统计时,所损失的物资、费用等均按现社会流通价值或社会人力服务成本的平均值进行统计。 (3)根据其同一指标中的个体有较大的相似性,不同类中的个体差异较大,用聚类方法聚合时,将其聚合在3类中。 (4)假设高速路上行驶的车辆状况、驾驶员心理状态良好。 3.2符号系统 Xij表示第i个指标在第j年的给定值; 实际给定的第k年的死亡人数:其中k=1,2,…6; 的一次累加生成序列; 为的紧邻均值生成序列待定参数列; B为数据矩阵 ,为待估参数; Y为数据向量; 为待定参数列; 为生成残差; 为残值均值; 为原始数据的方差; 为残值的方差; 为后验差比值; 为小误差概率; 为组合模型使用; 为多元线性回归预测值; 为灰色理论预测值; 为多元线性回归预测的预测误差; 为灰色理论预测的预测误差; 多元线性回归的相应权系数; 灰色理论模型的相应权系数; MSPE为均方百分比误差; 四.模型的建立及求解 4.1 问题一 4.1.1建立模型Ⅰ 聚类分析法是根据实物本身的特性来定量研究分析问题的一种统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是更具一批样品的多个观测指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用聚类发将所有的样品(或变量)分别聚合到不同的类中。 将分析评价中的n个待评样本作为聚类对象(Xi)(i=1,2,…,n);m个;评价指标作为聚类指标(Uj)(j=1,2,…,m),s个评价标准作为评价等级(Zk)(k=1,2,…,s).则根据第i个聚类独享对于第j个聚类指标的样本值Xij,确定聚类样本矩阵为X : 以一年十二个月的数据分析为例:在对给定的原始收据通过Excel整理的基础上我们建立了针对交通事故每月的聚类分析模型。将分析评价中的12个待评样本作为聚类对象(Xi)(i=1,2,…,12);4个;评价指标作为聚类指标(Uj)(j=1,2,3,4),我们设定为三类分类标准,则聚类样本矩阵为: 4.1.2模型Ⅰ的求解及结果 在建立了聚类分析的模型的基础上,我们采用了SPSS软件来对模型进行求解,SPSS的优点是计算量较小,从而可以有效的处理多变量、大样本数据而不会占用过多的内存空间和计算时间;同时在分析时用户可以人为地制定初始中心位置,或者将曾做过的聚类分析结果作为初始位置引入分析。通过计算得得出下面的实验数据结果: 表4.1初始聚类中心 聚类 1 2 3 次数 45.00 45.00 36.00 死亡人数 26.00 35.00 27.00 受伤人数 41.00 50.00 36.00 经济损失 1012394.00 1263204.00 738204.00 表4.2最终聚类结果 案例号 月份 聚类 距离 1 一月 1 2867.600 2 二月 1 114864.429 3 三月 3 180.068 4 四月 2 3051.507 5 五月 1 37387.572 6 六月 1 71712.429 7 七月 2 3051.507 8 八月 1 69137.572 9 九月 1 37496.430 10 十月 1 114680.572 11 十一月 3 14556.001 12 十二月 3 14736.001 表4.4每个聚类中的案例数 聚类 1 7.000 2 2.000 3 3.000 有效 12.000 缺失 .000 4.1.3实验结果的分析说明 (1)表2.2显示的是将样品分为三类的聚类结果,这三类分别是:一月、四月、十一月。 (2)表2.3表示的是最终的聚类分析结果。 (3)表2.4反映了聚类分析中的有效样品数为12个,没有样品数的缺失。 综上得出聚类分析的结论(三月、十一月、十二月)为交通事故最轻的,(一月、二月、五月、八月、九月、十月)为交通事故一般的,(四月、七月)为交通事故最为严重的。 同理我们得出了一天中二十四小时以及每个辖区的数据分析结果如下表所示: 表4.5以辖区为单位的数据结果分析 案例号 辖区 聚类 距离 1 辖区 3 128890.469 2 辖区 2 344284.505 3 辖区 3 96888.462 4 辖区 3 214476.540 5 辖区 3 39959.539 6 辖区 3 201362.539 7 辖区 3 234361.540 8 辖区 2 150913.502 9 辖区 3 258343.466 10 辖区 3 233859.540 11 辖区 3 112157.462 12 辖区 2 100373.508 13 辖区 3 149838.462 14 辖区 3 286803.462 15 辖区 3 66440.462 16 辖区 3 175342.540 17 辖区 2 92997.504 18 辖区 1 .000 表4.6最终聚类中心 聚类 1 2 3 次数 137.00 48.25 16.31 死亡人数 110.00 27.25 11.62 受伤人数 176.00 46.50 18.38 经济损失 4721128.00 1015373.50 238676.54 得出分析结果: (1)表2.6显示将分类对象区域分为三个等级。 (2)表2.5(一区、三区、四区、五区、六区、七区、九区、十区、十一区、十三区、十四区、十五区、十六区)为所辖区范围内交通事故最轻的、(二区、八区、十二区、十七去)为辖区范围内交通事故一般的区域、(十八区)是辖区范围内交通事故最为严重的。 (3)表2.5显示有效数据位十八个,没有数据缺失。 表4.7以小时为单位的最终聚类结果 案例号 小时 聚类 距离 1 0-1时 1 41531.125 2 1-2时 1 52677.126 3 2-3时 1 55879.876 4 3-4时 1 81456.125 5 4-5时 2 47286.000 6 5-6时 2 47286.000 7 6-7时 1 62299.875 8 7-8时 1 57623.125 9 8-9时 3 74947.072 10 9-10时 1 102944.876 11 10-11时 3 101939.073 12 11-12时 3 22358.929 13 12-13时 3 4205.074 14 13-14时 3 89233.929 15 14-15时 3 12656.073 16 15-16时 3 98614.072 17 16-17时 3 25122.929 18 17-18时 3 71976.929 19 18-19时 3 77094.929 20 19-20时 3 103017.929 21 20-21时 3 54255.929 22 21-22时 3 114598.072 23 22-23时 3 36102.072 24 23-24时 1 12162.875 表4.8 以小时为聚类对象的最终聚类中心 聚类 1 2 3 事故次数 26.50 33.00 18.93 死亡人数 20.63 23.50 11.29 受伤人数 28.50 31.00 22.14 经济损失 661234.88 892427.00 343619.93 分析可得,在对以小时为聚类对象的分析中:表2.8显示以小时为分类对象划分为三个等级。表2.7显示在(08:00-09:00、10:00-23:00、)为交通事故发生最轻 的小时段(04:00-06:00)为交通事故发生程度最为严重的小时段;(00:00-04:00、06:00-08:00、09:00-10:00、23:00-24:00)为交通事故发生程度一般的小时段。 4.2 问题二 4.2.1建立GM(1,1)模型Ⅱ 交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性;如果把某地区的道路交通作为一个系统来看,则此系统中存在着一些确定因素(灰色系统称为白色信息),如道路状况、信号标志等;同时也存在一些不确定因素(灰色系统称为灰色信息),如车辆状况、气候因素、驾驶员心理状态等等,具有明显的不确定性特征。因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统的理论进行研究。 高速公路交通事故灰色预测的特点分析 高速公路交通事故灰色预测的原理、方法及所具有的特点表现在: (1)灰色预测方法认为,某一地区在某一时间区间内的交通事故指标值,是在一定范围内变化的且与时间坐标有关的灰色量。该方法将原始数据整理成较有规律的生成数列后再进行研究、处理,避免了概率统计方法的大样本、大工作量而其结果不理想的状况。 (2)数学模型GM(1,1)是一阶单变量微分方程;这与以往的概率统计方法利用高散数据所建立的按时间作逐段分析、递推、高散的模型有本质的区别。 (3)GM(1,1)灰色预测模型不是交通事故原始数学模型,而是生成数据序列模型;通过对生成数列的处理,使杂乱无章的原始数据呈现出一定的规律性。 MATLAB的基本数据单位是矩阵,其核心也是矩阵,它可直接进行矩阵的乘积、矩阵的乘方、矩阵的除法、稀疏矩阵等运掣”。在MATLAB语言系统中,几乎所有的操作都是以矩阵操作为基础,用户可以用类似于数学公式的方法编写程序实现算法,大大降低了编程所需的难度并节省了时间。而在GM(1,1)模型及相关模型的灰色预测过程中,要大量进行数列和矩阵运算嘲,这晗好使MATLAB派上了用场。将MATLAB和GM(1,1)模型结合,实现灰色预测算法,恰到好处。 灰色预测模型GM(1,1)的建立过程 GM(1,1)的一般形式 设有变量X(0)={X(0)(i),i=1,2,...,n} (1) 为某一预测对象的非负单调原始数据列,为建立灰色预测模型:首先对X(0)进行一次累加(1—AGO, Acumulated Generating Operator)生成一次累加序列:           X(1)={X(1)(k),k=1,2,…,n} (2) 其中           X(1)(k)=X(0)(i) (k=1,2,3…n) %作1—AGO生成序列 For i=1:n X1(i)=sum(x0(1:i)); End 对X(1)可建立下述白化形式的微分方程:          十=u ,式中a,u是待定系数。 (3) 灰微分方程动态模型为: (4) 式中为的紧邻均生成,即 %紧邻均生成 For k=2:n %%紧邻均生成z z(k)=0.5*x1(k)+0.5*x1(k-1); end (2)构造矩阵B和数据向量 和满足关系,其中: B= Yn=(X(0)(2), X(0)(3),…, X(0)(n))T  (3)计算系数a和u (5) 可用(5)式表示,由此计算出系数a和u for i=1:n-1 b(i,1)=-z(i+1); y(i)=x0(i+1); end b(:,2)=1; y=y’; %转置为列向量 au=b\y; %作矩阵除法,计算a u (4) 累加模型预测结果 (1)(k)=(X(0)(1)-)+ (6) %计算GM(1,1)模型(1)(k)值 Yc1(1)=x0(1); For k=1:n C=x0(1)-au(2)/au(1); Yc1(k+1)=c*exp(-au(1)*k)+au(2)/au(1); End (5)还原后的预测结果(作IAGO) (7) %计算值,显示预测结果 Yc0(1)=x0(1); For k=1:n Yc0(k+1)=yc1(k+1)-yc1(k); End Disp(uint16(yc0(2:1:n+1))); 2、检验和判断GM(1,1)模型的精度 为确保所建灰色模型有较高的精度能应用于预测实际,按灰色理论一般采用三种方法检验判断GM(1,1)模型的精度,它们是,残差大小检验;关联度检验和后验差检验。通常关联度要大于0.6,残差P、方差c越小,模型精度P越好。 (1) 残差检验 残差检验:e(k)= 相对误差: (2)关联度检验 因分辨系数毛是在(0,1)中取定的实数,一般取=0.5。关联度是各关联系数£(k)累加后在n维空间的平均值。当分辨系数=0.5,认为关联度大于0.6时可以接受,即通过关联度检验,否则关联程度差些。 %计算关联度 Max1=max(abs(e0)); r=1; for k=2:n r=r+0.5*max1/(abs(e0(k))+0.5*max1); end r=r/n; % r表示关联度 (2) 方差比和小误差概率检验 方差和小误差概率检验属后验差检验,计算公式分别如下: 预测误差均值 原始数据均值 原始数据标准差: 预测数据标准差 方差比: 小误差概率: 表4.9 P、C预测精度表 精度等级 一 二 三 四 P >0.95 >0.8 >0.7 0.7 C <0.35 <0.45 <0.65 0.65 由P和C的值检验GM(1,1)模型的预测精度,以提供决策依据。精度等级越小越好,精度一致,表示预测具有较高的精度,四级为不通过。模型精度等级由表1所示。 %方差和小误差概率检验 If p>0.95&c<0.35 Disp(‘ 预测精度好‘); Else if p>0.8&<0.5 Disp(‘ 预测合格‘); Else if p>0.7&<0.65 Disp(‘ 预测勉强合格‘); else Disp(‘ 预测不合格‘); End End End 4.2.2 用MATLAB求解模型Ⅱ 根据题目给定四项指标要求,我们选择采用灰色预测模型来预测交通事故受伤人数,其中交通事故死亡人数在2006年到2011年的数据如下表2所示: 4.10 为2006年到2011年交事故受伤人数 年份 2006 2007 2008 2009 2010 2011 死亡人数 738 695 660 563 504 431 2006-2011年的A省高速道路事故受伤人数的原始序列为: 由此可得生成数列为: 其数据矩阵B为: 在MATLAB中计算可得: 数据向量为: 可得待定参数列为: 则预测模型为: 最后需要进行还原处理,作“生成数列”的逆运算,即进行还原处理得到交通事故受伤人数的预测模型。 因为 所以 利用MATLAB软件得出和的取值: 表4.11 GM(1,1)预测模型计算一览表 年份 2006 2007 2008 2009 2010 2011 k 1 2 3 4 5 738 1450.7 2083.8 2642.6 3145.8 3589.6 即预测序列 712.12 633.11 562.4 499.58 443.78 原始值 738 695 660 563 504 431 预测值 年份 2012 2013 2014 2015 2016 k 6 7 8 9 10 3983.8 4334 4625 4921.4 5166.8 即预测序列 394.21 350.18 311.07 276.32 245.46 原始值 预测值 436.701 387.319 433.523 304.675 270.244 MATLAB软件的出预测分析图,如下表所示: 图4.1 MATLAB 预测分析图 残差检验和后验差检验,其结果为: 方差比 C=0.435<0.45 合格 小误差概率 P=1>0.95 好 上述结果说明建立的灰色预测模型通过检验,且模型的精度为I 级,精度好。(参照表1) 4.2.3 建立模型Ⅲ 多元线性回归模型可以用于预测对象Y受多个因素影响的情况。P元线性回归模型: 用最小二乘估计法求未知参数的最小二乘估计。 记 令 整理的正规方程组(3): (3) 其解记为,即为的最小二乘估计。从而P元线性回归方程(4): 4.2.4 建立优化模型Ⅳ 基于以上两种预测模型建立优化组合模型 组合预测就是利用以上两种不同的单项预测法对同一预测对象进行预测,然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。 目前关于权系数的计算方法很多,主要分为主观赋值法、客观赋值法、试算比较法,客观赋值法就是根据一定的理论或标准通过代数计算等确定权值,例如误差绝对值之加权和最小法、误差平方和最小法、方差极小值法等,本文采用求方差极小值法,该方法简单实用,掌握起来也不难。 设是灰色GM(1,1)的预测值,是多元回归预测值,是最优组合预测值,预测误差分别为,,,取 和是相应权系数,且,有 则误差ε及方差D分别为 关于对求极小值,可得 显然可取,,记 , ,则组合模型的权系数分别为: ,,由此我们可得最优组合预测模型。 4.2.5最优组合模型的求解 二元回归模型的自变量取, 分别为序号和交通事故次数,通过计算,它的预测模型为 GM(1.1)模型中的辨识算式,。预测结果如表4.12 表4.12两种预测模型的受伤人数预测结果 两种预测模型的受伤人数预测结果 单位:人 年份 实际受伤人数 GM(1,1)灰色预测 误差(%) 二元回归模型预测 误差(%) 2006 738 738 0 729.28 -1.220% 2007 695 712.72 2.463% 686.33 -1.247% 2008 660 633.11 -4.074% 673.25 2.007% 2009 563 562.40 0.106% 583.29 3.603% 2010 504 499.58 -0.877% 511.42 1.389% 2011 431 443.78 2.965% 416.92 -3.267% 根据最优组合方法计算: 灰色模型的权重系数: 二元线性回归模型权重系数: 所以组合预测模型为式: 得组合模型的预测结果,与其他两种预测模型结果做比较 三种预测模型的预测结果 单位:人 年份 实际受伤人数 GM(1,1)灰色预测 误差(%) 二元回归模型预测 误差(%) 组合模型预测 误差(%) 2006 738 738 0 729.28 -1.220% 735.32 -0.363% 2007 695 712.72 2.463% 686.33 -1.247% 704.64 1.387% 2008 660 633.11 -4.074% 673.25 2.007% 645.40 2.212% 2009 563 562.40 0.106% 583.29 3.603% 568.80 1.030% 2010 504 499.58 -0.877% 511.42 1.389% 503.21 0.157% 2011 431 443.78 2.965% 416.92 -3.267% 435.56 1.058% 我们采用如下的均方百分比误差来检验组合模型: 其中:MSPE是均方百分比误差, 是实际值,是预测值。 通过计算可得:二元回归模型预测的均方百分比误差为1.14290%,GM(1,1)灰色模型的均方百分比误差为1.13552%,组合预测的均方百分比误差为0. 60509%。 根据组合模型可预测出2012-2016年某高速公路因交通事故的受伤人数。如下表: 2012-2016年某高速公路因交通事故的受伤人数 年份 2012 2013 2014 2015 2016 组合预测值 391 351 310 276 244 五.模型的评价 优点: (1) 聚类分析K-means模型对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。 (2) 聚类分析K-means模型与SPSS统计软件结合简单方便且实用。 (3)从前面对组合模型的百分比误差分析中可以看出:二元线性回归模型预测的预测精度相对比较低,模型预测精度相对较好,组合预测模型的预测精度大于任一单项预测模型,它避免了单项预测模型的片面性,综合利用各种预测提供的信息,具有更好的预测效果。 (4)建立了二元回归预测与灰色预测组合的预测模型,研究了其在交通事故四项指标中受伤人数预测的应用,并得出了好的结论,为交通事故四项指标的预测提供了一种新的,可靠的方法。 (5)对于灰信息处理技术与多元线性回归模型融合得到有机组合体。实现功能互补,能够使预测数据精度大大提高。 用灰色系统理论的思想、方法对原始数据进行处理,很大程度上改善了统计模型性能。与多元线性规划模型进行组合,深化对系统演化规律的认识。 缺点: (1)聚类分析K-means模型的算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。 (2)从 K-means 算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,需要与SPSS等统计软件作辅助工作。 (3)组合模型计算量相对于单项预测模型较大。 参考文献 [1]邓聚龙.灰色系统基本方法[M].武汉:华中理工大学出版社,1996. [2]李云贵等.灰色GM(1,1)预测模型的改进[J].系统工程,1992(6):42~43. [3]何能,鲍一丹.灰色马尔可夫预测模型及其应用[J].系统工程理论及实践,1992(4):22~24. [4]肖新平等.灰色系统分析理论及其应用[M].大连:大连海事大学出版社,1997. [5]吴维扬.经济预测及案例分析[M].北京:中国经济出版社,1995. [6]庄楚强,吴亚森.应用数理统计基础(第二版)[M].广州: 华南理工大学出版社, 2003, 12. [7]马骥, 张卫峰.组合预测方法在磷肥需求预测中的应用[J].统计与决策, 2005, (6): [8] 周爱民.基于偏最小二乘法的情报组合预测法[J].统计与决策,2004, 176(8): [9] 江西省统计局编.江西统计年鉴2005[M].北京: 中国统计出版社,2005. [10] 杨明媚,李华林.主成分分析在证券组合投资中的应用[J].统计与信息论坛, 2004, [11]姚祖康.道路与交通工程系统分析.北京:人民交通出版社,1996 [12]邓聚龙.灰色控制系统.武汉:华中工学院出版社,1985 [13]Bates,J.M.and Granger,C.W.J.combination of Forecast, Operations Research Quarterly,20(4),1969,451-468 [14]国家统计局编.中国统计年鉴.北京:中国统计出版社,2004 [15]牛东晓,陈志业,谢宏.组合灰色神经网络模型及其季节性负荷预测.华北电力大学学报,2000,27(4):1-6 [16]王应明,傅国伟.基于不同误差准则和范数的组合预测方法研究[J].控制决策, 1994 附录 附表一:原始数据的处理 月份的原始数据: 月份 次数 死亡人数 受伤人数 经济损失 一月 45 26 41 1012394 二月 41 27 51 1130126 三月 40 22 43 752580 四月 45 35 50 1263204 五月 46 30 57 977874 六月 49 32 60 1086974 七月 55 36 58 1257101 八月 53 37 61 946124 九月 51 40 55 1052758 十月 41 26 43 900581 十一月 36 27 36 738204 十二月 41 31 46 767496 年份的原始数据处理: 辖区 次数 死亡人数 受伤人数 经济损失 辖区一 35 21 58 367567 辖区二 76 55 90 1359658 辖区三 17 13 21 335565 辖区四 1 1 1 24200 辖区五 17 8 15 198717 辖区六 8 10 8 37314 辖区七 0 0 0 4315 辖区八 27 28 39 864460 辖区九 44 30 54 497020 辖区十 2 2 1 4817 辖区十一 9 11 11 350834 辖区十二 66 5 18 915000 辖区十三 25 23 27 388515 辖区十四 37 18 23 525480 辖区十五 13 11 15 305117 辖区十六 4 3 5 63334 辖区十七 24 21 39 922376 辖区十八 137 110 176 4721128 小时的原始数据处理: 小时 次数 死亡人数 受伤人数 经济损失 0-1时 25 22 30 702766 1-2时 31 27 30 713912 2-3时 24 18 21 605355 3-4时 31 25 34 742691 4-5时 34 26 32 845141 5-6时 32 21 30 939713 6-7时 26 18 26 598935 7-8时 27 20 31 718858 8-9时 23 13 26 418567 9-10时 21 12 30 558290 10-11时 26 18 35 445559 1
展开阅读全文
提示  淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:数学建模大赛一等奖作品.doc
链接地址:https://www.taowenge.com/p-2610939.html
关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

收起
展开