数据挖掘舰船装备维修费估计-精品文档.docx
数据挖掘舰船装备维修费估计摘要:舰船装备维修费具有一定的规律性,同时也有一定的随机性,导致很难进行准确估计。为了提高舰船装备维修费精度,减少舰船装备维修估计偏差,设计了基于数据挖掘的舰船装备维修费估计模型。首先分析当前舰船装备维修费估计模型的各种局限性,然后收集舰船装备维修费历史数据,并对舰船装备维修费历史数据进行处理,得到愈加有规律的舰船装备维修费数据,然后采用数据挖掘技术建立舰船装备维修费估计模型,并采用实际舰船装备维修费数据进行验证性实验。本文模型的舰船装备维修费估计精度高,舰船装备维修费的估计误差远小于当前其他舰船装备维修费估计模型,结果证实本文方法是一种精度高,误差小的舰船装备维修费估计模型。关键词:舰船装备;维修费估计;数据处理;数据挖掘技术随着舰船的类型越来越多,舰船的使用频率越来越高,舰船各部件出现故障的频率越来越高,当舰船装备出故障时,需要对其进行维修。由于各方面的费用不断增加,舰船装备维修费用也不断增加,为了降低舰船装备维修费,需要对舰船维修费进行估计,因而舰船维修费估计的建模研究遭到了人们的重视1。多年以来,舰船公司以及相关研究机构对舰船维修费估计问题进行了相应的研究,当前舰船维修费估计模型能够划分为两类:一类是线性舰船维修费估计模型,主要有元线性回归模型2,其以为舰船维修费呈现线性变化特点,建模经过特别简单,而且特别容易实现舰船维修费估计程序,但是其舰船维修费估计精度低,这是由于舰船维修费与经济、材料以及人工劳务费相关,不仅只是线性变化特点,而且具有较强的随机性变化特点,这样线性模型无法建立高精度的舰船维修费估计模型3。另一类是非线性的舰船维修费估计模型,主要有神经网络模型,其以为舰船维修费具有非线性变化点,通过模拟人大脑思想经过对舰船维修费变化特点进行建模,相对于线性舰船维修费估计模型,其舰船维修费估计精度得到了明显的改善。但是神经网络要求舰船维修费的历史数据比拟大,不然得不到理想的舰船维修费估计结果4。支持向量机是近期兴新的一种数据挖掘技术,其建模能力比BP神经网络强,而且要求问题的历史数据数量不多,为舰船维修费估计建模提供了一种新的工具5。为了提高舰船装备维修费精度,减少舰船装备维修估计偏差,设计了基于数据挖掘的舰船装备维修费估计模型,并采用实际舰船装备维修费数据进行验证性实验,以分析本文模型的舰船维修费估计效果。1数据挖掘技术1.1混沌分析理论x(i),i=1,2,n混沌分析理论是一种数据分析方法,其能够将看似无规律的数据进行适当变换,得到有规律的数据,能够加快建模速度,同时并获得更优的建模效果。设舰船维修费历史数据为:,n表示舰船维修费历史数据点数,若对数据不做任何处理,直接采用支持向量机对舰船维修费历史数据进行建模,有时舰船维修费估计结果不理想,因而采用混沌分析理论对舰船维修费历史数据进行变换,通过确定合理的时间延迟和嵌入维数m,变换得到更有规律的舰船维修费数据,详细为:1.2支持向量机X(i)=x(i(m1),x(i),x(i)y(i)=x(i+1)变换后的舰船维修费数据为:,其对应的输出为:,支持向量机通过训练建立如下形式:(xi),yi和支持向量机的超平面距离为1/,在建模经过中,难免出现一点误差比拟大的数据点,因而需要引入松弛变量i对误差点进行弱化操作,那么能够得到对式3的问题进行求解特别困难,为了简化操作,以更好的求解,对式3进行适当变换,得到带约束优化问题,详细为式中,C表示对估计误差的惩罚程度。引入拉格朗算子i进一步对式4进行简化操作,加快问题求解速度,则有:采用核函数K(xi,x)=(xi)(x),那么最后得到支持向量机的决策函数为支持向量机的建模效果与惩罚参数C取值直接相关,通常采用人工方式确定,这样得到的惩罚参数值不是最优,影响舰船维修费估计效果,本文选择布谷鸟搜索算法优化支持向量机的惩罚参数C的值,以提高船维修费估计精度。2舰船装备维修费估计模型的设计数据挖掘的舰船装备维修费估计模型综合了混沌分析理论和支持向量机的优点,工作步骤为:1根据相关文献以及有关研究,通过专业人员对舰船装备维修费历史数据进行收集。2确定和m,通过混沌分析理论对舰船维修费历史数据进行变换,得到舰船维修费估计的建样子容貌本。3采用布谷鸟搜索算法优化支持向量机的惩罚参数C。4采用最优C建立舰船维修费估计的模型。5采用测试数据对舰船维修费估计模型的性能进行分析。3舰船装备维修费估计的实例分析3.1舰船装备维修费历史数据为了分析基于数据挖掘的舰船装备维修费估计模型性能,对一个舰船装备修理厂维修费的历史数据进行收集,结果如图1所示。选择前100个数据建立舰船装备维修费估计模型,以分析舰船装备维修费拟合效果,选择其他50个数据对舰船装备维修费估计模型泛化性能进行测试。为了验证数据挖掘的舰船装备维修费估计模型优越性,选择文献5的数据挖掘的舰船装备维修费估计模型进行仿真比照实验。采用混沌分析理论对图1中的舰船装备维修费历史数据进行分析,得到舰船装备维修费历史数据的=5,m=7,采用采用布谷鸟搜索算法优化支持向量机的惩罚参数C,结果为c=17.785。3.2结果与分析采用两种舰船装备维修费估计模型对图1中的舰船装备维修费前100个历史数据进行拟合,得到的结果如图2所示。对图2的舰船装备维修费拟合结果进行分析能够知道,本文舰船装备维修费估计模型的拟合效果要优于比照舰船装备维修费估计模型的拟合效果,提高了舰船装备维修费拟合精度,大幅度降低了舰船装备维修费拟合误差,初步验证了本文舰船装备维修费估计模型的优越性。采用2种舰船装备维修费估计模型对图1中的50个历史数据进行估计,得到的结果如图3所示。可知,本文模型的舰船装备维修费泛化效果更优,提高了舰船装备维修费估计精度,再一次证实了本文舰船装备维修费估计模型的优越性。4结语舰船装备维修费遭到工人工资、经济、材料等因素综合影响,具有特别强烈的随机性,当前模型对舰船装备维修费变化特点难以进行精准描绘,使得舰船装备维修费估计误差大,为了解决舰船装备维修费估计误差大的缺陷,设计基于数据挖掘的舰船装备维修费估计模型,并进行了舰船装备维修费估计实例验证,结果表明,本文模型能够精度描绘舰船装备维修费变化趋势,获得了高精度的舰船装备维修费估计结果,在舰船装备维修中具有广泛的应用前景。