基于随机森林方法的地铁车门故障诊断-陈苏雨.pdf
《基于随机森林方法的地铁车门故障诊断-陈苏雨.pdf》由会员分享,可在线阅读,更多相关《基于随机森林方法的地铁车门故障诊断-陈苏雨.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、20 测控技术2018年第37卷第2期基于随机森林方法的地铁车门故障诊断陈苏雨,方宇,胡定玉(上海工程技术大学城市轨道交通学院,上海201620)摘要:针对现有地铁车门故障诊断方法存在的诊断速度慢以及大量故障检修数据未得到合理利用等问题,提出一种基于信息增益率的随机森林故障诊断方法。该方法将地铁车门历史故障数据集转化成决策表,通过Bootstrap重抽样,建立多棵基于信息增益率的决策树,形成随机森林故障诊断模型,实现地铁车门故障的快速诊断。且随着故障数据的增加,其故障诊断模型可以自动更新完善。通过地铁车门实际故障数据,验证了该方法的有效性。同时,通过对随机森林模型中决策树的数目讨论分析,确定了
2、该方法模型的最优设计结构。关键词:地铁车门系统;随机森林;C45决策树;故障诊断中图分类号:TP277 文献标识码:A 文章编号:10008829(2018)02002005Subway Door Fault Diagnosis Based on Random Forest MethodCHEN Suyu,FANG Yu,HU Ding-yu(School of Urban Rail Transportation,Shanghai University of Engineering Science,Shanghai 201620,China)Abstract:In order to solve
3、 the problems of the existing subway door fault diagnosis methods such as slow diagnosis and the failure of reasonable utilization of a large number of troubleshooting data,a random forest fault diagnosis method based on information gain ratio is proposedThis method historical of fault data set subw
4、aydoors is transformed into decision table,and multiple decision trees based on the information gain ratio is builtthrough Bootstrap re-sampling to form a random forest fault diagnosis model,which can realize the rapid diagnosis of subway doors faultsWith the increase of fault data,the fault diagnos
5、is model can be automatically up-dated and perfectedThe effectiveness of the method is verified by the actual fault data of subway doorAt thesame time,the optimal structure of the model is determined by discussing and alalyzing the number of decisiontree in the random forest fault diagnosis modelKey
6、 words:subway doors system;random forest;C45 decision tree;fault diagnosis随着城市人口的急剧增长,地铁作为一种快速、高效、大运量的交通工具在城市交通系统中扮演着越来越重要的角色。车门系统是地铁列车的关键子系统之一。由于地铁站间距离较短,车门系统的高工作强度导致其零部件极易损坏。1。地铁列车车门安全性问题的发生不仅影响列车的正常运行,还对乘客的人身安全造成一定的威胁。因此,对地铁车门系统进行故收稿日期:20170511基金项目:上海市科委科研计划资助项目(122101501200);上海工程技术大学研究生科研创新项目(E3
7、-090316-01250)作者简介:陈苏雨(1995一),女,河南洛阳人,硕士研究生,主要研究方向为城轨车辆车门故障诊断;通信作者方宇(1974一),男,博士,教授,主要研究方向为车辆设计及车辆运行安全监测等。障诊断是保证其安全运行的重要一环。地铁车门系统结构复杂,某一部件发生故障时会对列车产生多种影响。近年来,专家学者针对地铁车门故障诊断进行了一系列研究。夏军2 o采用TOPSIS(Technique for Order Preference by Similarity to an IdealSolution)法,构建车门故障树模型,对车门系统故障进行定性分析和定量分析,确定客室车门系统的
8、薄弱环节。针对传统的TOPSIS算法会导致排序结果不合理的问题,徐霖。列引入加权最小平方法对原有TOPSIS算法进行改进,以确定底事件的最佳搜索次序。然而,上述方法的基础均是故障树算法,故障树分析要求分析人员必须非常熟悉所分析的对象系统,且不同的分析人员编制出的故障树也是不同的。另外,对于复杂的系统,建立故障树的步骤繁多,计算也较为复杂,建好后不方便更改。根据塞拉门的故障特点,师会超4万方数据基于随机森林方法的地铁车门故障诊断 21将专家系统与数据结构的有关知识应用于地铁车门故障诊断中,建立了塞拉门的故障诊断专家系统。刘晶。副在传统Petri网方法理论的基础上,结合典型的关联矩阵提出了改进模糊
9、故障Petri网的方法,并将其应用于地铁客室车门系统故障诊断,实现故障诊断智能化。上述方法为地铁车门维修提供了有效的理论依据,但仍存在大量故障检修数据未得到合理利用的问题。且随着数据的增多,模型变得庞大,诊断速度变慢。决策树是一种对样本进行训练并预测的树形分类器,能够快速处理高维度数据。与单棵决策树相比,随机森林具有不需要剪枝的优势。本文结合决策树与随机森林的特点,提出基于信息增益率的随机森林故障诊断方法来解决上述问题。该方法首先通过失效模式与影响分析(Failure Mode and Effects Analysis,FMEA)对原始地铁车门故障数据进行预处理,得到FMEA表和简约决策表。然
10、后利用简约决策表建立故障诊断模型,最后通过故障诊断模型完成对地铁车门的故障诊断。1 基于信息增益率的随机森林地铁车门故障诊断11 随机森林随机森林是由多棵决策树组成的分类器J。在车门故障数据中,故障原因是决策类别,故障对车门的影响(即故障现象)是特征属性。通过对地铁车门故障数据的学习,根据节点分裂规则,对地铁车门的故障现象进行排序,得到各个节点的特征属性,再根据特征属性的不同值,从该节点向下分支,最终构造出地铁车门故障诊断决策树。在生成决策树的过程中,根据节点分裂方法的不同,可以将决策树分为基于信息增益分裂的ID3决策树。7:,基于信息增益率分裂的c45。8。决策树以及基于基尼指数分裂的CAR
11、T决策树。一般建立的地铁车门故障诊断决策树越小,其预测能力越强,准确率越高。其次,由于样本数据中存在大量的冗余数据和孤立点,在建树的过程中,容易造成过拟合问题,即少部分特殊地铁车门故障数据影响整个故障诊断模型的精度,所以必须对地铁车门故障诊断决策树进行剪枝处理,然而剪枝方法在执行的过程中比较复杂,不易执行。传统的随机森林。9是利用Bootstrap重抽样方法从原始样本中抽取多个样本,对每一个样本建立CART决策树,然后将这些决策树组合在一起,通过投票得出最后的分类结果。CART算法主要是进行二分类,而地铁车门系统结构复杂,往往一个故障原因可能会导致多个故障现象,一个故障现象也可能是由多个原因导
12、致的。因此,拟引入多分类决策树算法即ID3决策树算法和c45决策树算法,对传统随机森林进行改进和优化。ID3决策树算法存在无法处理连续性属性以及属性值空缺的问题,并且用信息增益作为节点判定标准容易偏向于取值较多的特征。所以,将C45决策树算法与随机森林算法相结合,提出基于信息增益率的随机森林方法,对地铁车门故障数据进行随机森林建模,最终达到故障诊断的目的。所建模型不仅可以在未剪枝的情况下有效避免过拟合问题,且随着数据的增多,其模型可以自动更新完善。建立C45决策树模型步骤如下:首先将经FMEA预处理的地铁车门故障数据整理成简约决策表。根据表格,故障样本集有|s个故障样本,得到主要故障原因有m种
13、,即决策类别属性有,n个不同的值,定义m个不同类C。(i=1,2,m)。设c。是类Cj中的样本数,对给定故障数据集分类的信息期望为,(c,C2,c。)=p。1。g:(p。) (1)i=1式中,P。为故障数据集S中属于C。的概率,即。故障数据样本中主要有d个车门故障现象,即特征属性有d种,定义d个特征属性A。(W=1,2,d)。每一个故障现象有两个属性:发生和不发生。即特征属性A。将数据集s划分为两个子集S和s:。假设凡。是属性A。中子集St中类C。的故障样本数,则由属性A。划分成子集的熵为 E(A。)=一!生兰型;当,(n。,凡巧,几。)(2)式中,塑二兰当为属性A。具有值。i的样本个数除以s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 随机 森林 方法 地铁 车门 故障诊断 陈苏雨
限制150内