基于决策树的变电站故障诊断知识表示与获取.doc
《基于决策树的变电站故障诊断知识表示与获取.doc》由会员分享,可在线阅读,更多相关《基于决策树的变电站故障诊断知识表示与获取.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、专业基于决策树的变电站故障诊断知识表示与获取白建社,樊波,黄文华,薛钧义(#交通大学电气工程学院,#710049)摘要:针对传统的知识表示与获取方法的不足,提出基于决策树的知识表示与获取方法。该方法充分利用决策树把知识表示与获取融于一身的优点,使知识表示与知识获取同时进行,克服了传统人工智能系统中知识表示与知识获取分离的缺点。将其用于变电站故障诊断知识的获取与表示中,结果表明,提出的方法不仅能够实现知识的自动获取与表示,而且所获得的以决策树形式表示的知识具有很高的推理效率。关键词:变电站;决策树;知识获取;故障诊断Knowledge Representation and Acquisition
2、 Based on Decision Treefor Substation FaultDiagnosisBAIJianshe,FANBo,HUANGWenhua,XUEJunyi(College ofElectricalEngineering,Xian Jiaotong University,Xian 710047,China)Abstract:Knowledge representation and acquisition(KRA)is always a bottleneck problem of buildingartificialintelligence system(AI),which
3、 is based on knowledgeThis paper aimed at the shortage of theknowledge representation and acquisition methods at present,and proposed a new KRA method based ondecision tree(DT)This proposed method used the advantage that the decision tree possesses the knowledgerepresentation and acquisition,and car
4、ried out the knowledge representation(KR)and knowledge acquisition(KA)simultaneously,overe the shortage of the KR and KA separated in traditional AIFinally,theproposed method was applied to the knowledge representation and acquisition of fault diagnosis forsubstation,and the resultshows thatnotonly
5、itcan implementthe automatic acquisition and representation ofknowledge,but also the acquired knowledge in decision tree possess the greatly high inference efficiencyKey words:substation;decision tree;knowledge acquisition;fault diagnosis1引言变电站的连续可靠运行十分重要,变电站的故障诊断问题获得广泛研究,所采用的方法主要有模糊理论1,6,10、专家系统2,3
6、,6,9、人工神经网络2,3,4,9,10、Petri网5等。基于知识的人工智能方法,首要的问题是获取专家知识并以有效的形式表示出来,以便于计算机推理。虽然专家系统和模糊推理系统采用的基于规则的知识表示方法具有简单、直观的优点,但它们一般不能进行知识的自动获取;而且基于规则的知识所采用的模式匹配推理机制,使系统的推理速度很慢,实时性很差。Petri网以图形的形式表示知识,所表示的知识不仅简单明了,而且有很高的推理速度;但与专家系统一样, 不能实现知识的自动获取(Petri网模型必须人工构建)。神经网络是把知识表示与获取融于一身的方法,不仅能实现知识的自动获取,而且有很高的推理速度;但是神经网络
7、知识表示隐含,不便于人类专家检验,而且它的灵活性很差,系统的任何变化,都必须重新进行学习,并且它的学习收敛速度很慢。决策树是由内部结点和叶结点构成的以分类与决策为目的的树,决策树学习是以实例为基础的归纳学习7。也就是说,决策树是通过自身的学习获取知识,并以决策树形式(通过内部结点和叶结点)表示出来,即它是把知识表示与获取融于一身的。以决策树形式表示的知识简单直观,便于人类专家检验,也具有很高的推理效率(决策树推理就是对决策树的遍历)。因此,把决策树应用到变电站故障诊断领域,不仅可以实现故障诊断知识的自动获取与表示,而且所获得的以决策树形式表示的知识具有很高的推理速度。2决策树知识表示与获取21
8、决策树知识表示知识表示是一种描述专家知识的约定,以便于把人类的知识表示成机器能够处理的数据结构。良好的知识表示形式不仅可以提高知识存储的有效性和运用效率,而且可以提高人工智能系统的推理效率。通过学习生成一棵决策树,可以根据内部结点的属性及其取值对未知实例分类。因此一棵学习完成的决策树中包含了一定的知识。决策树知识表示就是把专家知识隐含地表示在决策树的内部节点和叶结点上,并根据内部结点上的属性及其取值表达知识的条件部分,而在叶结点上得到知识的结论部分。图1(a)为某故障诊断知识的决策树表示。为了更清楚地理解决策树的知识表示,可以把它转化 成产生式规则的形式,如图1(b)所示。从中可以看出,具有两
9、个结点的决策树表示了5条产生式规则形式的规则,因此决策树具有很强的知识表达能力。从知识的推理角度来看,决策树最多两步比较就可以得到结论(由于决策树的深度为2),而产生式规则最坏的情况下要进行5次模式匹配才能得到结论,因此决策树具有更高的推理速度。22故障诊断知识的决策树获取知识获取是从大量数据或信息中提取有用信息(即知识)的过程。决策树学习是从大量的实例中归纳出以决策树形式表示的知识。通过学习建立一棵决策树,是从实例中提取知识并以决策树的形式表示出来。因此,基于决策树的知识获取问题实际上就是决策树的学习问题,核心是决策树的学习算法。在决策树学习算法中,最著名的是基于信息熵的ID3算法,它是以信
10、息的赢取作为选择检验属性的标准(每次选取信息熵最小的属性为测试属性)。但该算法存在偏向于取值较多的属性的缺点,而取值较多的属性并不一定是对决策或分类贡献最大的属性7。在构造决策树的过程中,希望优先选择对决策或分类贡献最大的属性,为此必须对ID3算法做必要的改进。粗糙集理论是Pawlak 1982年首先提出的,它把知识看作是关于论域的划分,认为知识是有粒度的7,利用相对核的概念进行知识相依性分析和约简。因此可以把它用到决策树的学习中,以改善决策树的性能。定义设(P,Q)为知识表达系统S中的一个算法,称(P,Q)中所有不可省略的属性的集合为P相对于Q的核,记作COREQQ(P)。当P和Q分别表示信
11、息系统的条件属性和决策属性时,如果一个属性a(aP)不是COREQQ(P)中的属性,则从P中删除a不会改变原系统的决策性能。反之,删除COREQQ(P)中的属性将会改变原信息系统的决策。这样就把属性集分为核心属性和非核心属性两类,且认为核心属性对分类有更大的贡献,对决策也是至关重要的。故优先选择核心属性作为构造决策树的测试属性。为此,可以利用粗糙集改进决策树学习的ID3算法,以弥补基于信息熵学习方法的不足,称为粗糙ID3算法,描述如下:1)依据训练事例集,计算条件属性集相对于决策属性集的核,并形成核心属性集和非核心属性集。2)如果核心属性集中仅有一个属性,则把这个属性作为决策树的测试属性,向下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 决策树 变电站 故障诊断 知识 表示 获取
限制150内