基于支持向量机及油中溶解气体分析的大型电力变压器故.pdf
《基于支持向量机及油中溶解气体分析的大型电力变压器故.pdf》由会员分享,可在线阅读,更多相关《基于支持向量机及油中溶解气体分析的大型电力变压器故.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 23 卷 第 7期中 国 电 机 工 程 学 报Vol.23 No.7 Jul.2003 2003 年 7 月Proceedings of the CSEE2003 Chin.Soc.for Elec.Eng.文章编号0258-8013200307-0088-05 中图分类号TM835.4 文献标识码A 学科分类号4704027基于支持向量机及油中溶解气体分析的大型电力变压器故障诊断模型研究董 明孟源源徐长响严 璋西安交通大学陕西 西安 710049FAULT DIAGNOSIS MODEL FOR POWER TRANSFORMER BASED ON SUPPORTVECTOR MACH
2、INE AND DISSOLVED GAS ANALYSISDONG Ming,MENG Yuan-yuan,XU Chang-xiang,YAN ZhangXian Jiaotong University,Xian 710049,ChinaABSTRACT:A multi-level decision-making model for powertransformer fault diagnosis based on SVM(Support VectorMachine)is presented.Based on correlation analysis,some keygases are s
3、elected as the inputs of SVM;furthermore,improving the use of the fault information within DGA(Dissolved Gas Analysis),the fault diagnosis is accomplishedaccording to the concentration distribution of typical fault gasesin higher dimensional space.The proposed approach is basedon seeking the optimal
4、 solution by few training samplessupporting,and it has important features such as goodgeneralization and consistency performance,etc,which is verysuitable to solve the problems of less typical fault data fordiagnosis.And the comparison between two kinds of SVM ispresented also.Meanwhile the output o
5、f this model is improvedby approaching exactly with K-Nearest Neighbor SearchClassification for the SVM classification results,which isadjacent to optimal separating hyperplane.So the dependabilityof this model is enhanced greatly,and its effectiveness andusefulness is proved.KEY WORDS:Transformer;F
6、ault diagnosis;Dissolved gasesin oil;Support vector machine(SVM);K-NN search摘要提出用支持向量机作为分层决策电力变压器故障诊断模型首先通过相关统计分析选择典型油中气体作为支持向量机输入参数然后在深入发掘油中气体所含故障信息基础上利用典型故障气体的相对含量在高维空间的分布特性进行变压器故障类型诊断该方法基于小训练样本条件下寻求最优解具有很好的推广能力及一致性等优 基金项目国家自然科学基金项目59637200东北电力集团项目 Project Supported by National Natural Science Fou
7、ndation of China59637200点还适用于变压器典型故障数据少的特点文中还给出了两种不同支持向量机核函数分类结果的比较为了提高故障诊断的正判率该模型同时在相关性强的特征气体之间利用 K-近邻搜索聚类在最优分类面附近对分类结果进行精确逼近使分层决策模型可靠性显著改善计算结果表明该模型具有很好的分类效果关键词变压器故障诊断油中溶解气体支持向量机K-近邻搜索1 引言电力变压器属电力系统中的重要设备而油中溶解气体分析DGA技术是目前对油浸变压器进行故障诊断最方便有效的手段之一它往往能较准确可靠地发现逐步发展的潜伏性故障防止由此引起重大事故在油中溶解气体的诊断方面主要采用 IEC/IEE
8、E 推荐的方法也有不少国家结合自己的具体情况制定了各不相同的油中气体的可接受水平及故障判断规则1我国相关规程基本上沿用 IEC 三比值法2已为及时发现变压器故障隐患发挥了重要作用但在现场应用中也发现不少问题主要有缺编码编码边界过于绝对等针对这些不足各种智能技术如模糊推理人工神经网络等已被引入变压器的故障诊断中并取得了比较好的效果3-5分析变压器故障产气的机理可知单一类型的变压器故障与油中气体含量之间并没有明确的函数映射关系气体含量的分布特性也很难推测而实际现场数据的采集精度及数量也很有限传统方万方数据第 7 期董 明等 基于支持向量机及油中溶解气体分析的大型电力变压器故障诊断模型研究89法都是
9、基于统计学渐进理论基础上发展起来的即当样本数量趋向于无穷大时的极限特征但在工程实际中这样的前提条件往往难以满足当问题处在高维空间时尤其如此因此基于经验风险的最小化原理在实际应用中具有很大的局限性本文将统计学习理论中的通用学习方法 支持向量机引入到变压器诊断中利用置信范围最小化以控制诊断中风险问题并在深入挖掘变压器油中气体所含故障信息的基础上利用分层决策解决大类别分类问题的同时将 K-邻近搜索聚类应用于分层决策修正了支持向量分类器参数难于选择带来的误差该模型可有效地求取变压器油中气体特征空间中的最优解提高了故障诊断的正确性2 支持向量机基础2.1 概述支持向量机SVM是不同于神经网络的另外一种模
10、式识别方法它是在小样本学习条件下通过选择适当的模型最优分类面以保持置信范围的固定从而使经验风险最小化它避免了学习过程中易陷入局部极小的缺点并在提高学习一致性的同时通过事先选择的非线性映射 将输入向量 x 映射到一个高维特征空间 Z用来构造最优分类超平面这时并不需要以显示形式来考虑特征空间只需能够计算特征空间中的向量的点积),()()(yxyZxZK=因此可以在对于特征空间的实际特征不清楚的条件下得出最优解从而为问题的解决提供了便利条件62.2 广义最优分类面支持向量机是从线性可分情况下的最优分类面发展而成的其基本思想如图 1 所示的两类线性可分问题图中空心点和十字分别表示两类的训练样本 H 为
11、把这两类没有错误地分开的分类线 H1最优分类面间隔H1HH2图 1 最优分类超平面Fig.1 Optimal separating hyperplaneH2分别为各类样本中离分类线最近且平行于分类线的直线而 H1和 H2之间的距离是两类的分类间隔并将 H1H2上的训练样本点称作支持向量该最优分类面不但能将两类无错误地分开而且要使分类间隔最大前者保证经验风险最小而后者使推广性的界中的置信范围最小从而使问题的真实风险最小推广至线性不可分情况为了描述分类超平面并考虑到存在不能被分类超平面正确分类的样本引入了松弛向量0i则超平面的约束条件为01)(+iiibxwy (1)式中 w 为超平面法线方向b
12、为常数再经过进一步的简化在线性不可分的情况下广义最优分类面问题可转化为)()(21),(1=+=niiCwww (2)式中 C 为某个制定的常数控制错分样本惩罚的程度实现在错分样本的比例与算法复杂度之间的折衷2.3 最优分类面的构造要寻找最优分类面就是要求解如上所述的二次规划问题找出唯一的极小点在此仅讨论非线性可分的情况该优化问题可由拉格朗日泛函的鞍点给出+=liiCwwabwL1)(21),(=+liiiliiiiiybxwa111)(3)式中 0ia0iai为拉格朗日乘子根据优化理论的 Kuhn-Tucker 定理7利用Cai0所对应的样本即可求出分类阈值 b最后可得到基于最优超平面的决策
13、函数)sgn()(bxwxf+=(4)3 K-近邻搜索聚类基础最近邻法是非参数模式识别的方法之一对于未知样本x只要比较 x与=ciiNN1个已知类别的样本之间的欧氏距离就能决策 x与它最近的样本是否同类而 K-近邻搜索聚类(K-NN Search)是最近邻法的一种推广在 N 个样本中来自 w1类的样本有 N1个来自 w2类的有 N2个来自 wc类的有 Nc个若 k1k2kc分别是 k 个万方数据90中 国 电 机 工 程 学 报第 23 卷近邻中属于 w1w2wc类的样本数则可以定义判别函数为cikxgii,2,1,)(=(5)决策规则为iijkxgmax)(=则决策jwx理论上如果样本数 N
14、 及近邻数 k 趋于无穷时K-邻近法则为最优分类但在实际问题中样本数 N是有限的所以在 K-邻近法中总希望采用大一些的近邻数 k 值以减少错误率另一方面又要求 k 个近邻都很靠近x故本文在选择 k 值时采取折衷的考虑使它总是样本总数的一小部分为了避免k1k2的情况在此处选择 k 为奇数84 变压器故障的分层诊断模型在深入挖掘变压器油中溶解气体所含故障信息的基础上才能作出更为准确的故障诊断结论9变压器油中气体自身测量结果的模糊性反映故障能力的迟滞性表现不同类型故障的灵敏性各异等特点为准确的故障诊断造成了很大的困难何况故障现象明确的现场 DGA 数据搜集的难度大变压器故障产生机理不明确等又为故障诊
15、断增加了难度为适应故障诊断的这种要求本文一方面采用分层决策的模型基于小训练样本的条件下由粗到细逐步将故障进行分类使诊断不断深入逐渐靠近故障的真实情况另一方面将 K-邻近搜索聚类和 SVM 引入决策模型以完成具体的分类计算如此的模型设计出于两个目的 分层决策模式的采用可以降低需分类的类别数目减少大类别情况下多种类别分布非常接近的可能性避免出现错分从而达到提高诊断效果的目的 单一 SVM分类器参数设计复杂况且 SVM 算法目前无法与具体 DGA 数据的各种先验知识结合如果仅仅不加区别地同等对待分类问题势必造成误差的引入尤其对于处于可疑诊断区如图 1 所示的H1H2之间的区域的数据问题更是如此为了提
16、高 SVM 对 DGA 数据分类效果引入 K-近邻搜索聚类修正其结果它首先以 SVM 的分类结果为基础然后将支持向量与可疑区 DGA 数据一起作为训练样本在更小范围内进行新的聚类分析完成整个分类计算过程此方法既兼顾 DGA 数据在特征空间分布特性更为了提高分类的可靠性一种分层决策模型如图 2 所示图中 KNN 为 K-近邻搜索聚类DGASVM-KNN0SVM-KNN1 SVM-KNN2导电回路过热导磁回路过热涉及固体绝缘放电不涉及固体绝缘放电过热放电图 2 基于 SVM 分层故障诊断决策模型Fig.2 Multi-level fault diagnosis model based on SVM
17、5 基于支持向量机的分层决策模型5.1 基于油中溶解气体的故障分类本文针对收集到 980 台故障明确的变压器油中气体含量的数据先除掉了一些数据不够全及测量结果明显有误的数据后得到 811 组故障变压器的油中气体数据为了在分类过程中使得分类模型在复杂性与推广性之间求得平衡以避免欠学习或过学习的出现分类模型的合理设计是十分重要的在分析变压器故障特点的基础上仅依靠 DGA本身所含有限的故障信息支持下直接将故障定位到部位的分类模型其可靠性将不稳定推广性将很差因此本文先按照故障模式分类将故障发生的部位使用分层决策的方法如图 2 所示将故障由粗到细划分为导电回路过热导磁回路过热涉及固体绝缘的放电和不涉及固
18、体绝缘的放电105.2 故障特征量的选择考虑到各种气体组分含量之间的巨大差异性及分散性为降低其相互之间由于量值差异造成的影响对 DGA 原始数据进行归一化处理以降低气体之间的互斥性11另外反映故障特点的特征很多如何选择具有代表性的变量以便实现在采用少量有代表性的变量代替大变量集时所损失的信息最少这又成为了进一步进行有效故障识别的关键根据得到的数据本文利用逐步判别统计分析方法试图通过分析选择最能反映故障类型差异的气体组分组合作为 SVM 的输入从而建立较好的故障信息到故障类型的映射关系在该分析中气体相对含量能否作为输入成员进入模型主要取决于协方差分析的 F 检验的显著性水平以总体 DGA归一化数
19、据为例其分析结果见表1所示由结果可以看出DGA 数据在经过归一化处理后 随步数增加逐渐降低这表明气体各组份相对含量是独立的而且显著性水平 均为零这也说明相对含量对分类均是高度有效的输入变量万方数据第 7 期董 明等 基于支持向量机及油中溶解气体分析的大型电力变压器故障诊断模型研究91故本文以 H2CO2COCH4C2H6C2H4C2H2的相对含量作为 SVM 分类器的输入变量表 1 变压器油中特征气体相对含量逐步统计分析结果Tab.1 Results of statistic analysis of relativeconcentrations of DGA step-by-stepDGA步数
20、Wilks lambda()显著性水平C2H610.6120.000C2H220.3780.000C2H430.3570.000H240.3320.000CO50.3270.000CH460.3260.000CO270.3250.000 注为 U 统计分析中显著性水平5.3 分类模型的执行步骤根据变压器 DGA 数据应用 SVM 分类模型进行数据处理分析从而识别变压器内部发生的故障其中包括数据预处理模式分类等部分见图3数据处理归一化相对含量SVM 分类处于可疑区K-邻近法分类故障模式DGA数据处于非可疑区图 3 变压器故障分类模型诊断流程Fig.3 Flow chart of fault di
21、agnosis for power transformer6 分层决策模型故障识别6.1 支持向量机故障识别支持向量机在确定核函数后通过训练迭代运算就可以得到最优权系数进而供实际应用但DGA 数据还不够多很难推测出其分布这给核函数的选择造成了很大的困难本文中采用择优选择的方法分别使用多项式形式和径向基作为核函数比较其分类效果见表 2表 2 支持向量机故障分类结果Tab.2 Results of fault classification based on SVM支持向量个数训练样本分类正判率/%检验样本分类正判率/%SVM 分类器类型总体放电过热总体放电过热总体放电过热多项式1291552999
22、4.885.988.695.785.185.4径向基12414727695.785.988.695.785.186.8如表 2 所示采用径向基核函数的性能要比多项式更好分类正判率相对较高对于不知分类问题概率分布的情况下采取径向基核函数可以取得较好的推广效果从中可以得到四个结论 该实验说明了 SVM 方法较传统方法有明显的优势正判率大为提高同时也说明不同的支持向量机可以得到分类性能相近的结果而不像神经网络那样十分依赖于对模型的选择 该实验得到两种不同的支持向量机最终得出的支持向量只是总训练样本中的很少一部分而且两组支持向量中有 80以上是重合的这也说明支持向量本身对不同方法具有一定的不敏感性故方
23、法的选择应针对实际问题不同 对于误判的数据全部位于诊断可疑区间内如果引入另外的故障信息必定能提高诊断的效果 训练和检验样本数据的正判率相差不多说明 SVM 分类器的推广性很强为SVM 更进一步实际故障分类应用提供了保证6.2 K-邻近法故障识别通过 SVM 故障识别过程可以得到支持向量并确定出可疑区间接着以支持向量及可疑数据作为 K-邻近法的训练样本由于在可疑区间内数据的分布较集中误差的代价就相对于包括非可疑区间所有数据作为训练样本时小得多而且效果也明显提高以总体故障识别为例其故障判别图谱如图 4 所示0 50 100 150 200 250检验样本数量(a)原始模式图谱放电故障过热故障0 5
24、0 100 150 200 250检验样本数量(b)SVM 分类结果图谱放电故障过热故障0 50 100 150 200 250检验样本数量(c)SVM-KNN分类结果图谱放电故障过热故障图 4 分层决策分类器输出结果Fig.4 The outputs of multi-level decision-making classifiers万方数据92中 国 电 机 工 程 学 报第 23 卷7 故障诊断应用实例本文将典型样本及输入矢量的选取方法综合应用于组合分类识别模型后其诊断准确率如表 3所示表中还列出了对同样样本用基于模糊数学的范例检索算法的诊断结果12可见本文分层决策诊断模型确有明显的提高
25、表 3 分层决策模型实例Tab.3 The application of power transformer fault diagnosis故障类型检验样本数正判台次正判率/%总正判率/%导电回路过热6562/5895.4/89.2导磁回路过热7972/7091.1/88.6涉及固体绝缘放电4744/4293.6/89.4不涉及固体绝缘放电4138/3392.7/80.593.1/87.5 注a/ba 为采用基于本文算法的诊断结果b 为采用基于模糊数学的诊断结果8 结论1支持向量分类器有助于深入挖掘有关监测参数中所含的故障信息以便在有限的小训练样本的条件下也能得到比较准确的诊断结果同时支持向量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 支持 向量 溶解 气体 分析 大型 电力变压器
限制150内