分散控制系统〔DCS〕的可靠性.docx
分散控制系统DCS的可靠性分散控制系统DCS的主要作用是对消费经过进展控制、监视、治理和决策,因此要求它必须具有很高的可靠性,这样才能保证工厂的平安、经济运行。为了实现这一点,在分散控制系统中采用了很多进步可靠性的措施。我主要从可靠性的一般概念、可靠性分析方法、分散控制系统中采用的可靠性措施,和软件的可靠性问题进展简单的阐述。可靠性的研究工作随着大规模计算机系统和国际性计算机通讯网络的不断开展,可靠性问题己经成为一个特别重要的问题,可靠性理论也在这种形势下不断地开展和完善,可靠性技术的研究内容大致分为四个方面:可靠性设计、可靠性分析、可靠性试验、可靠性治理。可靠性设计旨在按照一定的技术要求,设计和制造出可靠性高、不易损坏的产品;可靠性分析那么是通过对有关数据的采集、分析和计算得出一些关于可靠性问题的评价和结论;可靠性试验是验证系统可靠性是否到达规定指标的手段,它能暴露系统设计中可能存在的问题;可靠性治理着眼于从治理方面进步整个系统的可靠性,例如制定公道的检修周期,装备适宜的备品备件,安排适量的检修人员等。一、分散控制系统中的可靠性措施在分散控制系统中,采用了很多进步可靠性的技术措施。这些技术措施是建立在以下四种根本思想上的:一是要使系统本身不易发生故障,即所谓的故障预防;二是在系统发生故障时尽可能减少故障所造成的影响,即所谓的故障保安和故障弱化;三是当系统发生故障时,可以让系统继续运行,即所谓的故障容许;四是当系统发生故障时,可以在不停顿系统运行的情况下进展维修,即所谓的在线维修。基于这四种根本思想,分散控制系统中采用了各种各样的可靠性措施。1严格进展质量治理和进步系统硬件程度硬件是系统正常工作的物质根底,也是影响系统可靠性的关键所在。因此,进步硬件的平均故障间隔时间MTBF是进步系统可靠性的重要措施。为了实现这一点,分散控制系统的制造厂家采取了很多措施。1.对元器件进展严格的挑选和老化所谓挑选,就是将不符合使用条件的元器件,通过适当的方法予以剔除。所谓老化就是在元器件投入使用之前,将其置于一定的工作条件下,使有可能发生参数漂移的元器件逐步稳定。2.元器件的降额使用电子元器件都有一定的使用条件,这些使用条件是以元器件的某些额定参数值来表示的。理论证实,当元器件的工作条件低于额定值时,其工作比拟稳定,发生故障的时机也比拟少。所以为了进步可靠性,往往将元器件降额使用。降额的幅度要从可靠性和经济性两方面综合考虑,由于元器件的额定参数越高,价格也越高。3.充分考虑到参数变化的影响在电路设计上充分考虑到元器件在使用经过中受参数变化造成的影响,使之在各种不利情况下均能正常工作。4.采用低功耗元件低功耗元件的发热量比拟少,它们的故障率相对来讲比拟低。另外,普遍采用低功耗元件可以大大地减轻电源的负担,进步电源的可靠性。5.采用噪声抑制技术在工业控制现场,各种各样的干扰脉冲经常是造成控制系统硬件故障的原因。因此,采用噪声抑制技术是进步系统可靠性的一种行之有效的方法。6.耐环境设计在系统硬件的设计上,充分考虑各种环境因素的影响,采用适当的冷却、抗震、防尘、防腐等技术措施,以进步系统抵御外部环境侵袭的才能。2使系统故障时处于平安状态1.限制故障范围系统在工作中不断地进展在线故障检测,一旦发现故障,就将故障设备与系统隔离,使它不致于影响其他设备的正常运行。2."冻结"CPU输出假如系统检测到CPU故障,那么立即"冻结"控制系统的输出信息,以免造成输出混乱。3采用后备措施1.手动后备对于重要的控制回路,可以采用手动后备的方法来进步可靠性。一旦自动控制失灵,可以手动控制消费经过。分散控制系统有三种处于不同层次上的手动操纵方式,见下列图:1在运行员操纵站上进展手动操纵这种手动操纵要求运行员操纵站、通讯网络、根本控制单元、经过输出通道都可以正常工作时才能进展,因此,具有一定局限性。2用手动操纵站通过I/O模件进展操纵这种手动操纵方式所经过的环节比拟少,因此具有较高的可靠性。但它仍然要求I/O模件正常工作,否那么手动操纵不能进展。3用手动操纵站直接进展操纵,在这种情况下,手动操纵站直接输出420mA或者15V的模拟量信号去控制执行机构。因此,即使I/O模件发生故障,手动操纵仍然可以进展。这种手动操纵也是电厂中经常采用的一种操纵。2.自动后备自动后备是采用冗余的方式设置另外一套或者几套备用控制装置。当处于运行状态的自动控制装置发生故障时,备用控制装置自动投入,维持系统的自动控制。自动后备是冗余系统的一种形式,后面将进展较为具体的讨论。二、软件的可靠以上所讨论的是硬件的可靠性,下面将扼要介绍软件可靠性的一般概念。软件可靠性方面的研究工作起步较晚,但近年度来逐渐引起人们的重视。其主要原因是,软件的可靠性不高不仅会影响系统的工作,甚至会导致系统的瘫痪,造成不可挽回的事故。例如,在1963年度,一个隐藏的软件错误曾经使美国飞往火星的火箭发生爆炸,造成一千万美元的损失。软件可靠性的研究目前还不太成熟,但把握一些根本概念,对于更好地认识软件可靠性问题是有禅益的。1软件的可靠性软件的可靠性最初仅仅被以为是软件的准确性。假如软件可以准确无误地完成所要求的功能,人们就以为软件是可靠的。然而,这最最少的要求也经常不能得到知足。有人做过统计,对于初次编出的软件,平均每1004000条指令就会出现一个错误。这些错误需要在调试、联调、试运,甚至到运行时才能陆续被发现和改正。近年度来,人们对软件可靠性赋以更广泛的含义,即便于使用和便于扩展。假如一个软件不便于使用,不便于扩展,就以为这个软件存在着缺陷。软件的质量主要由以下六方面的因素决定:1时间因素与硬件一样,软件也有MTBF、MTTR等指标。除此之外,还有以下时间指标:系统平均不工作间隔时间MTBDMeanTimeBetweenSystemDowns、平均停机时间MDTMeanDownTime。2缺陷频数包括软件缺陷数、文件缺陷数、用户提出的补充要求数。3与软件可靠性有关的百分率除了与硬件相似的可靠性、可用性、可维修性、故障率等百分率之外,还有以下几种百分率:不合格率:不能算故障但应进展改良的事件叫不合格事件,它的出现率叫不合格率。延迟率:一项要求在规定时间T内完成的任务,由于软件不可靠,实际完成时间为T1,那么定义D=T1-T为延迟时间,D/T叫延迟率。误操纵率:这与操纵者的操纵程度有关,但在一定程度上反映了软件讲明书是否清楚,和软件是否适用于操纵。原因不明率:出现了软件故障但查不出原因,进而无法纠正的故障率叫原因不明率,它反映了软件的可维修性。同故障事件率:第一次出现的故障在采取措施纠正后仍重复出现的再现率叫同故障事件率。它反映了纠正措施不彻底。可靠性经费率:为软件可靠性及维修所付出的费用与总软件费用之比叫可靠性经费率。4软件投入包括开发软件所消耗的工日数或者工时数,对软件检查的工程数,对用户提出的要求采取对策的费用等。5软件特性包括软件是首次开发的还是根本套用的、复杂程度、标准化程度、构造及规模大小、软件的寿命周期等。6使用方面特性软件使用方面的特性例如,在线系统、实时系统等、计算机的特点、所用的体制、质量标准等。2软件的质量标准在此仅介绍以下几种常用的软件质量指标:1平均不工作间隔时间MTBD。设Tv为软件正常工作总时间,d为系统由于软件故障而停顿工作的次数,那么有MTBD=Tv/d+12系统不工作次数在一定时间内。由于软件故障停顿工作,必须由操纵者去参与再启动才能继续工作的次数。3平均修复时间MTTR。它反映了出现软件缺陷后采取对策的效率。对于在线系统而言,一般要求MTTR0