可靠性工程基础一.ppt
第六章、可靠性工程基础第六章、可靠性工程基础可靠性的定义(一)狭义定义 产品在规定的条件下和规定的时间内完成规定功能的能力。(二)广义可靠性 产品在规定条件下,在整个寿命周期内完成规定功能的可能性。可可靠靠度度是指产品在规定的条件和规定的时间内,完成规定功能的概率。它是时间的函数,以R(t)表示。若用T表示在规定条件下的寿命(产品首次发生失效的时间),则则“产品在时间产品在时间t t内完成规定功能内完成规定功能”等价于等价于“产品寿命产品寿命T T大于大于t”t”。所以可靠度函数可靠度函数R(t)R(t)可以看作事件“Tt”概率,即 其中f(t)为概率密度函数可靠度函数可靠度函数 可靠度R(t)可以用统计方法来估计。设有 个产品在规定的条件下开始使用。令开始工作的时刻 t取为0,到指定时刻t时已发生失效数r(t),亦即在此时刻尚能继续工作的产品数为 -r(t),则可靠度的估计值(又称经验可靠度)为 设t=0时,投入工作的10000只灯泡,当t=365天时,发现有30只灯泡坏了,求一年时的可靠度.累计故障分布函数与可靠度定义相反,产品在规定的条件下和规定的时间内,丧失规定功能(即发生故障)的概率称为累计故障概率(又称不可靠度),产品的累积故障概率是时间的函数 对某产品给定的工作时间为100 小时,T 为产品故障前的时间,则F(100)=P(T100)。这表示了产品在100 小时前的故障率;如果给定的时间t为1000 小时,则F(1000)=P(T1000),就表示了1000小时前的故障概率。显然1000小时前的情况包含了100小时前的情况.因而,F(t)含有累积故障的概念。可靠度R(t)与故障分布函数F(t)具有以下性质:1、R(t)F(t)1 2、R(0)=1,F(0)0,这表示产品在开始时处于良好的状态;3、R(t)是非负的递减函数,F(t)是非负的递增函数,说明随着时间的增加产品发生故障或失效的可能性增大,可靠度变小;4、R()0,F()1这表示只要时间充分长,产品终究都会失效;5、0R(t)1,0F(t)1,即可靠度和故障分布函数之值介于0和1之间。可靠度R(t)、故障分布函数F(t)与时间t的关系 F(t)tF(t)R(t)0 F(t)、R(t)与与t的关系的关系(二)故障分布密度函数 o时刻t后单位时间发生故障的概率,并称其为故障分布密度函数(它表示在时刻t后的一个单位时间内,产品的故障数与总产品数之比,是时间的函数)。它是累积故障分布函数的导数。o如果已知故障数据,且产品数N 相当大,则可求出每个时间间隔t内的故障数r(t),从而得到平均经验故障密度o故障密度是表示故障概率分布的密集程度,或者说是故障概率函数的变化率(四)f(t)、R(t)及F(t)之间的关系 R(t)F(t)f(t)0tf(t)f(t)与与R(t)、F(t)的关系的关系失效率失效率(故障率函数故障率函数)和失效率曲线和失效率曲线失效率是在时刻t尚未失效产品在t+t的单位时间内发生失效的概率。o失效率它反映t时刻失效的速率,有时也称为瞬时失效率或简单地称为故障率。一般记为,它也是时间t的函数,故也记为(t),称为失效率函数,有时也称为故障率函数或风险函数。二、失效率二、失效率(故障率函数故障率函数)和失效率曲线和失效率曲线 o 产品的失效率产品的失效率 失效率是在时刻t尚未失效产品在t+t的单位时间内发生失效的条件概率,即 由条件概率公式的性质和时间的包含关系,可知 设在t=0时有 个产品投试,到时刻t已有r(t)个产品失效,尚有 -r(t)个产品在工作。再过t时间,即到t+t时刻,有r(t)=r(t+t)-r(t)个产品失效。产品在时刻t前未失效而在时间(t,t+t)内失效率为 单位时间失效率 失效率的观测值是在某时刻后单位时间内失效的产品数与工作到该时刻尚未失效的产品数之比。讲故障率是有条件的,即“产品工作到时刻t 后”就是条件。故障率表达式分母中的 -r(t)就是随着t 这个条件的变化而变化的。因而故障率能非常灵敏地反映出产品的变化速度。而故障密度函数f(t)反映出的只是在t 附近的一个单位时间内产品故障数与t=0 时的工作产品数 之比,因而不够灵敏。失效率=总失效数/总运行时数失效率的倒数=总运行时数/总失效数:代表平均失效时间(MTTF)(不能修的)或平均失效时间间隔(MTBF)(能修的)AB0 500 4500 5000 h 累计累计失效失效百分百分比比o主要由于设计、制造、贮存、运输等形成的缺陷,以及调试、跑合、起动不当等人为因素所造成的。o失效主要由非预期的过载、误操作、意外的天灾以及一些尚不清楚的偶然因素所造成。o由于产品已经老化、疲劳、磨损、蠕变、腐蚀等所谓有耗损的原因所引起的。o一台电视机有1000个焊点,工作1000小时后,检查100电视机,发现有两点脱焊,那么焊点的故障率为多少?o100 台电视机共有1001000=100000个焊点,这里每1个焊点相当于1个产品,若取t=1000小时,则1000小时后故障率的估计值为对于低故障率的元器件常以 小时为故障率的单位,称之为菲特(fit)。它的意义是每1000个产品工作100万小时后,只有一个故障;或者每1万个产品工作10万小时后,只有1个故障有甲、乙两种产品,甲种产品在t=0h时,有N=100个产品开始工作,在t=100h前有2个故障,而在100h-105h内有1个产品故障率,乙种产品在t=0h时,也有N=100个产品开始工作,在t=1000h前共有51个产品故障,而在1000-1005h内有1个产品故障,试计算甲产品在100h处和乙产品在1000h处的故障率与故障密度。甲产品:甲产品:甲产品:甲产品:乙产品:乙产品:乙产品:乙产品:故障率比故障密度故更灵敏地反映了产品故障的变化速度故障率比故障密度故更灵敏地反映了产品故障的变化速度。1、若年初投入的灯泡为9970只,若一年后坏了10只,求故障率2、100件产品工作三年有4件发生故障,设产品每天工作12小时,求故障率3、某批电子管有100 000 只,开始工作到500 小时内有100 只出现故障,求R(500)假设一个项目在100小时的正常使用条件下,具有0.97的可靠性。1、求失效率2、当T=50时的可靠度3、求MTBF0.814f(t)时间时间TF(T)R(T)维修性定义维修性是产品在规定条件下和规定时间内,按规定的程序和方法进行维修时保持或恢复其规定状态的能力。规定条件,主要指产品的维修级别,包括维修的机构和场所(如工厂或维修基地、修理所、修理车间及使用现场等)、相应的人员(数量及技能水平)、设备、设施、工具、备件等。规定时间,指维修工作的时间要求。规定的程序和方法,指按技术文件规定采取的维修工作类型、来源和方法。保持或恢复其规定状态是产品维修的目的。所说的规定状态是指产品继续正常工作的状态。因此,维修的目的是保持或恢复产品的功能和性能。维修:使产品保持或恢复到规定状态所进行的全部活动。全部活动指所有技术和管理,包括监督的活动,还可能包括对产品的修改。预防性维修:通过对正常产品的系统检查、检测和发现故障征兆以防止故障发生,使其保持在规定状态所进行的全部活动。它可以包括:调整、润滑、定期检查和必要的修理等。预防性维修一般是计划维修。其重点是避免、减少或消除对产品有重大影响的故障的后果。修复性维修(纠正性维修):产品发生故障后,使其恢复到规定状态所进行的全部活动,它可以包括下述一个或全部步骤:故障定位、故障隔离、分解、更换、再装、调准及检测等。修复性维修是非计划维修。修复性维修时间是影响产品可用性的重要参数。维修性定量指标维修性定量指标平均修复时间(M ean Time To Repair,MTTR)在规定的条件下和规定的时间内,产品在任一规定的维修级别上,修复性维修总时间与在该级别上被修复产品的故障总数之比。o平均故障前时间(Mean Time To Failure,MTTF)平均故障间隔时间(Mean Time Between Failure,MTBF)保障性保障性把产品的时间分为工作时间及不能工作时间,不能工作是由于出了故障需要维修造成的。不能工作时间包括维修时间及延误时间,即由于保障资源补给或管理原因未能及时对产品进行维修所延误的时间。延误时间是一个随机变量,它的数学期望为平均延迟时间(Mean Delay Time,MDT)。在理想的情况下,M D T=0产品的设计特性和计划的保障资源能满足使用要求的能力称为产品的保障性。M D T 就是一种保障性参数。可用性可用性产品在任一随机时刻需要和开始执行任务时,处于可工作状态或使用状态的程度称为产品的可用性。可用性的概率度量A 亦称为可用度。假设n 为给定区间内的产品连续工作段数及维修次数,分子、分母都除以n,可得使用可用性。内在可用性运行可用性MTBM:两次维修之间间隔时间包括纠正性和预防性维修MDT:平均停工时间:包括纠正性、预防性维修时间和等待时间甲产品的MTBF=2000h,MTTR=200h;乙产品的MTBF=1000h,MTTR=20h。比较甲乙两产品的可用性。如果某产品的设计可用性为0.99,平均修理时间为2小时,则平均故障间隔时间不能低于多少?1、某设备平均间隔时间是900h,为了保证该设备运行可用性不小于0.9,则平均停工时间需控制在多少?2、某机器3年平均停工时间为20h,两次维修之间平均时间间隔980h求运行可用性?3、某机器平均失效间隔时间198h,平均修理时间2h,求机器的内在可用性?4、某可修复产品发生5 次故障,每次修复时间(单位为分)分别为 48,27,52,33,22。求平均修复时间MTTR。5、设已知某元件寿命的密度函数为 ,求该元件的MTBF 6、假设一台机器运行了10000小时,发生了四次失效,每次失效都得到及时修理,求失效率。可信性分析方法可信性分析方法可信性分析方法可信性分析方法1 1、故障模式影响及分析、故障模式影响及分析(FMEA)(FMEA)2 2、故障树分析(、故障树分析(FTA)FTA)3 3、可靠性预计方法、可靠性预计方法4 4、寿命周期费用分析方法、寿命周期费用分析方法5 5、风险分析方法、风险分析方法1 1、故障模式影响及分析、故障模式影响及分析(FMEA)(FMEA)FMEA是一种归纳法(由下至上),是定性可信性分析方法。它是确定产品所有可能的故障模式,并对故障模式进行分析,确定每种故障模式对产品工作的影响,并把每一个潜在的故障模式按它的严酷度进行分类,找出单点故障。以便采取改进措施,改进产品的可信性。FMEA分为硬件的、功能的、工艺的和接口的FMEA 等。FMEA的工作程序 定义产品。定义产品包括定义产品的功能要求、工作环境,完成时间等。绘制功能框图,包括可靠性框图。确定最低约定层次。对产品的层次进行划分,对于复杂的产品的FMEA不一定要做到元器件级、零件级最低约定层次。最低约定层次的确定可按下述原则处理:第一,能导致灾难性的(类)或致命性的(类)故障的产品所在的产品层次;第二,规定或预期需要维修的最低产品层次,虽然这些产品的故障可能导致临界的(类)或轻度(类)的影响。填写FMEA表格第一栏:代码。即被分析的产品或产品组成部分(硬件、产品功能或功能块)的代码,它应与产品功能框图的编号统一。第二栏:产品或功能标志。记录被分析产品或系统功能的名称。第三栏:功能。即产品或其组成部分(硬件、功能块)要完成的功能的具体内容。要特别注意包括与其接口设备的相互关系。第四栏:故障模式。确定并说明各产品约定的所有可预测的故障模式,并通过分析相应的框图中给定的功能输出来确定潜在的故障模式。第五栏:故障原因。鉴别并说明与所假设的故障模式有关的可能故障原因。第六栏:任务阶段与工作方式。说明产品在什么时间及什么条件下出现故障。第七栏:故障影响。指每个假设故障模式对产品使用、功能或状态所导致的后果。它包括任务目标、维修要求、安全性要求等。对这些后果进行评价,记录在表格中,并评价。第八栏:故障检测方法。说明操作人员或维修人员用来检测故障模式发生的方法。例如,用目测还是自动检测设备等。第九栏:补偿措施。对故障模式的相对重要性进行排队,对于某些相对来说重要的故障模式要采取减轻或消除其不良影响的预防补救措施。这些补救措施可以是设计上的补偿(如采取冗余设计,安全装置设计等),也可以是操作人员的应急补救措施(如操作人员打开应急系统)。第十栏:严酷度类别。添入故障模式影响的相应严酷度类别。第十一栏:备注。需要说明的其他问题。手电筒设计中的手电筒设计中的FMEAFMEA表表代码产品名称功能故障模式故障原因工作方式故障影响故障检测方法补偿措施严酷度类别备注局部影响高一层次影响最终影响01开关弹簧片接通电源弹性降低疲劳使用弹性降低开关接不通灯不亮目测选用弹性好的簧片02后盖弹簧接通电源弹性降低疲劳使用弹性降低开关接不通灯不亮目测选用弹性好的簧丝;改进工艺手电筒设计中的手电筒设计中的FMEAFMEA表表(续续)代代码码产品产品名称名称功能功能故障故障模式模式故障故障原因原因工工作作方方法法故障影响故障影响故障故障检测检测方法方法补偿补偿措施措施严酷严酷度类度类别别备备注注局部局部影响影响高一高一层次层次影响影响最终最终影响影响0303灯座灯座固定灯泡;固定灯泡;接通电源接通电源接触接触不良不良座直座直径公径公差大差大使使用用接触接触不良不良时断时断时通时通时断时断时通时通仪器仪器测试测试减少减少公差公差0404前盖前盖保护灯泡;保护灯泡;调焦调焦松动松动公差公差大;大;磨损磨损使使用用松动松动影响影响聚焦聚焦影响影响测试测试仪器仪器聚焦聚焦减少减少公差;公差;改进改进工艺工艺减少减少公差公差拧不拧不上上公差公差小小使使用用拧不拧不上上2 2、故障树分析(、故障树分析(FTA)FTA)故障树:用以表明产品哪些组成部分的故障或外界事件或它们的组合将导致产品发生一种给定故障的逻辑图。故障树是一种逻辑因果关系图,构图的元素是事件和逻辑门事件用来描述系统和元、部件故障的状态逻辑门把事件联系起来,表示事件之间的逻辑关系故障树分析(FTA)通过对可能造成产品故障的硬件、软件、环境、人为因素进行分析,画出故障树,从而确定产品故障原因的各种可能组合方式和(或)其发生概率。分析方法有:定性分析定量分析1.FTA目的n帮助判明可能发生的故障模式和原因,发现可靠性和安全性薄弱环节,采取改进措施,以提高产品可靠性和安全性;n计算故障发生概率;n发生重大故障或事故后,FTA是故障调查的一种有效手段,可以系统而全面地分析事故原因,为故障“归零”提供支持;n指导故障诊断、改进使用和维修方案等。2.FTA特点n是一种自上而下的图形演绎方法;n有很大的灵活性;n综合性:硬件、软件、环境、人为因素等;n主要用于安全性分析。FTA工作要求1.在产品研制早期就应进行FTA,以便早发现问题并进行改进。随设计工作进展,FTA应不断补充、修改、完善。2.“谁设计,谁分析”n故障树应由设计人员在FMEA基础上建立。可靠性专业人员协助、指导,并由有关人员审查,以保证故障树逻辑关系的正确性。3.应与FMEA工作相结合n应通过FMEA找出影响安全及任务成功的关键故障模式作为顶事件,建立故障树进行多因素分析,找出各种故障模式组合,为改进设计提供依据。4.FTA输出的设计改进措施,必须落实到图纸和有关技术文件中5.应采用计算机辅助进行FTAn由于故障树定性、定量分析工作量十分庞大,因此建立故障树后,应采用计算机辅助进行分析,以提高其精度和效率。故障树分析步骤故障树常用事件符号符号说明底事件元、部件在设计的运行条件下发生的随机故障事件。n实线圆硬件故障n虚线圆人为故障未探明事件表示该事件可能发生,但是概率较小,勿需再进一步分析的故障事件,在故障树定性、定量分析中一般可以忽略不计。顶事件人们不希望发生的显著影响系统技术性能、经济性、可靠性和安全性的故障事件。顶事件可由FMECA分析确定。中间事件故障树中除底事件及顶事件之外的所有事件。符号说明开关事件:已经发生或必将要发生的特殊事件。条件事件:描述逻辑门起作用的具体限制的特殊事件。入三角形:位于故障树的底部,表示树的A部分分支在另外地方。出三角形:位于故障树的顶部,表示树A是在另外部分绘制的一棵故障树的子树。A常用逻辑门及其符号常用逻辑门及其符号示例泰坦尼克海难泰坦尼克海难海难后果顶事件顶事件逻辑门逻辑门 中间事件中间事件底事件底事件船体钢材不适应海水低温环境,造成船体裂纹距其仅20海里的California号无线电设备处于关闭状态,收不到求救信号,不能及时救援船上的救生设备不足,使大多数落水者被冻死观察员、驾驶员失误,造成船体与冰山相撞3 3、可靠性预计方法、可靠性预计方法典型可靠性模型分类典型可靠性模型分类串联模型串联模型定义 组成系统的所有单元中任一单元的故障都会导致整个系统故障的称为串联系统。串联系统是最常用和最简单的模型之一。串联系统的逻辑图如下图所示:串联系统数学模型串联系统数学模型串联系统数学模型串联系统数学模型o当各单元的寿命分布均为指数分布时,系统的寿命也服从指数分布,系统的故障率为单元的故障率之和:o系统的平均故障间隔时间:在设计时,为提高串联系统的可靠性,可从下列三方面考虑:(a)尽可能减少串联单元数目(b)提高单元可靠性,降低其故障率(c)缩短工作时间并联模型并联模型并联模型组成系统的所有单元都发生故障时,系统才发生故障的称为并联系统。并联系统是最简单的冗余系统(有贮备模型)并联系统的逻辑图如图所示,其数学模型为某元件可靠性为0.95,求下列系统的可靠性?求下列系统的可靠性?0.950.90.90.90.9