[精选]某机房设备故障处理培训课件.pptx
《[精选]某机房设备故障处理培训课件.pptx》由会员分享,可在线阅读,更多相关《[精选]某机房设备故障处理培训课件.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、机房设备机房设备故障处理故障处理目标目标学习完此课程,您将会:学习完此课程,您将会:了解某公司设备分类了解故障处理流程和方法 熟悉故障信息搜集了解典型故障处理案例集第第第第1 1章章章章 某公司机房及设备分类某公司机房及设备分类某公司机房及设备分类某公司机房及设备分类第第第第2 2章章章章 故障故障故障故障处处理流程和方法理流程和方法理流程和方法理流程和方法第第第第3 3章章章章 PONPON宽带业务宽带业务故障故障故障故障处处理理理理第第第第4 4章章章章 语语音音音音业务业务故障故障故障故障处处理理理理某公司某公司机房分类机房分类A类机房:类机房:B类机房:类机房:C类机房:类机房:。某公
2、司某公司机房常见设备机房常见设备一、接入设备:语音接入;宽带接入一、接入设备:语音接入;宽带接入二、传输设备:二、传输设备:SDH、PDH、光电转换器、光电转换器三、接入交换机:三层交换机、二层交换机、路由器三、接入交换机:三层交换机、二层交换机、路由器四、交换设备:程控交换机、软交换四、交换设备:程控交换机、软交换五、配线架:五、配线架:ODF、DDF。第第第第1 1章章章章 某公司机房某公司机房某公司机房某公司机房及设备分类及设备分类及设备分类及设备分类第第第第2 2章章章章 故障故障故障故障处处理流程和方法理流程和方法理流程和方法理流程和方法第第第第3 3章章章章 PONPON宽带业务宽
3、带业务故障故障故障故障处处理理理理第第第第4 4章章章章 语语音音音音业务业务故障故障故障故障处处理理理理故障处理流程和方法故障信息来源故障信息来源故障处理流程故障处理流程故障处理常用方法故障处理常用方法一、故障信息来源u用户或客户效劳中心的故障申告电子工单。用户或客户效劳中心的故障申告电子工单。u日常维护或巡检中所发现的异常。日常维护或巡检中所发现的异常。u网管告警系统的告警输出中心机房。网管告警系统的告警输出中心机房。u对接设备维护人员的故障通告外线,各分公司申告。对接设备维护人员的故障通告外线,各分公司申告。二、故障处理流程二、故障处理流程开始收集并记录相关信息能否判断故障范围和 类别确
4、定故障范围和类别是否为紧急 故障 定位故障原因 屏蔽隔离故障 排除故障故障是否被排除?记录故障处理过程及结果联系厂家技术支持人员否是否应急维护处理是故障处理流程故障处理流程1、收集并记录故障信息、收集并记录故障信息在故障处理的初期收集各种相关信息,可以帮助定位故障原因,提高维护人员处在故障处理的初期收集各种相关信息,可以帮助定位故障原因,提高维护人员处理故障的效率。理故障的效率。2、确定故障范围和类别、确定故障范围和类别在获取故障信息以后,需要对故障现象进行分析,确定故障的范围和类别。在获取故障信息以后,需要对故障现象进行分析,确定故障的范围和类别。3、定位故障原因、定位故障原因故障定位就是从
5、众多可能原因中找出具体原因的过程。维护工程师使用各种方法故障定位就是从众多可能原因中找出具体原因的过程。维护工程师使用各种方法分析、比较各种可能的故障原因,排除不可能的原因,最终确定故障发生的具体分析、比较各种可能的故障原因,排除不可能的原因,最终确定故障发生的具体原因。原因。故障处理流程故障处理流程4、屏蔽、屏蔽/隔离故障隔离故障正确定位故障原因后,对故障进行屏蔽或隔离来恢复业务或防止故障范围扩大。正确定位故障原因后,对故障进行屏蔽或隔离来恢复业务或防止故障范围扩大。5、排除故障、排除故障排除故障是指采取适当的措施去除故障、恢复设备正常运行的过程,如检修线路、排除故障是指采取适当的措施去除故
6、障、恢复设备正常运行的过程,如检修线路、更换部件、修改配置数据、复位单板等。判断是否需要到现场,更换部件、修改配置数据、复位单板等。判断是否需要到现场,6、确认故障处理结果、确认故障处理结果在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进行验证测试,来确认故障现象是否消失。行验证测试,来确认故障现象是否消失。7、联系技术支持、联系技术支持如果在故障处理过程中遇到难以解决的问题,需要联系技术支持进行处理。如果在故障处理过程中遇到难以解决的问题,需要联系技术支持进行处理。收集并记录故障信息收集并记录故障信息
7、信息收集的内容信息收集的内容故障发生时,需要第一时间收集故障信息。主要收集以下故障信息:u故障发生的具体时间、地点。u故障现象的详细描述。u故障点设备类型及接入类型。u故障后已采取的措施和结果。u问题的级别及希望解决的时间。u用户及电信联系人信息。确定故障范围和类别确定故障范围和类别确定故障的范围确定故障的范围确定故障的范围就是确定故障处理的方向,也就是说在什么地方、顺着什么思路去查找故障的具体原因。确定是设备接入的所有用户出现故障还是局部用户出现故障:u如果是所有用户出现故障,进一步了解上端设备接入的其他设备或用户是否同时出现故障。u如果是局部用户出现故障,进一步了解:故障用户的业务类型,其
8、他业务是否出现故障。故障用户与正常用户的业务单板是否相同。定位故障原因定位故障原因 故障定位就是从众多可能原因中找出具体原因的过程。维护工程师使用各种方法分析、比较各种可能的故障原因,排除不可能的原因,最终确定故障发生的具体原因。准确并快速的定位故障是故障处理过程中的重要环节:u有利于提高故障处理的效率。u有效防止盲目处理导致的故障扩大等人为事故。u为排除故障提供指导和参考。屏蔽屏蔽/隔离故障隔离故障正确定位故障原因后,对故障进行屏蔽或隔离来恢复业务或防止故障范围扩大。常用的故障屏蔽或隔离的方法有:u手动重启系统。u进行主备倒换。u采用迂回路由,隔离故障设备。u如果是某项功能故障,可以使用命令
9、关闭该功能。u如果是单个用户业务故障,可以将故障影响的用户转移到正常的端口。排除故障排除故障排除故障是指采取适当的措施去除故障、恢复设备正常运行的过程,如检修线路、更换部件、修改配置数据、复位单板等。屏蔽或隔离故障后,启动排除故障的工作。确认故障处理结果确认故障处理结果在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进行验证测试,来确认故障现象是否消失。要进行全面验证,保证故障现象完全消失且没有新的问题被引入。三、故障处理常用方法三、故障处理常用方法告警分析告警分析性能分析性能分析分段处理分段处理仪表测试仪表测试比照分析比照分析互换分析互换分析配置数据分析配置数据分析协议分
10、析协议分析告警分析告警分析通过分析告警,可以定位故障的具体部位或原因,也可以配合其他方法定位故障原因。告警信息是指设备网管告警系统输出的信息,通常以屏幕输出的形式提供给维护人员,具有简单、明了的特点。告警信息涉及硬件、链路、业务等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。告警信息包含以下内容:u告警的描述 u告警发生的位置 u告警发生的可能原因 u告警的修复建议 性能分析性能分析通过设备提供的性能统计手段,对发生故障的业务进行性能指标的分析,定位故障原因。多种故障的定位过程中都需要了解系统性能统计信息。针对不同的故障类别,需要查看不同的统计信息,这要求维护人员:u熟悉系统的结
11、构和运行机制。u了解系统能够提供哪些统计信息。u了解如何查看、分析统计信息 分段处理分段处理在故障现象复杂,可能涉及到多个环节时,使用分段处理的方法逐个排除正常的环节,最终定位故障。对进行分段处理工作的工程师有以下要求:u对设备的系统结构和原理有深入的了解。u对可能导致业务故障的各个环节全面了解。u熟练掌握环回操作。u熟练使用测试仪器。仪表测试仪表测试仪表测试法是指使用各种仪器、仪表取得实际的各种性能参数,对照理论的参数值来定位和排除故障。仪器、仪表以直观、量化的数据直接反映设备运行状态,在故障处理过程中有着不可替代的作用。常用的仪器、仪表包括:u万用表 u光功率计 u示波器 u可调光衰减器
12、u线路测试仪 比照分析比照分析比照分析是指将故障的部件或现象与正常的部件或现象进行比较分析,通过找出不同点来定位故障。比照分析适用于故障单一的场合。互换分析互换分析在更换备件后仍不能定位故障时,使用互换分析法定位和排除故障。互换是指将处于正常状态的部件如单板、光纤等与可能故障的部件对调,在以下情况下使用:u在更换备件后,仍然不能确定故障的范围或故障点时使用。u通过比较对调后二者运行状况的变化,确定故障的范围或故障点。u适用于故障复杂的场合。配置数据分析配置数据分析配置数据分析是指通过分析设备的配置数据来定位问题,在新开局点或更改配置后应推荐使用此分析方法。数据配置错误或更改是引起故障的重要原因
13、之一,配置数据分析是故障定位不可缺少的一个方法。例如:一台MA5680T下所有用户无法收看组播节目,通过检查配置数据发现:组播源设置的TTL值太小,导致组播数据在MA5680T上转发时,由于TTL值等于0而被丢弃。协议分析协议分析一般用不到一般用不到协议分析是指通过信令跟踪、捕获数据包等手段对故障进行分析的方法。协议分析用于当接入设备和上层设备的对接出现问题时定位和排除故障。协议分析要求维护工程师对协议有深入的了解,掌握各种协议报文的交互流程,从而能够从获得的报文中定位故障。小结小结本章主要介绍了本章主要介绍了故障处理的一般步骤和常用方法小结小结小结小结第第第第1 1章章章章 某公司机房及设备
14、分类某公司机房及设备分类某公司机房及设备分类某公司机房及设备分类第第第第2 2章章章章 故障故障故障故障处处理流程和方法理流程和方法理流程和方法理流程和方法第第第第3 3章章章章 PONPON宽带业务宽带业务故障故障故障故障处处理理理理第第第第4 4章章章章 语语音音音音业务业务故障故障故障故障处处理理理理故障处理流程故障处理流程开始初步定位故障位置检查光纤状况检查设备状态检查设备运行状况检查设备数据配置检查设备统计信息检查上层设备状态结束初步定位故障位置初步定位故障位置个别端口用户无法上网:u用户终端或者线路故障。uEPON或交换机端口故障。u数据配置问题。整板用户无法上网uEPON单板故障
15、。u光路问题。整框用户无法上网u光路问题。u主控板或者是上行单板故障。u网络攻击。BRAS设备下的所有用户无法上网u上行设备问题。检查光纤状况检查光纤状况在EPON业务发生故障时,通过检查光纤状况排除故障。主要检查:u光纤是否插好。u光纤是否弯曲严重。u光纤是否有断线。u平均发送光功率是否正常。u接收光灵敏度是否正常。检查检查ONT状态状态Power主电源指示灯u常亮说明电源供电正常。熄灭u请检查电源连接是否正确。u请检查电源适配器是否匹配。u如果电源正常,所有指示灯都熄灭,请更换ONT。检查检查ONT状态状态AUTHEPON注册指示灯u常亮设备认证成功。熄灭设备认证失败。u检查MA5680T
16、上是否添加了该ONT。u检查配置的ONT的MAC地址与ONT实际MAC地址是否一致。LINK EPON链路指示灯u亮PON端口链路状态正常。u熄灭检查光纤是否插好插得太紧或太松都会有问题。检查检查ONT状态状态LAN常亮以太网端口的链路正常。熄灭以太网端口的链路故障。u检查以太网端口的物理连接是否正常。u检查与以太网端口连接的物理设备是否正常。在线查询在线查询ONT状态状态如果“Control Flag为激活态,且“Run state为up,说明ONT正常,说明用户上线且认证通过。如果“Control Flag为去激活态,ONT进行注册时被禁止,需要在EPON模式下使用ont activate
17、命令激活控制开关。如果“Control Flag为激活态,而“Run State为down,则说明用户未上线。如果ONT的“MAC与实际的ONT不一致,会导致注册失败。如果“Config State为“Normal状态,说明ONT配置恢复状态正常。如果“Config State为“Failed状态,说明ONT配置恢复失败。有可能是ONT绑定了错误的ONT模板,并对ONT进行了不支持的配置。可使用display ont capability命令查询ONT的实际能力,并重新绑定相匹配的模板。如果“Match State为“Mathch状态,说明ONT配置的能力集模板匹配。如果“Match Stat
18、e为“initial状态,说明ONT实际能力与能力集模板的配置一致时,进入配置恢复阶段的“初始态。如果“Match State为“mismatch状态,说明ONT配置的能力集模板匹配失败。检查设备运行状态检查设备运行状态操作步骤操作步骤1、检查主控板的运行灯状态。正常情况下:RUN ALM绿灯1s亮1s灭,周期闪烁,ACT灯常亮。如果出现异常,请检查主控板是否接触良好。2、检查业务板的运行灯状态。正常情况下:RUN ALM绿灯1s亮1s灭,周期闪烁。如果出现异常,请检查业务板是否接触良好。3、检查PON接口灯状态。正常情况下:ONT在线时,PON接口的绿灯常亮。如果出现PON口灯不亮,请检查光
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精选 机房设备 故障 处理 培训 课件
限制150内