MSTP设备故障定位培训.ppt
《MSTP设备故障定位培训.ppt》由会员分享,可在线阅读,更多相关《MSTP设备故障定位培训.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、MSTP设备故障定位培训设备故障定位培训烽火通信系统设备制造部烽火通信系统设备制造部2 2故障定位的基本原则故障定位的基本原则一旦SDH光传输设备出现故障,就要求维护人员迅速判断故障的性质、位置,以便修复故障。故障处理中,第一步而且最关键的一步就是将故障点准确定位,然后才是采取的措施。故障处理首先要求判断是线路故障还是设备故障。如果是线路故障,则要求判断出是哪一根纤,然后通知线路维护人员进行修复;如果是设备故障,就需要判断出故障出在哪一站、哪一架、哪一块机盘或是哪一个连接点或连线,以便及时修复。由于传输设备自身的应用特点,即各站之间的距离较远,因此将故障准确定位是极其重要和关键的,将故障准确定
2、位后,就可以采取相应的措施排除故障。在准确定位之前,想当然的做法往往是比较危险的,不仅会延误故障的解决,而且还可能造成更严重的人为故障。3 3故障定位的基本原则故障定位的基本原则SDH设备出现故障,首先应对故障进行定位,才能准确、快速的恢复业务,而故障的定位主要依赖于网管,定位的主要原则是:先外部,后传输:先外部,后传输:在定位故障时,应先排除外部的可能因素,如光纤断、电缆或电源问题。先单站,后单盘:先单站,后单盘:在定位故障时,要尽可能准确地将故障定位到单站。先群路,后支路:先群路,后支路:光群路盘的故障常常会引起支路盘的异常告警。先高级,后低级:先高级,后低级:在分析告警时,应首先分析告警
3、级别高的告警,如紧急告警,然后在分析非紧急告警。根据SDH的层次结构特点,首先判断故障属于物理层、再生段、复用段还是通道层。然后,根据各层在系统中的对应位置或作用范围,定位到单站或单盘。4 4故障定位的基本原则故障定位的基本原则根据路由和时隙查找故障点。分析交叉的时隙规则,看看故障是否发生在设备的东向还是西向、某一个接口盘、某一个单盘的某一个VC4时隙。根据系统特点查找故障点。因主备交叉时钟盘到每一个单盘都有独立的连接,主备XCU盘连接高阶交叉到每一个高阶接口都是独立的双向连接线。再生段、复用段、通道故障及性能之间的相互影响关系如下图:5 5故障判断与定位的常用方法故障判断与定位的常用方法故障
4、处理的关键在于故障定位。故障定位的常用方法有:告警性能分析法,网管及配置数据分析法、环回法,替换法、仪表测试法、经验处理法等。下面将介绍这些故障定位方法。(1)告警性能分析法告警性能分析法通过网管获取告警和性能信息,进行故障定位。可以全面地、详实地了解全网设备的当前或历史告警信息;也可通过机柜顶部指示灯和单板告警指示灯来获取告警信息,进行故障定位。一般告警灯常有红、黄、绿三种颜色,红色表示紧急告警及重要告警,黄色表示次要告警及一般告警,绿色表示系统正常运行(在正常运行时绿色灯是不亮的,若有打公务电话时才会亮绿灯)。6 6故障判断与定位的常用方法故障判断与定位的常用方法用网管对设备进行监控,可以
5、看到很多细节性的信息,包括告警和性能,并能对全网络有一个整体的观察。这对于告警分析、定位是极有利的。但又面临告警、性能信息太多,无从着手分析的局面。SDH告警的内容繁多,告警优先级也不能一概而论,一般遵从以下一些原则:按级别来划分,SDH告警的优先级顺序为:紧急告警主要告警次要告警提示告警。按SDH层次来划分,SDH告警的优先级顺序为:再生段告警复用段告警高阶通道告警低阶通道告警。按告警种类来划分,SDH设备的告警优先级顺序为:通信告警电源告警时钟硬件告警传输告警。7 7故障判断与定位的常用方法故障判断与定位的常用方法告警性能分析法首先要求维护者对SDH原理和硬件系统熟悉,对告警信号流程图较熟
6、悉,从而知道各种告警的互相产生、依存关系。只有这样才能由众多的告警信号中找出哪些是基本告警信号,即高级别告警信号,哪些是由此衍生出来的告警信号,即低级别告警信号。通过网管系统获取告警、性能信息进行故障定位利用网管系统采集到的告警具有内容丰富、描述精细的特点,是测试人员用来分析、定位故障的最为主要的依据。维护人员可以通过网管计算机查询设备的详细数据,比如查询全网设备、或任意网元、或任意机盘的当前告警、历史告警、当前性能、历史性能,通过对这些告警量和性能量的分析,可以较为精确地定位故障点。注意:通过网管系统获取告警或性能信息时应注意保证网络中各网元的当前网元运行时间设置正确,倘若网元时间设置错误将
7、会导致告警性能信息上报错误或根本不上报。8 8故障判断与定位的常用方法故障判断与定位的常用方法通过设备上的指示灯获取告警信息进行故障定位设备上设计有不同颜色的运行指示灯,这些指示灯的亮、灭及闪烁情况,反映出设备当前的运行状况或存在告警的级别。机柜顶上有红、黄、绿三个不同颜色的指示灯,红灯表示设备有紧急告警发生;黄灯表示有非紧急告警发生;而绿灯表示有公务呼叫。设备子架中的每个单盘小面板上有该单盘的运行状态指示灯,每个灯都有自己的含义,从指示灯的显示状况可以判断该盘是否正常运行?发生何级别的告警?通过观察电路板指示灯闪烁情况,可以初步判断故障原因并做相应处理,如下表所示:9 9故障判断与定位的常用
8、方法故障判断与定位的常用方法1010故障判断与定位的常用方法故障判断与定位的常用方法注意:1.设备指示灯仅反映设备当前的运行状态,并只反映该盘所检测到的所有告警中的最高级别的告警,而对于设备曾经出现过但当前已结束的告警或次级别告警均无法表示;2.2.设备中的某种告警可以通过网管设置将其屏蔽掉,这时所对应的指示灯将不能反映设备的真实告警情况。(2)网管及配置数据分析法查询、分析设备当前的配置数据,在网使用的传输网络上增加设备或者增开业务时,检查和修改各项单盘及交叉配置要特别小心,如果稍有疏忽,可能影响新增设备的各项功能,甚至设备的开通,给整个传输网络带来极大的安全隐患。例如:时隙配置、复用段的节
9、点参数、线路板和支路板通道的环回设置、支路通道保护属性等,分析以上的配置数据是否正常,来定位故障。若配置的数据有错误,需进行重新配置。如果确实已经将单盘配置更改,但此时不知道正在使用的正确配置,可以采用重新配置一块该盘(多数情况下正确的配置是默认配置),保存配置或者交叉,再重新分析问题。1111故障判断与定位的常用方法故障判断与定位的常用方法(3)环回法环回法,是SDH传输设备定位故障最常用、最行之有效的一种方法。环回有多种方式,实际工程上环回分为硬件环回和软件环回,软件又分为线路环回和设备环回。进行环回操作时,首先应进行环回业务通道采样,即从多个有故障的站点中选择其中的一个站点,从所选站点的
10、多个有问题的业务通道中选择其中的一个业务通道;然后画出所采样业务的一个方向的路径图,图中要标出该业务的源和宿及所经过的站点、所占用的VC4通道和时隙等;最后逐段环回,定位故障站点及单盘。从环回后信号的流向来划分,分为设备环回和线路环回两种情况。对于进行环回操作的SDH网元,如果执行环回后的信号是流向该SDH网元内部的,则这种操作称之为设备环回;如果环回后的信号是流向该SDH网元外部的,则这种操作称之为线路环回。SDH接口的线路环回和设备环回由网管进行设置。1212故障判断与定位的常用方法故障判断与定位的常用方法线路环回:执行环回后的信号是流向本SDH网元外部。设备环回:执行环回后的信号是流向本
11、SDH内部。注意:1.环回可能会影响到正常的业务,因此建议在业务量小的时候使用,比如夜间。2.光口自环时注意不要使接收过载,一定要在接收端加装衰减器。1313故障判断与定位的常用方法故障判断与定位的常用方法环回法的步骤显然在进行环回操作前首先需确定对哪个通道、哪个时隙环回?应该在哪些位置环回?应该使用哪种环回?是光口环回还是电口环回?是线路环回还是设备环回?这可分四个步骤进行:第一步:环回业务通道采样通过咨询和测试等手段选取其中一个的确有故障的业务通道作为处理分析的对象。我们知道,对于同时出问题的业务一般都具有一定的相关性,因此只要恢复其中的一个业务,其它的业务常常能自动得到恢复;另外采样简化
12、的思路也常常使得故障的分析处理显得更加清晰简单。注:环回业务通道的采样简化:1 从多个有故障的站点中选择其中的一个站点 2 从所选择一站点的多个有问题的业务通道中选择其中一个业务通道;3 对于所选择出来的业务通道先分析其中一个方向的业务。1414故障判断与定位的常用方法故障判断与定位的常用方法第二步:画业务时隙图(或设备各站点间的时隙分配表)第二步:画业务时隙图(或设备各站点间的时隙分配表)画出所选取业务一个方向的时隙图,在时隙图中表示出该业务的源和宿、该业务所经过的站点、该业务所占用的通道和时隙。第三步:逐段环回定位故障站点,最后定位单盘问题第三步:逐段环回定位故障站点,最后定位单盘问题根据
13、所画出的业务时隙图(或时隙分配表)采取逐段、逐站环回的方法,定位出故障站点。故障定位到单站后,通过具体环回进一步定位可能存在故障的单盘,最后结合其它方法确认存在故障的单盘,并通过换盘排除故障。总体来讲在运行的网络中最好采用先近后远,先局部后整体,这样可以避免影响其他站点正在使用的业务,即先环回本站的业务电路,再然后交叉环回,然后到群路环回,最后到整框(包括时钟等),排除整框后到相临站点向本站环回,这样范围逐步扩大到其他站点,找到故障站点,然后再先整体后局部,直到找到故障点机盘。1515故障判断与定位的常用方法故障判断与定位的常用方法(4)替换法替换法替换法适用于排除传输外部设备的问题,如光纤、
14、中继电缆、交换机、供电设备等;或故障定位到单站后,用于排除单站内单盘或模块的问题。“替换法”适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等,或故障定位到单站后,用于排除单站内单盘或模块的问题。例如:怀疑某块光盘有故障,可用工作正常的同类型光盘把它替换,检查故障是否消除。替换法是确定故障最为简捷、有效的方法之一,由于SDH设备机盘种类较多,各种机盘的版本也有较大的区别,在替换单盘的时候,一定要仔细鉴别单盘的规格、型号、版本,确认与被替换的单盘具有互换性。注意:在带电插拔单盘的过程中,有可能由于不当或不慎的操作,导致机盘损坏或其它问题的产生。所以在替换单盘前,应尽可能通过网管系
15、统、环回等方法准确定位故障区间、故障单盘。在插拔单盘时请戴好防静电手镯。1616故障判断与定位的常用方法故障判断与定位的常用方法(5)仪表测试法仪表测试法仪表测试法指采用各种仪表,如误码仪、光功率计、万用表、SDH分析仪等来检查传输故障。仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题。如我们怀疑电源供电电压过高或过低,则可以用万用表进行测试;若怀疑传输设备与其它设备对接不上是由于接地的问题,则可用万用表测量对接通道发端和收端同轴端口屏蔽层之间的电压值,若电压值超过0.5V 则可认为接地有问题;若怀疑传输设备与其它设备对接不上是由于信号不对,则可通过相应的分析仪表观察帧信号是否正
16、常?开销字节是否正常?是否有异常告警等等;若怀疑光接收信号有问题,则可用光功率计检查发送端光功率和接收端光功率,以便判断是光模块问题还是光纤线路问题。仪表测试法分析定位故障准确,说明力较强,但需要仪表。1717故障判断与定位的常用方法故障判断与定位的常用方法(6)经验处理法经验处理法在一些特殊的情况下通过复位单盘、单站的掉电重启、重新下发配置等手段可有效及时的排除故障、恢复业务。但建议此方法应尽量少用,因为该方法不利于故障原因的彻底清查。遇到这种情况,除非情况紧急,一般还应尽量使用上面介绍的方法,或请求支援尽可能地将故障定位出来,以消除设备内外隐患。1818故障排除的方法故障排除的方法1排除传
17、输设备外部故障.:检查光纤、电缆是否接错;光路和网管系统是否正常;设备供电是否正常;排除设备外的故障。(1)检查光纤是否连接正确,可以通过网管配置数据分析法,检查网管单盘配置中J0字节的配置、或在网管上关断激光器检查光盘告警来判断光纤是否接错;如果是链形配置还可以通过拨打架上公务电话来检查光纤是否接错。(2)电缆是否接错或不通可以通过在架上环回和电口近端环回,然后检查交换机或通过其它外围设备是否正常的方法来判断。(3)光路和网管系统是否正常;根据网管配置数据分析法,通过网管上性能上报和告警分析,可检查光路和网管系统是否正常。(4)设备供电是否正常,检查交流停电,设备直流掉电及熔丝故障等。191
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MSTP 设备 故障 定位 培训
限制150内