《SS005301SDH故障处理与案例分析.ppt》由会员分享,可在线阅读,更多相关《SS005301SDH故障处理与案例分析.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SS005301 SDHSS005301 SDH故障处理与案例故障处理与案例分析分析固网产品课程开发室固网产品课程开发室1引入引入引入引入 本课程通过讲述SDH的逻辑功能块,分析告警产生的机制和流程;通过对故障现象地讨论,总结故障现象及处理步骤。结构上分为4部分:SDH的逻辑功能块及告警流程图常见的告警及性能事件介绍讨论具体的故障现象和处理步骤总结故障定位的基本思路及方法2学习目标学习目标学习目标学习目标1、了解SDH常见告警的产生机制2、掌握故障定位的基本思路3、掌握分析和定位的几种基本方法4、掌握几种常见分类故障的处理方法学习完本课程,您应该能够:学习完本课程,您应该能够:3课程内容课程内
2、容课程内容课程内容第一章第一章 SDH的逻辑功能块的逻辑功能块第二章第二章 常见的告警与性能事件常见的告警与性能事件第三章第三章 故障现象讨论故障现象讨论第四章第四章 故障定位的基本思路故障定位的基本思路4一、SDH的基本逻辑功能块二、SDH的辅助逻辑功能块三、SDH的告警流程图SDH的逻辑功能块5一、一、一、一、SDHSDH逻辑逻辑逻辑逻辑功能块示意图功能块示意图功能块示意图功能块示意图6SPISPISPI同步设备物理接口收方向ABO/E提取线路定时失效RLOS发方向BAE/O变换SPI:同步设备物理接口功能块(AB)7SDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块A、
3、B、C点信号帧结构:8RSTRST收方向BCRLOSC点信号全“1”定帧A1、A2失败ROOF、RLOFC点信号“1”正常解扰处理E1、D1-D3校验B1RS-BBERST:再生段终端功能块(BC)9RSTRST发方向CB写RSOH计算B1加入E1D1-D3加扰STM-N帧RST:再生段终端功能块(BC)10SDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块D点信号帧结构再生段和复用段的区别11MSTMST收方向CD提取APS信令K1、K2(b1-b5)检测K2(b6-b8)110MS-RDI111MS-AISD点信号“1”检测B2不符MS-BBE越限MS-EXC(B2)D点
4、信号“1”MST:复用段终端功能块(CD)12MSTMST发方向DC写MSOHM1MS-REI收MS-BBE时K2110MS-RDI收MS-AIS时MST:复用段终端功能块(CD)13MSPMSP与与与与MSAMSAMSP:复用段保护功能块(DE)进行复用段保护倒换的启动条件RLOS、RLOF、MS-AISMSA:复用段适配功能块(EF)发方向FE写指针AU-PTR字节间插NAU-4AUG14MSA:复用段适配功能块(EF)收方向EF消间插AUGNAU-4解读指针AU-PTRH1H2H3全“1”AU-AISF点信号全“1”无效指针8个NDFAU-LOPF“1”MSAMSA15SDHSDH基本逻
5、辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块F点信号帧结构:VC412619C412609G点信号帧结构:16HPC:高阶通道连接功能块(FF)对VC4的交叉矩阵仅选择路由,不处理信号对应SBS2500设备X16板 HPT:高阶通道终端(FG)HPOH源和宿对高阶VC4进行实时监控发方向GF写HPOHG1HP-REI收HP-BBE时G1HP-RDI收HP-TIM、HP-SLMHP-UNEQHPCHPC与与与与HPTHPT17收方向FG检测B3不符HP-BBE检测J1失配HP-TIMG点全“1”检测C2失配HP-SLM00H HP-UNEQG点全“1”H4传给HPAHPT:高阶通道终端(F
6、G)HPTHPT18收方向GH消间插C4TU12处理指针TU-PTR、TU12VC12V1V2V3“1”TU-AISH点全“1”无效指针TU-LOPH点全“1”HPA:高阶通道适配功能块(GH)HPAHPA19HPAHPA发方向HG写指针TU-PTR、VC12TU12字节间插TU12C4HPA:高阶通道适配功能块(GH)20SDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块H点信号帧结构I点信号帧结构21SDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块LPC:低阶通道连接功能块对VC12、VC3的交叉矩阵仅选择路由,不处理信号对应SBS2500设备TXC板
7、 LPT:低阶通道终端LPOH源和宿对低阶VC12进行实时监控22LPT收方向HI检测V5LP-BBELP-TIM、LP-SLM,LP-UNEQ发方向IH写LPOH收LP-BBELP-REI收LP-TIM、SLMLP-RDILPT:低阶通道 终端(HI)SDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块23LPA:低阶通道适配功能块(IJ)包封/拆包封:PDHCPPI:PDH物理接口功能块(JK)设备与PDH线路接口提取PDH支路定时信号码型变换:NRZHDB3、NRZCMISDHSDH基本逻辑功能块基本逻辑功能块基本逻辑功能块基本逻辑功能块24SEMF:同步设备管理功能块本
8、设备各功能块的监控其他设备间OAM信息互通MCF:消息通信功能块提供网管f&Q接口提供D1-D3、D4-D12接口(P、N)SETS:同步设备定时源提供本地时钟4种时钟源输出本地时钟OHA:开销接入功能块公务开销的接入:E1、E2、F1二、二、二、二、SDHSDH辅助逻辑功能块辅助逻辑功能块辅助逻辑功能块辅助逻辑功能块25三、三、三、三、SDHSDH告警流程图告警流程图告警流程图告警流程图26课程内容课程内容课程内容课程内容第一章第一章 SDH的逻辑功能块的逻辑功能块第二章第二章 常见的告警与性能事件常见的告警与性能事件第三章第三章 故障现象讨论故障现象讨论第四章第四章 故障定位的基本思路故障
9、定位的基本思路27常见常见常见常见告警及性能事件告警及性能事件告警及性能事件告警及性能事件一、什么是SDH告警二、SDH告警的分类三、SDH常见性能事件的分类28一、什么一、什么一、什么一、什么是是是是SDHSDH告警告警告警告警SDH告警的定义网元产生网元指示灯或网管指示SDH告警的特点原发告警、伴随告警告警的速率标志29二、二、二、二、SDHSDH告警的分类告警的分类告警的分类告警的分类输入信号丢失(LOS)帧定位丢失告警(LOF)连续4帧A1A2错误OOF帧失步指示OOF超过3msLOF告警30二、二、二、二、SDHSDH告警的分类告警的分类告警的分类告警的分类上游故障告警(AIS)指针
10、丢失(LOP)连续8帧无合法的指针值过误码(EXC BER)误码率BER 1*10-331二、二、二、二、SDHSDH告警的分类告警的分类告警的分类告警的分类B1,B2,B3误码(ERROR)B1的作用是再生段误码监视B2的作用是复用段误码监视B3的作用是高阶通道误码监视32二、二、二、二、SDHSDH告警的分类告警的分类告警的分类告警的分类远端误码指示(REI)MS-REI、HP-REI、LP-REI远端缺陷指示(RDI)MS-RDI、HP-RDI、LP-RDI33二、二、二、二、SDHSDH告警的分类告警的分类告警的分类告警的分类通道接入点标识不匹配(TIM)J0(复用段)、J1(高阶通道
11、)、J2(低阶通道)负荷标签不匹配(PLM)C2(高阶通道)、V5(低阶通道)34三、三、三、三、SDHSDH常见性能事件的分类常见性能事件的分类常见性能事件的分类常见性能事件的分类误码秒(ES)、严重误码秒(SES)、不可用秒(UAS)ES表示传输过程中至少有一个误码的秒 SES表示误码率 10-3的秒UAS的开始是连续出现10个SESUAS的结束是连续出现10个非SES35三、三、三、三、SDHSDH常见性能事件的分类常见性能事件的分类常见性能事件的分类常见性能事件的分类背景误码块(BBE)BBE表示同一块中的任意比特发生差错的块 指针调整统计(PJC)帧失步(OOF)保护倒换(PS)36
12、课程内容课程内容课程内容课程内容第一章第一章 SDH的逻辑功能块的逻辑功能块第二章第二章 常见的告警与性能事件常见的告警与性能事件第三章第三章 故障现象讨论故障现象讨论第四章第四章 故障定位的基本思路故障定位的基本思路37讨论讨论讨论讨论故障现象与处理步骤故障现象与处理步骤故障现象与处理步骤故障现象与处理步骤一、故障现象讨论二、故障的分类与处理步骤38一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论业务中断的原因?外部原因人为原因设备本身故障供电电源故障,如设备掉电、供电电压过低等交换机故障光纤、电缆故障。如光纤性能劣化、损耗过高,或光纤损断;中继电缆脱落、损断或接触不良等
13、误操作设置了光路或支路通道的环回误操作更改、删除配置数据单板失效或性能不好39一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论传输误码的原因?外部原因设备故障光纤性能劣化、损耗过高光纤接头不清洁或连接器不正确设备接地不好设备附近有强烈干扰源设备散射不好、工作温度过高线路板接收侧信号衰减过大、对端发送电路有故障、本端接收电路故障时钟同步性能不好交叉板与线路板、支路板配合不好支路板故障风扇故障单板失效或性能不好40一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论业务丢失的原因?人为原因业务开通后,未对数据做备份静态库SDB闪存库(FDB0、FDB1)多网管操
14、作的结果41一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论公务电话故障的原因?外部原因人为原因设备本身故障光纤断会导致正在通话的公务电话单通公务配置数据错,包括“允许通话逻辑系统”、“呼叫等待时长”、“电话号码”等支持公务电话的单板失效或性能不好42一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论出现大量指针调整的原因?外部原因人为原因设备本身故障光纤接反,出现两个网元间时钟互锁的情况时钟源配置错误,出现同一个网中有两个时钟源的情况时钟源配置错误,出现两个网元间时钟互跟的情况线路板故障,提取时钟质量不好时钟板故障,提供的时钟源质量不好交叉板故障,给各单
15、板分配的工作时钟质量不好43一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论网关网元登陆不上的原因?外部原因人为原因设备本身故障网线选择错误或者网管台的网卡坏ID或IP地址设置 错误SCB板故障,无法PING通或者无法登陆软件版本不匹配,主机版本较网管版本新44一、故障现象讨论一、故障现象讨论一、故障现象讨论一、故障现象讨论讨论非网关网元登陆不上的原因?外部原因人为原因设备本身故障光纤故障,如光纤性能劣化、损耗过高,或光纤断供电电源故障,如设备掉电、供电电压过低等ID设置 错误网管中网管网元删除再恢复,非网管网元的网管属性丢失SCC板故障光板故障网元有大量的性能数据上报到网
16、管45二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤业务中断类故障处理常用方法告警分析法逐段环回法互换、替换法处理步骤检查各站登录是否正常,各站光路上是否有紧急告警。检查业务中断站点支路板上业务通道,是否有T-ALOS告警。逐段环回46二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤误码类故障处理常用方法告警、性能分析法逐段环回法互换、替换法处理步骤根据告警及性能,分析是线路上还是支路上的误码?通过逐段环回法定位误码产生的位置。根据定位的信息做排除或替换处理47二、故障的分类与处理步骤二、故障的分
17、类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤指针调整的问题处理常用方法性能分析法更改配置法互换、替换法处理步骤排除光纤接反可能。只有在通道环的情况下,才可能发生光纤接反的情况。其它组网下,光纤接反将导致业务中断。检查配置,排除配置错误的可能。分析指针调整性能事件,并通过更改时钟源位置以及时钟跟踪方向等方法,定位故障点。48二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤二、故障的分类与处理步骤ECC的问题处理常用方法告警性能数据分析法替换法处理步骤排除外部因素,如掉电、光纤折断、光纤性能劣化等将故障定位到单站或两个站之间。对于ECC问题,逐段自环不能定位
18、故障;一般根据从哪一站开始不能登录来判断故障位置。检查SCC板。检查光板。49课程内容课程内容课程内容课程内容第一章第一章 SDH的逻辑功能块的逻辑功能块第二章第二章 常见的告警与性能事件常见的告警与性能事件第三章第三章 故障现象讨论故障现象讨论第四章第四章 故障定位的基本思路故障定位的基本思路50故障定位故障定位故障定位故障定位的基本思路及方法的基本思路及方法的基本思路及方法的基本思路及方法一、故障定位的原则二、故障定位的基本方法三、总结51故障定位的关键“将故障点准确地定位到单站网元”一、故障定位的原则一、故障定位的原则一、故障定位的原则一、故障定位的原则一、故障定位的原则一、故障定位的原
19、则52一、故障定位的原则一、故障定位的原则一、故障定位的原则一、故障定位的原则 故障定位的原则“先外部,后传输”“先单站,后单板”“先线路,后支路”“先高级,后低级”53二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 故障定位的基本方法“一分析,二环回,三换板”一.当故障发生时,首先通过对告警事件、性能 事件、业务流向的分析,初步判断故障点范围;二.通过逐段环回,排除外部故障,并最终将故障 定位到单站,乃至单板;三.通过换板,排除故障问题54二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 故障定位的其它方法更改
20、配置法仪表测试法经验处理法55二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 告警、性能分析法通过网管获得的告警及性能指标全面、详实设备上的指示灯也可显示告警信息56二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 环回法(硬件环回、软件环回)定位故障最有效、最常用的方法支持软件环回的单板操作工具软件环回操作类型环回级别应用线路板(155H不支持)网管、命令行内环回、外环回按VC4通道级别或整个STM-N信号环回将故障定位到单站,且可初步判断线路板是否存在故障支路板网管、命令行内环回、外环回按通道环回可分离交换机
21、故障还是传输故障,且可初步判断支路板是否存在故障。交叉板网管、命令行线路环回、支路环回按业务通道环回可定位单站故障中,是线路侧故障还是支路侧故障。57二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 逐段环回,定位故障点根据不同的组网进行定位链型是双向无保护业务环型是单向通道保护业务环带链则是环和链两种业务的结合321e1:17 w1:17w1:17e1:17t2:1t1:158二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 采用环回法应注意的问题:软件环回是一种不彻底的环回,只能初步定位故障的位置。对远端站点线
22、路板第一个VC4作环回操作时,一定要确认环回后ECC通信不会中断,才可进行操作。一旦远端站点的ECC通信中断,则只能到远端站点现场才能解开环回,恢复ECC通信。“环回法”会导致正常业务的暂时中断,一般只有在出现业务中断等重大事故时,才使用环回法进行故障排除。59二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 替换法“替换法”适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;当故障定位到单站后,用于排除单站内单板或模块的问题。60二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 更改配置法“更改配
23、置法”所更改的配置内容可以包括:时隙配置、板位配置、单板参数配置等。“更改配置法”适用于故障定位到单站后,排除由于配置错误导致的故障。该方法适用于没有备板的情况下,初步定位故障类型,并暂时排除故障,恢复业务。61二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 仪表测试法“仪表测试法”一般用于排除传输外部设备问题以及与其它设备的对接问题。“仪表测试法”分析定位故障,说服力比较强。常见的仪表有:光功率计、误码仪、万用表等62二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法二、故障定位的基本方法 经验处理法在一些特殊的情况下通过复位单板、单站掉电重启、重新下发配置或将业务倒到备用通道等手段可有效及时的排除故障、恢复业务。建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。63三、总结三、总结三、总结三、总结 故障定位的基本思路与方法故障定位过程常用方法其它方法1.排除外部设备故障替换法、测试法、环回法告警性能分析法2.故障定位到单站环回法告警性能分析法3.故障定位到单板并最终排除替换法告警性能分析法、环回法、更改配置法、经验处理法6465
限制150内