浅谈根据网管平台延伸产品设备.doc
,浅谈基于网管平台延伸产品1 概述1.1 引言目前传输网络的维护依靠设备告警和客户申告。对性能的采集分析也依赖于人工和维护人员的知识和维护经验。本系统能够自动的采集传输网络的数据和性能报告,并且把设备知识库和维护经验融合到系统中。使系统能够自动的、智能的判断故障的隐患、处理紧急程度并提出处理建议,最终减少维护人员的工作量,提高电路运行质量。1.2 背景根据中国电信集团规范OSS域已经越来越重视大客户及政企客户的服务能力及服务质量分析包括: 支持政企客户的服务质量分析,基于客户完整资源视图的原始数据聚合、整理; 支持端到端的服务质量管理:电信网络端到端、电信业务端到端、客户网络端到端、客户业务端到端; 支持主动和被动模式的服务质量指标获取; 支持政企客户的SLA指标计算模型和报告,SLA【服务水平协议(Service Level Agreement )】报告反馈给客户经理或者客户; 支持政企客户的服务质量改进; 业务变化的快速就绪支持:灵活SLA管理支持,KPI/KQI【关键性能指标(Key Performance Indicators)、服务质量指标(Key Quality Indicators)】分解模型支撑; 支持基于服务质量的网络优化分析。以上的服务质量有相当部分必需与现有的智能网管平台进行交互并取得最新的障碍信息及定位受影响的目标用户。急时提供解决方案并主动发起用目标用户的通知。传输网是通信网络中的基础网络,维护好传输网络对于保证整体通信网络的安全稳定运行具有十分重要的意义。传输网的维护现状是:主要依靠设备网管的告警来提示维护人员处理,但是出现告警往往也意味着业务已经受到影响。很多的设备故障往往在事先就有很多征兆,比如“性能报告异常”、“出现异常事件信息”、“光功率异常波动”等等。这些征兆都可以通过查看设备性能报告、异常事件信息分析等等手段来进行预判。这些性能报告和异常事件都需要在网管进行人工的点击查看,目前在网设备厂家的网管大都没有自动采集性能报告和异常事件汇总分析的功能,个别能够采集数据的网管也不能对性能参数进行智能分析,更不能进行预警。查看性能报告需要逐个点击网元和机盘面板,逐个的看各种性能报告和异常事件情况。但是随着通讯运营企业的转型,设备数量越来越多,维护人员不断精简,维护人员没有精力每天逐个的检查设备的性能报告和异常事件。而且性能报告和异常事件的综合分析,依赖于维护人员的个人知识水平和经验累积,容易遗漏且没有统一的标准。为提高传输维护人员的劳动效率,有效做好主动性维护工作,预先发现传输网络设备隐患,不断提升工作效率。为本项目提供了生存的土壤。通过专业网管的接口,自动收集各厂家传输设备运行状态的性能数据,融入了设备知识库和维护经验模型,进行智能分析和判断。能在当前维护人力有限的条件下最大限度的在性能劣化初期就发现设备隐患,做到事前防范,避免故障发生从而提高用户的满意度和网络忠诚度,打造平安网络、提升大客户、政企客户服务能力。自动采集设备和性能数据,把维护人员从大量重复劳动中解放出来,提高工作效率。以华为光传输设备为例,如果由人工完成,收取和初步整理100个网元性能报告的时间为4小时,进一步分析需要2小时。完成全网的性能分析至少要2天时间。如果专业网管不具备导出功能,花费的时间要以10倍计算。系统完成后,可以每天完成一遍全网的性能报告的采集和分析,节约大量人工、提高网络运行质量。2 产品主要内容2.1 系统功能2.1.1 设备数据采集(传输设备、光设备)通过专业网管的接口,对设备性能数据进行分类采集和归纳到数据库中,并对海量数据进行优化。计划采集的参数类型如下:网元类型端口类型参数WDMWDM 群路发光功率制冷电流信道中心波长偏移OCH 收光功率偏置电流信道信噪比OCU 单波工作温度信道中心波长设备温度MSTPSTM-1背景块误码误码块误码秒误码率STM-4不可用秒严重误码秒连续严重误码秒FEC纠正字节计数FEC不能纠正的帧计数STM-16CRC校验错指针调整计数保护倒换计数工作温度输入光功率输出光功率STM-64激光器偏置电流表 21-12.1.2 设备性能分析对采集到的设备数据进行智能分析,具体分析方式和原理,请见下文“实现原理”。2.1.3 查询和报表方便的查询和定期报表功能。可以对系统数据库中的所以数据进行查询,提供符合查询要求的报表。并且可以打印和另存为EXCEL或者其它文本文件。按照维护人员预先设定的要求,提供定期的报表。有日报、月报、季报和年报。报表的格式是开放的,可编辑、可修正的。2.1.4 系统配置管理用户管理、数据管理、日志管理。2.1.5 性能监控3 产品架构3.1 产品网络架构3.2 系统软件架构3.3 功能描述4 运行过程描述如下Error! Reference source not found.所示,每天凌晨开始,通过传输网管自动采集前一天的24小时性能报告。通过分析网元的24小时性能报告和当前告警,形成传输网络运行质量报告。监测的性能参数包括:FEC、再生段B1、CRC校验、指针调整计数、光接口的发送光功率、接收光功率、激光器工作温度、偏置电流、设备温度等等。4.1 接口通过输网管的接口,自动读取网元数据。传输网层面的EMS网管平台主要有:华为T2000和U2000 北向 CORBA 接口。4.2 总体分析处理流程系统第一次启动后,自动取得全网的相关数据,保存到数据库中。系统正常运行期间,每天凌晨开始读取前一天的24小时性能报告、光功率、设备温度和异常信息,并且存入“基础数据库”。然后逐个分析性能报告、光功率、设备温度和异常信息。如果有异常情况就把此情况记录到“异常情况数据库”并在报表中提示。下图就是总体的分析处理流程:4.3 分析流程实例判断参数是否异常,并非简单的门限设置。例如判断“光功率正常”,就有下图所示处理过程: 每天得到的光功率数据和机盘正常的光功率范围(按照机盘种类,事前设定)相比较,如果超出正常范围(例如,收光灵敏度是28dBm,实际收光30dBm),即把数据作为光功率异常记入“异常情况数据库”,并预警。如果在正常范围内,把此数据继续与该端口的正常光功率值进行比较,如果在正常偏差范围(偏差范围可调)内,即表示光功率正常。如果偏差过大,即把数据作为光功率异常记入“异常情况数据库”,并预警。 有些光功率值的变动是正常的,比如光缆路由的变更导致接收光功率变化。所以,预警后也允许维护人员对该端口正常光功率值进行再调整,这样预警就可以解除。基于TOP结构展现的富客户端 (DEMO)支持移动终端(非常适合通讯线路的排查及整理)5 备注特别声明:本文档仅供交流。