云网管技术方案(47页).doc
《云网管技术方案(47页).doc》由会员分享,可在线阅读,更多相关《云网管技术方案(47页).doc(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-云网管技术方案-第 46 页XXX客户IT云监控平台项目美信云网管技术方案书北京美信时代科技有限公司二零一三年十二月目 录目 录2第1章 IT监控软件需求分析51.1 监控需求51.2 建设目标51.3 云网管方案优势6第2章 云网管体系架构82.1 云网管设计思想82.1.1 标准化82.1.2 先进性92.1.3 可扩展性92.1.4 高度集成化102.1.5 易用性112.2 云网管技术特点说明122.2.1 网管“云计算”122.2.2 双机热备,永不宕机122.2.3 Agent代理数据采集132.2.4 完善的拓扑管理功能142.2.5 MegaSpeed海量秒级监测142.2.
2、6 可扩展的IT资源管理142.2.7 其他技术特点152.2.8 方便的二次开发管理162.3 云网管子系统功能162.3.1 拓扑管理162.3.1.1 拓自动搜索+VISIO导入拓扑图管理182.3.1.2 机房机架图展示212.3.1.3 应用拓扑展示212.3.1.4 业务系统拓扑展示222.3.2 网络设备监控232.3.2.1 网络设备监测原理232.3.2.2 网络设备可用性232.3.2.3 网络设备性能242.3.2.4 网络设备监测指标242.3.3 服务器监控262.3.3.1 主机运行状况262.3.3.2 服务进程管理272.3.3.3 日志管理272.3.3.4
3、Windows/Linux/Unix服务器监控指标272.3.4 应用系统监控292.3.4.1 WEB系统管理302.3.4.2 Mail系统管理322.3.4.3 OA系统管理332.3.4.4 中间件监控332.3.5 存储设备监控3636372.3.8 数据库系统管理392.3.8.1 应用层面392.3.8.2 系统资源层面392.3.8.3 自身性能指标402.3.9 故障告警管理412.3.9.1 故障告警方式422.3.9.2 报警控制台422.3.9.3 事件关联机制442.3.10 报告报表管理452.3.10.1 实时报表452.3.10.2 趋势报表462.3.10.3
4、 TOPN报表472.3.10.4 分析报表472.3.10.5 故障报表492.3.10.6 流量报表492.3.10.7 URL报表502.3.11 用户权限设计512.3.12 安全管理532.3.12.1 登录系统的验证532.3.12.2 支持多点登录系统532.3.12.3 配置信息本地的加密存储542.3.12.4 账户的安全性542.3.12.5 远程登录的加密54第3章 部署方案543.1 环境要求543.2 部署55附录一:案例截图56第1章 IT云监控平台需求分析1.1 监控需求监控类型有:服务器、中间件、数据库、网络设备、存储等。1.2 建设目标美信科技根据XXX客户I
5、T监控软件的技术需求,提出XXX客户IT监控软件的目标是建设一个能满足集中管理与分级部署相结合的现代化的IT云监控平台,实现端到端的管理,全面保障XXX客户的网络与系统平台的高效稳定运行,帮助运维人员提高工作效率,从而提高IT资产的投资率。美信科技为XXX客户设计的是目前全球最先进的美信科技的“云网管”方案。”云网管”能及时发现及报警网络设备及线路的故障信息,并提供相应的监控视图。通过网络性能的统计分析,实现对网络链路、网络设备的性能参数进行采集记录,并整理分析,从而协助管理员客观真实的了解网络运行,监控各种网络设备实时运行的状态及提供的各种网络服务的质量。提供网络与系统平台的综合故障处理能力
6、,通过自动收集网络设备信息,判断网络故障的类型、向网络技术人员分发网络故障警报、故障记录和监控网络故障处理过程,为网络和系统监控人员提供一套完善的故障监控系统。能够自动收集所有硬件设备的多方面信息,并通过管理中心的可视化图形和动态直观视图让系统管理人员随时随地一目了然地了解整个网络平台的运行状况。同时提供事件关联和根源分析功能,将各种事件联系起来进行分析,以便快速隔离并解决问题,从而降低运营成本,提高网络稳定性。1.3 云网管方案优势云网管是IT管理领域具有划时代意义的产品,是全球首创的、第一套把“云计算”引入网络管理领域的完整解决方案。云网管具备业界众多独一无二的技术特征,首先拥有高度灵活的
7、可伸缩性,除可以监控普通规模数据中心的服务器、应用和网络设备外,更可对大型广域网和大型数据中心的海量设备进行集中监控,监测规模高达几十万台。其次,云网管是一个高度开放的平台,它为用户创造了一种“参与”和“分享”的全新工作体验。使用美信云网管的标准功能,用户可以监控自己的IT系统;通过开放式API,用户可以“参与”自定义监测;登录在线社区,所有的用户可以一起“分享”监测创意。云网管专注对局域网、广域网和互联网上的应用系统、服务器和网络设备的故障监测和性能管理,是集中式、跨平台的综合系统管理软件,可以对网络设备、服务器、中间件、数据库、电子邮件、WEB系统、DNS电子商务等进行全面深入的监测管理。
8、通过开放式的API接口和分布式实施方案,可满足各种规模的企业系统管理的需求。作为业界领先的云监控平台,云网管建设XXX客户IT云监控平台项目具有如下的技术优势:l 针对中国大型网络和系统平台的管理模式和需求;l 完全自主产权,提供源代码级的技术支持;l 为客户提供面向管理和需求的应用定制及开发;l 提供符合中国客户的界面、功能和报表;l 高级的安全特性;l 在开发及网管应用上采用国际先进技术,遵循统一的规范。云网管系统支持全面的AGENT代理、非代理等数据采集方式,将网管系统对信息平台性能可能造成的影响降至最低。自推出以来,由于其卓越的性能、实用易用的设计理念和源代码级的技术支持,很好地满足了
9、广大客户自动化、智能化网络与系统平台监控方面的需求。云网管开发工具采用纯C语言,数据库使用自带专用数据库(也可以集成第三方数据库如SQL Server、ORACLE)。云网管信息平台运营维护系统采用高度模块化设计,支持AGENT代理、非代理、SNMP等多种数据采集方式,同时提供扩展接口,方便用户与其它系统管理软件实现无缝集成。云网管综合网管解决方案将不同功能、不同厂商的网管系统按网络特性定制开发为多级、分布式的统一网络和系统监控平台;同时与运营管理无缝集成,通过各系统之间的接口及接口的定制开发,将网络和系统监控系统、业务管理系统及客户服务系统按运营商的特性组合成为统一的运营管理平台。云网管综合
10、网管解决方案提供全面、综合、集成的综合网管解决方案。云网管是一个采用多种创新技术的新一代系统,提供源代码级的技术支持,可为XXX客户提供面向需求的应用定制及开发。云网管解决方案可用来建立适合XXX客户的分布式网管平台。云网管综合网管系统可以:l 改进服务l 通过有效地将整个XXX客户网络中的信息通过分布式部署、分布管理模式集中到一个独立的协作式系统环境中,云网管可以明显地改进服务质量。l 最大程度地提高工作效率l 提供了友好的界面展示功能和过滤查找功能,让管理人员可以快速找到所需的信息,使管理人员得到最具实效性的关键信息。通过创建个性化的、更具针对性的管理页面,管理人员可以更有效地组织重要信息
11、,实现更准确的定位。l 支持未来的扩容和增长l 云网管引入全球领先的“云计算”技术,从而具有高度的可伸缩性,交互性,可扩展性和平台独立性。l 降低管理成本l 通过集中化管理、有效集成现有系统,大大降低管理成本。经过多年以来的努力,美信云网管监控解决方案,成功地帮助政府、电信运营商、电力、金融、媒体、教育科研机构及大中型企业的关键网络和系统应用。第2章 云网管体系架构2.1 云网管设计思想2.1.1 标准化云网管支持目前业界开放标准协议TCP/IP,SNMP(V1、V2、V3),等标准网络传输、加密和网管协议;云网管采用高度模块化设计,具备良好的扩充性能。提供开放的API接口和十分友好的二次开发
12、界面,能很好地满足个性化系统管理的需求。云网管支持的协议说明如下:l SNMP协议支持SNMP V1,支持管理公有MIB、私有MIB,及其TRAP的接收处理支持SNMP V2c, 支持管理公有MIB、私有MIB,及其TRAP的接收处理支持SNMP V3l 支持各设备厂家自定义的MIB路径l DNS协议通过DNS协议可以从应用层面验证DNS解析是否正确l SYS LOG支持对设备SYS LOG的管理(采集)、统计、分析l TELNET协议支持通过Telnet 协议对网络设备的管理、信息采集l SSH协议支持通过SSH 协议对网络服务器的管理、信息采集l 数据库技术支持多种数据库格式,ORACLE
13、、SQL SERVER、MySQL、DB2、Sybase、Postgresql等l RPC技术支持通过RPC技术对Windows服务器的管理、信息采集l LDAP协议支持通过LDAP协议对认证服务器的监测和管理l SMTP、POP3协议支持SMTP、POP3协议通过对邮件服务器的监测和管理2.1.2 先进性从用户使用的角度来分析,云网管的先进性体现在:l 提供基于“云计算”的部署方式,实现对海量设备的集中监控l 丰富的报表,提供对网络的走势分析,帮助用户预测网络的未来运行状况l 支持自动拓扑和VISIO网络应用拓扑导入等方式,是云网管的特色技术l 支持AGENT代理、非代理、SNMP等多种数据
14、采集模式l 支持分级实施的分布式架构,可以随用户网络规模的扩大而无限扩大2.1.3 可扩展性云网管采用高度模块化设计,系统由数据采集、故障管理、基础配置、用户界面展示和扩展接口等组成,具备良好的扩充性能。提供开放的API接口和十分友好的二次开发界面,能很好地满足个性化系统管理的需求。云网管拥有无与伦比的伸缩性和高扩展性,适用于任何规模的网络,支持在统一网管支撑平台上进行模块开发、加载与功能实现。云网管支持分布式部署,可以随用户网络规模的扩大而无限扩大。云网管的可扩展性表现在分布式架构的扩展、监测器的扩展和集成其它系统三个方面。l 与其它系统的集成云网管系统出于对效率和安全性的考虑,提出了数据库
15、层的系统集成的概念。在运行服务系统中的所有子系统都将数据库保存在数据中心服务器上。通过数据库系统为每一个子系统分配各自的权限,这样,在系统执行效率提高的前提下也使安全性得到了保证。数据库层共享方式的优点: 提高程序执行效率由于采用了数据库层共享,系统之间可以直接读取彼此的数据库生成各自需要的报表形式。这样的数据传输速度如同在子系统内部读取数据的速度完全相同。 统一数据管理数据库统一集中的放在一起,降低了数据库的维护成本。以往分散地管理各自的数据库系统,造成维护资源的浪费,而且不方便管理。采用统一数据管理,不但节约了维护成本而且可以使几个系统同时备份恢复数据,提高系统的稳定性。 开发效率高避免了
16、彼此系统等待对方制作相应接口造成的时间浪费。可以直接读取数据库进行开发,大幅度提高开发效率。尤其改善了在做多系统复合分析功能时,由于条件的不可预知性造成的接口资源不足给开发工作带来的影响。 降低硬件成本不必购置多台不同的数据库服务器和冗余服务器,系统集成的子系统越多,节省的服务器资源越多。 节省软件成本不必重复购买数据库软件、操作系统以及其他维护软件。2.1.4 高度集成化由于采用强大的自开发专用数据库,同时对SQL和ORACLE都留有标准接口,可以对每个系统分配不同的权限,限制修改权限。这样的安全设置是非常容易实现的。l 统一数据管理数据库统一集中的放在一起,降低了数据库的维护成本。以往分散
17、地管理各自的数据库系统,造成维护资源的浪费,而且不方便管理。采用了统一数据管理,不但节约了维护成本而且可以使几个系统同时备份恢复数据,提高系统的稳定性。l 开发效率高避免了彼此系统等待对方制作相应接口造成的时间浪费。可以直接读取数据库进行开发,大幅度提高开发效率。尤其改善了在做多系统复合分析功能时,由于条件的不可预知性造成的接口资源不足给开发工作带来的影响。2.1.5 易用性云网管的核心设计思想是通过模拟系统管理人员的日常操作,对整个系统的运行状况进行7X24的实时监测和管理。它通过一台安装在Windows环境下的监测主机,采用主动或被动的轮询方式采集整个信息平台及其应用的关键数据,将数据实时
18、的通过监测主机的报告和控制中心进行处理,提供完善的报警和报告功能,是目前国内功能最强大、设计最完善、运行最稳定、最好用的网络故障和性能管理软件。通过云网管系统,用户可以实现多人远程维护管理。在这个平台中,您可以做自己想要做的事情,您可以设置自己想要的界面,您可以设置系统显示的内容,您可以添加、删除模块。云网管系统提供了友好的图形化界面,只需要简单的操作就可以完成复杂的监测器配置工作。在系统结构图中,我们提供和实景完全相同的图形界面,使用户感觉被监测设备就在眼前,被监测的参数一目了然。给用户的使用带来了极大的便利。云网管的核心设计思想是通过模拟系统管理人员的日常操作,对XXX客户整个网络系统的运
19、行状况进行7X24的实时监测和管理。它通过一台安装在Windows环境下的监测主机,采用轮循方式采集XXX客户网络整个信息平台及其应用的关键数据,通过监测主机控制中心实时对数据进行处理,将XXX客户服务网络整个系统的运行状况一目了然的显示出来。云网管为XXX客户提供直观的用户界面。云网管提供的界面视图使XXX客户服务项目的网络和系统监控人员更直观地监控和管理分布在网络中的服务器、网络设备、应用系统等各种资源。同时云网管提供的个性化页面视图,使XXX客户可以用一种新的且更有意义的方法来进行管理,即不但可根据需要重点监控关键的系统资源,还可通过拓扑视图查看资源间的相互关系。例如对XXX客户关键资源
20、的个性化管理,XXX客户的网络和系统监控人员可以将自己管理的网络按照部门或业务类别建立不同的监测主页,同时可以将相应的关键监测拖入每个不同的监测主页里,以便随时查看这些关键应用的运行状况,确保关键应用的正常运行。又如对XXX客户服务业务系统的管理,我们可以选择XXX客户中某一业务中的一个子系统定制一个Visio业务流程视图,把这个应用拓扑视图导入到云网管系统中,这样对该应用子系统的管理就可以通过对其业务处理视图的监控来实现。通过云网管的业务流程视图,可以将业务处理与应用管理有机地结合起来,从业务管理的角度来关注和管理网络资源。2.2 云网管技术特点说明云网管是专门针对中国企业对网络和系统管理的
21、需求而设计的,它将网络管理、网络和系统监控和服务器管理有机的结合起来,是一个功能全面、高度模块化的网络和系统监控平台。通过使用云网管,系统管理人员可以对IT应用架构的重要组件轻松进行管理,有效地降低由于信息平台发生故障或性能变差而带来的风险。作为业界领先的电信级网管软件开发商,云网管具有如下的技术特点:2.2.1 网管“云计算”云网管采用先进的虚拟化技术可以把多台PC服务器虚拟为一台大型计算机以实现超大规模的监测技术,并可随时动态调整监测能力。例如:客户部署完一套云网管后,随着被管理设备的不断增加,当监测负载超过一台服务器的监测能力后,传统的做法是另外再部署一套系统去监测额外的监测对象,而云网
22、管系统并不需要重新部署一套新云网管系统来完成这个工作,只要简单的增加一台新的监测服务器即可动态分担原服务器的监测负荷,此时客户端所有配置和展示还是跟一台服务器一样,这样客户只需要维护一套统一的视图,报告,报警策略而不必因为部署了多套监控软件而必须维护多套配置策略,这样就大大减少了客户工作的复杂度,也便于维护备份和升级。后台监测服务器在理论上可以无限制扩充从而使其监测能力大规模动态扩展,另外当部署了多台监测服务器时,如果其中某个监测服务器宕机,则其它监测服务器可自动接管宕机服务器的监测任务,保证监测对象始终处于被监控状态,从而使整个系统更加健壮稳定。2.2.2 双机热备,永不宕机由于机器硬件本身
23、的局限性在某些情况下会出现宕机的情况(如:硬件老化,损坏,人为因素等),因而双机热备是一个监测系统要保证稳定可靠运行的必备条件。云网管系统采用数据库自动实时热备份,双机互测等技术完美实现当一套系统出现问题时另一套系统能够自动完全接替出故障系统的工作,从而保证系统的7*24小时稳定可靠运行。(云网管“云计算”+“双机热备”图)2.2.3 Agent代理数据采集云网管的代理模块安装在被监控服务器上,对被监控机器性能没有任何影响。美信代理支持通过标准的HTTP协议或者私有协议来将采集的数据回传到服务器端,用户防火墙只需要开放一个专用端口就可以安全采集到服务器全部性能指标。云网管从一台监测主机同时监测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网管 技术 方案 47
限制150内