XXIT运维监控管理平台建设方案.docx
《XXIT运维监控管理平台建设方案.docx》由会员分享,可在线阅读,更多相关《XXIT运维监控管理平台建设方案.docx(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、XXIT运维监控管理平台建设方案 IT运维监控管理平台 建设方案 XXXXXXX 书目 第1章 概述 3 1.1 建设背景 3 1.2 建设目标 3 1.3 建设思路 4 第2章 系统总体设计 5 2.1 总体架构 5 2.2 设计原则 6 2.3 运维管理体系架构设计 7 2.3.1 系统总体架构设计 7 2.3.2 监控采集层 8 2.3.3 数据处理层 8 2.3.4 运行呈现层 8 2.4 系统技术路途 9 2.4.1 采纳Java语言开发 9 2.4.2 采纳J2EE框架 10 2.4.3 采纳WebService进行数据互连互通 10 2.4.4 数据库技术 12 2.4.5 性能
2、限制 13 2.4.6 开发、运行环境 13 2.5 应用接口总体设计 13 2.5.1 系统内部集成接口 13 2.5.2 与基础运维管理工具的集成接口 14 2.5.3 与ITSM系统的集成接口 14 2.5.4 与相关外部系统的统一身份认证与单点登录接口 14 2.6 系统平安设计及部署 15 2.6.1 输入检验 15 2.6.2 GET恳求和Cookie中的敏感数据 15 2.6.3 防通过嵌入标记实现的攻击 15 2.6.4 防口令揣测功能 16 2.6.5 页面和字段级的权限限制 16 2.6.6 系统平安架构 16 第3章 系统功能设计 17 3.1 动环监控 17 3.1.1
3、 配电柜监测 17 3.1.2 配电开关及电流监控 17 3.1.3 发电机监控 18 3.1.4 ATS监测 18 3.1.5 STS监测 18 3.1.6 UPS监控子系统 19 3.2 统一门户子系统 19 3.2.1 信息主管领导内容展示 20 3.2.2 运维人员内容呈现 20 3.2.3 一般用户内容呈现 21 3.3 IT运行监控子系统 21 3.3.1 基础平台功能 21 3.3.2 网络设备管理 23 3.3.3 服务器监控管理 26 3.3.4 存储监控管理 29 3.3.5 数据库监控管理 29 3.3.6 中间件监控管理 30 3.3.7 web与应用监控管理 31 3
4、.3.8 虚拟化监控管理 32 3.3.9 IP地址管理管理 33 3.3.10 信息点管理 34 3.3.11 告警监控管理与转发处理 35 3.3.12 综合监控管理 36 3.3.13 综合报表管理 37 3.4 IT服务管理子系统 38 3.4.1 功能特点 38 3.4.2 服务台管理 41 3.4.3 服务书目管理 42 3.4.4 服务恳求管理 42 3.4.5 事务管理 43 3.4.6 问题管理 43 3.4.7 变更管理 44 3.4.8 值班管理 44 3.4.9 公告管理 45 3.4.10 IT运维报告 45 3.4.11 用户管理 46 第4章 培训方案 46 第5
5、章 系统价值 47 第6章 售后服务 47 第1章 概述 1.1 建设背景 随着近年来经济的进一步快速发展,企事业机关单位IT运行环境日趋困难,运行监控工作难度加大,尤其是随着信息化建设的不断深化,信息系统越来越多,各类系统越来越困难,系统的关联度也越来越高。 数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT系统运行环境变得更加困难,造成了机房管理、系统监控、运行维护工作非常困难的局面。 虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,刚好发觉与解决网络、硬件、平安设备、操作系统、数据库、中间件、应用系统、机房空调、UPS等突然出现的问题。
6、 因服务对象的不同,运用产品混杂。怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面呈现给各科室管理员、领导,成为目前面临最大的挑战。 1.2 建设目标 加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,刚好、精确、全面反映与驾驭信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标: (1) 强化主动监控,实现集中管理。以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、刚好地发觉问题,并调度资
7、源解决问题,形成IT运维管理主动服务的新局面。(2) 帮助定位故障,快速复原系统运行。建立集中的告警分析及呈现平台,供应敏捷、自动化的事务处理实力。当故障产生时,可以进行故障的快速定位,发觉故障缘由,调度资源快速复原系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。(3) 驾驭运行质量与效率,合理利用资源。建立IT运维平台后,可以实时了解全部IT资源的负载与运用状况,依据须要从整体角度考虑资源的运用,同时可以依据业务高峰期的不同来调剂业务系统对资源的运用。(4) 规范运行管理,有序开展维护。参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程
8、规范化。依据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术实力和解决实际问题的实力。(5) 共享运维阅历,完善学问库。把运维过程中产生的丰富阅历进行积累和总结,形成有效的学问库,建立学问的共享机制,供应信息共享和沟通的平台,提高运维人员的工作效率。1.3 建设思路 IT运维管理理论、方法和标准,结合中心实际和建设须要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络
9、及信息系统的综合管理监控和日常技术支持,快速响应和刚好解决信息系统运行过程中出现的各种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。 第2章 系统总体设计 2.1 总体架构 依据对IT运维管理体系的建设阅历,以及对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下: IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统供应基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要依据IT服务管
10、理的国际标准ISO2000,并结合ITIL最佳实践,梳理出了事务管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。统一门户主要实现对监控信息、运维流程信息进行集中展示。平台三个子系统关系如下: (1) 以IT运行监控为“基础” 这部分的功能主要是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异样的刚好报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预料。另外,还包括对IT系统的全部配置资产状况进行统一管理,对配置信息的异动供应检查及告警。 IT监控管理除了实现网管的告警、性能、配置几
11、大基本功能以外,还从运维的角度供应丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。(2) 以IT服务管理为“导向” 这部分功能主要依据ITIL架构进行建设,为IT系统的维护服务供应电子化的限制手段。系统通过事务管理、问题管理、变更管理、配置管理等功能,为IT维护人员供应以流程为基础的服务管理方式,规范管理模式,达到快速消退IT系统故障、解决潜在问题,削减不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。(3) 以统一运维门户为“体现” 即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S呈现,为系统的操作运用人员供应统一的系
12、统接口,做到一点接入,通观全局,能够以敏捷的组织数据的呈现方式,定义用户、角色、组织机构,并为每个不同角色供应不同的功能模块,为每个用户安排不同的呈现内容,便利用户进行企业整体的运行维护管理。 2.2 设计原则 IT运维平台作为信息中心将来运维工作的核心支撑系统,须要系统本身具有高牢靠、易扩展、易维护等特点,并且在系统功能应用上要具备肯定的技术先进性和好用性。所以,本次项目的方案设计遵循以下设计原则: (1) 先进好用 平台注意先进性和好用性的统一,以好用为目的,合理选用各类成熟、先进技术。在体系结构、功能算法等诸多方面都采纳先进计算机技术和理论,应用功能体现好用性。 (2) 牢靠性 在系统结
13、构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24平安无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。(3) 平安性 注意平安方面的设计,确保IT运维监控管理平台的稳定、平安运行。系统要保证数据的平安,不会增加现有应用系统的困难性,更不会降低现有应用系统的稳定性。(4) 开放性 采纳符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接入本系统进行监控供应接口,支持各种主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。(5) 可扩展、易集成 系统需具备很好的扩展性,能适应不断发展的
14、业务需求。随着IT资源种类和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。系统具备高度集成性,可以和第三方产品进行集成,进行功能扩展。系统供应开发工具和接口,便利其他监控系统集成和统一管理。2.3 运维管理体系架构设计 与运维综合监控相关的运维管理体系架构主要包括以下内容: 1)资源监控与操作管理体系:面对资源,以统一资源配置库(资产与配置、监控数据库)为基础,建设面对被管理资源的监控管理与操作自动化管理体系。2)数据综合分析体系:面对管理者,以统一资源配置库为基础,对资源监控与操作管理体系数据进行分析挖掘,建设协助运营决策的数据综合分析体系。运维管理体系架构是一个完整的IT系统运
15、维管理架构,是IT综合运维管理的较高目标。2.3.1 系统总体架构设计 系统由监控采集层、数据处理层、服务管理层、运行呈现层组成。 2.3.2 监控采集层 监控采集层主要由网络监控模块(NCC)、应用监控模块(BCC)组成,实现对IT基础支撑系统的监控,包括:网络设备、业务服务器、存储设备、数据库系统、中间件系统、平安设备、业务应用系统、网络流量等。 同时,从第三方系统(如机房环境监控和视频监控系统等)抽取数据(包括资产配置数据、故障告警数据),实现对IT资源的全面监控。2.3.3 数据处理层 数据处理层由统一事务平台(Arbiter)、数据指标抽取模块(Bridge)、监控指标库(RDB)、
16、可视化呈现视图(Live)等模块组成。监控指标库(RDB)存放了全部监控对象的当前运行状况、重要告警、重要KPI性能指标等数据,实现性能基线管理,并为监控对象的可视化呈现供应数据支持。CMDB与RDB数据库的记录通过资源唯一标识ID(UUID)实现一一对应,并能够自动维护其相互关联关系。数据指标抽取(Bridge)负责从底层监控工具和第三方系统抽取各类管理数据,如资产配置数据、性能数据、监控对象运行状态数据、故障告警数据等。其中故障告警数据送到统一事务平台进行处理,性能和状态数据进过处理后存放到RDB数据库中,资产配置数据经过数据清洗、调和处理后送到CMDB数据库中。统一事务平台负责对来源不同
17、的告警信息进行过滤、压缩和关联,以及对不同来源的性能数据进行规范、汇聚、分析等,并通过根源问题发觉等功能,实现快速的故障定位,保证业务系统的监控运行。灵动呈现平台是一个特性化监控视图开发工具,可以依据管理需求,对各类资源进行敏捷组合,生成各类资源呈现监控视图。2.3.4 运行呈现层 运行呈现层有运维门户(Portal)、用户管理(ACM)、报表开发工具(Report)组成。运维门户(portal):向用户供应基于WEB的统一运维管理访问入口,运用户能够在统一登录、统一认证的状况下,实现对故障告警台、服务台、服务流程管理、监控视图、统计报表的访问。报表开发工具能够依据管理须要抽取监控、操作、资产
18、、流程等各管理层面的数据,并生成各类统计报表,为运行分析和管理提升供应支持。用户管理实现组织架构管理、帐户管理、角色管理、授权管理等功能,实现整个运维平台的统一帐户和授权管理。2.4 系统技术路途 2.4.1 采纳Java语言开发 系统采纳JAVA和XML相结合的技术进行网站设计开发,由于Java的平台无关等特性,而在数据表示和传输方面,XML有着得天独厚的优势。Java与XML的组合供应了建立三层应用程序的最佳手段,开发的系统具有跨平台运行的实力,无论在windows环境下还是在其他主流操作系统环境下都能运行。主要特点: 平台独立性 这是Java最吸引人的地方。由于它采纳先编译成中间码(字节
19、码),然后装载与校验,再说明成不同的机器码来执行,即“Java虚拟机”的思想,“屏蔽”了详细的“平台环境”特性要求,使得只要能支持Java虚拟机,就可运行各种Java程序。面对对象的技术 面对对象的技术是近年来软件开发中用得最为普遍的程序设计方法,它通过把客观事物进行分类组合、参数封装、用成员变量来描述对象的性质、状态,而用方法(成员函数)来实现其行为和功能。面对对象技术具有继承性、封装性、多态性等众多特点,Java在保留这些优点的基础上,又具有动态联编的特性,更能发挥出面对对象的优势。多线程 多线程机制使应用程序能并行执行,Java有一套成熟的同步原语,保证了对共享数据的正确操作。通过运用多
20、线程,程序设计者可以分别用不同的线程完成特定的行为,而不须要采纳全局的事务循环机制,这样就很简单实现网络上实时的交互行为。动态性 Java的设计使它适合于一个不断发展的环境。在类库中可以自由地加入新的方法和实例变量而不会影响用户程序的执行。并且Java通过接口来支持多重继承,使之比严格的类继承具有更敏捷的方式和扩展性。平安性 Java有建立在公共密钥技术基础上的确认技术,指示器语义的变更将使应用程序不能再去访问以前的数据结构或是私有数据,大多数病毒也就无法破坏数据。因而用Java可以构造出无病毒、平安的系统。2.4.2 采纳J2EE框架 考虑到系统的跨平台性和将来良好的移植性,并且考虑到系统能
21、够将来很好地与其他业务子系统的集成,本系统采纳J2EE平台,并且依据J2EE的中间件规范进行产品开发,本系统采纳J2EE平台集成的标准中间件,并在数据交换和数据导出上支持XML标准。平台比较 目前,可作为开放式数据应用集成的规范和平台的技术主流有两种,一种是微软公司的Windows DNA平台,另一种是SUN公司的J2EE平台。虽然这两种集成平台和分布式计算技术都能满意实施开放式的数据应用集成的需求,但是从规范的开放性、支持异构性、可移植性、支持的广泛性、对现有系统数据的继承性和技术优势等方面比较, J2EE比Windows DNA具有优势。平台优势 J2EE是一种利用Java 2平台来简化诸
22、多与多级企业解决方案的开发、部署和管理相关的困难问题的体系结构。J2EE技术的基础就是核心Java平台或Java 2平台的标准版,J2EE不仅巩固了标准版中的很多优点,例如“编写一次、到处运行”的特性、便利存取数据库的JDBC API、CORBA技术以及能够在Internet应用中爱护数据的平安模式等等,同时还供应了对 EJB(Enterprise JavaBeans)、Java Servlets API、JSP(Java Server Pages)以及XML技术的全面支持,可以更好地与其他的分布式应用系统集成。因此J2EE是一种更志向的集成平台和规范。2.4.3 采纳WebService进行
23、数据互连互通 Web服务是一个或者一组应用程序,向外界供应一个能够通过Web进行调用的API。Web服务的主要目标是在现有的各种异构平台的基础上构筑一个通用的与平台无关、语言无关的技术层,多种不同平台上的应用依靠这个技术层来实施彼此的连接和集成。1Web服务模型 Web服务体系结构是基于三种角色之间的交互,分别是服务供应者、服务注册中心和服务恳求者。其中:(1)服务供应者:创建Web服务实体,为能实现一组特定任务的软件供应服务接口;(2)服务恳求者:发觉和调用软件服务,恳求者一般会调用服务供应者发布的远程方法,把参数数据发送给供应者并接收相应结果;(3)服务注册表:管理和发布服务。当服务恳求者
24、须要调用服务时,它首先到UDDI注册中心搜寻该服务,得到如何调用该服务的信息,然后依据这些信息去调用服务供应者发布的服务。在Web Service服务体系中,运用WSDL来描述服务,UDDI来发布、查找服务,而SOAP用来执行服务调用。下图显示了这些操作、供应这些操作的组件及它们之间的交互。发布WSDL, UDDI 服务注册 服务恳求者 服务供应者 服务描述 服务 服务描述 查找WSDL, UDDI 绑 定 2Web服务的相关标准 在Web服务协议栈中,涉及了数据、消息、服务和注册库的描述定义,这些要用到详细的标准技术,包括XML、SOAP、WSDL、UDDI等。其中XML用来描述不同层次的数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XXIT 监控 管理 平台 建设 方案
限制150内