IT运维技术方案设计(共51页).doc
《IT运维技术方案设计(共51页).doc》由会员分享,可在线阅读,更多相关《IT运维技术方案设计(共51页).doc(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上IT运维综合监管系统软件技术方案索科维尔(北京)软件系统有限公司2015年08月03日目 录总体设计1.1 设计原则系统设计要遵循以下原则: 实用性和易用性的原则作为一个应用系统,实用性是直接影响系统的运行效果和生命力的最重要因素,也是一个严谨的系统开发者要无条件遵循的原则。系统建设必须充分考虑使用人员的特点和习惯设计软件系统及用户的实际需求。系统应注重成果的可应用性和可操作性。以满足用户需求为目标,方便用户使用为基本原则。 先进性和创新性原则在技术上,采用当前先进而且成熟的技术,使得设计更加合理、更为先进,同时借鉴成熟的经验。选用的软件平台不仅是现阶段成熟的先进产品
2、,而且是同类产品的主流,符合今后的发展方向;在软件开发思想上,严格按照软件工程的标准和面向对象的理论来设计,管理和开发,保证系统开发的高起点。 一致性和完整性原则本项目涉及到数据采集、数据入库、数据查询等功能,为使系统协调一致的开发和运行,整个系统所有数据采用统一的编码、统一的数据存储格式、统一的用户界面。 标准化和规范化原则标准化、规范性是一个信息系统建设的基础,也是系统与其他系统兼容和进一步扩充的根本保证。高性能和稳定性原则在系统设计、开发和应用时,将从系统结构、技术措施、软硬件平台、技术服务和维护相应能力等方面综合考虑,确保系统较高的性能和较低的故障率。系统建成后能长期运行,数据库的维护
3、具有专门的更新途径和配套的业务流程。 开放性和可扩充性原则系统设计和实现过程中需要预留与第三方系统的接口,对外发布系统的接口标准与措施。 安全性和可靠性原则系统的安全性是一个优秀系统的必要待征,是整个系统建设的关键。本系统能够对系统主要的信息实行备份,以保证系统在出现异常情况下的补救措施。 经济和时效性原则系统建设尽可能利用现有的资源条件(软件、硬件、数据和人员),按“统筹规划、分步实施”的原则在规定的时间内高质量、高效率实现系统建设目标。1.2 开发环境系统开发基于Windows Visual Studio 2010,采用C#/WCF/WPF等技术进行开发。系统运行环境为Windows 7/
4、2003及以上版本;.Net 3.5框架及以上版本;支持主流的Oracle数据库。1.3 总体架构IT运维综合监管系统的总体架构如下所示:图表1:系统架构数据层数据层负责管理各种类型数据的获取、存储和访问,包括机房环境设备、网络设备、服务器、第三方系统对接等。数据存储采用分布式,中心数据库负责元数据、资源信息、网络拓扑等信息的存储,为了降低中心数据库的访问压力,系统支持将采样数据存储在单独的数据库中。设备访问控制接口支持对主流环境设备、网络设备等的远程监控及性能数据采集,同时也支持与第三方系统的对接;通用数据访问接口支持对主流数据库的访问,包括Oracle、SQL Server等,也支持数据文
5、件的读写。业务层对数据层的访问通过微软的WCF技术实现,同时支持数据加密和压缩机制。业务层业务层负责实现用户业务需求,包括资源管理、机房管理、网络管理、维护管理、环境设备管理、告警管理、三维仿真、告警策略等。这一层也包含整个系统平台的组织与管理机制,如插件管理、用户管理、权限管理、索引服务等。同时,系统支持事件服务组件,实现后台服务对前端应用的异步消息通知机制。展现层展现层支持C/S客户端软件。客户端软件利用C/S程序的技术优势,实现系统的所有界面展现、控制和管理功能。软件采用仿Office 2007界面风格,方便用户熟悉和操作使用。客户端基于微软的WPF技术实现。通过三维机房仿真和交互,在现
6、有资产管理数据库的基础上,以三维仿真方式展现数据中心的运行情况,实现IT设备可视化管理和服务器等设备物理位置的精确定位。通过三维仿真方式实现对机房、IT设备的部署情况的直观展示。系统能够实现机房设备的360度视角手动调整。基于Windows平台及.Net框架,利用微软成熟的WPF三维建模技术进行开发,开发语言为C#。1.4 系统部署根据用户需求,应用服务、监控服务将部署在Windows2008或更高系统平台上,并安装.Net 3.5或.Net4.0框架。利用数据库服务器(可利旧)进行数据的永久存储和管理。客户端软件安装在用户的Windows7操作系统上。系统保证在如下配置的硬件上能长期稳定运行
7、。服务器端:一般服务器,2颗Intel Xeon 2.0GHz CPU,8G内存,千兆网卡。客户端:台式或笔记本电脑,4G内存,独立显卡,百兆网卡。图表2:系统部署第2章 数据库设计2.1 数据内容设计根据信息系统运维管理平台需求,结合未来扩展需要,建立一套较完善的信息系统运维管理平台数据体系。2.1.1 数据内容分类设计与信息系统运维管理平台相关的数据内容主要包括环境设备、网络设备、软件系统的属性数据、实时监控数据和告警数据等数据,数据内容如下:1. 网络设备的属性数据网络设备的属性数据包括: 静态属性数据包括设备名称、资产编号、购买日期、产品型号、生产厂家、使用人、固件版本号、IP地址、物
8、理地址等。这些信息一部分可以自动获得,其余需要用户手工录入。 三维建模数据包括设备的长、宽、高,所属区域,所属机房、前后面板图片等。系统利用这些数据动态生成无线网络设备的三维模型,并显示在三维视图的指定空间位置。2. 软件系统的属性数据软件系统的属性数据包括: 静态属性数据包括软件系统名称、资产编号、购买日期、软件厂家、版本号、许可编号、所属设备等。这些信息一部分可以自动获得,其余需要用户手工录入。1、 实时监控数据包括网络设备的运行时间、数据流量、连接设备信息、CPU利用率、内存利用率等,软件系统的CPU利用率、硬盘利用率、内存利用率、运行时间、运行状态等。2、 告警数据包括告警类型、告警时
9、间、告警级别、告警内容、告警设备编号等。2.1.2 数据量分析数据量的分析是建立数据库系统、硬件支持平台、网络交换平台的主要依据。信息系统运维管理平台的主要数据量来源于实时监控。按照5000个设备和软件系统的监控量,每分钟采样一次,每次采样数据量150字节估算,每天的数据在1GB左右。考虑到设备和软件系统的监控数据不需要长期存储,假设存储时间为三个月,则总数据量在100GB左右。超过三个月的数据自动清除。因此,普通的500GB硬盘足够满足存储要求。2.2 元数据管理设计为了实现信息系统运维管理平台的属性管理的灵活性和可扩充性,在系统设计上采用了元数据的概念。所有设备的类型定义、属性标识、可进行
10、的操作等信息均存储在数据库中。系统根据元数据自动生成管理界面中的元素及可进行的操作选项。这种设计极大的增加了系统的灵活性。例如,增加一个设备属性字段,只需要在数据库的属性表中增加一个字段,不需要修改任何代码。2.3 数据采集与维护设计数据采集由专门的监控服务进行采集。采集到的数据先进行告警检测,然后入库。检测到告警时会产生告警事件并入库。同一个告警事件重复发生时,系统更新告警时间,不会重复发送告警通知。告警事件会长期保存。考虑到对被监控设备及软件系统的影响,采集时间间隔不易过短。综合监控效果及性能影响等因素,设置为1分钟比较合适。用户可以自行修改时间间隔配置。除了实时监控数据外,其它的数据所需
11、磁盘容量有限,主要考虑的是数据表的定义。第3章 软件系统设计3.1 系统概述我公司的IT运维综合监管系统软件是一套先进的IT运维管理系统,可以对XXX大厦(上海)进行统一管理,包括IT资源管理、IT机房的三维仿真交互、网络管理、监控管理、维护管理、统计分析、权限管理等。通过该系统,可以实现对机房的精细化、可视化、标准化、实时化、透明化管理,有效提升XXXIT信息化的管理水平,助力XXXIT信息化的建设,提升XXX节能减排的水平,实现XXX绿色机房的目标。本系统采用C/S的方式。系统后台服务基于Windows 2008 Server运行,.Net 3.5框架及以上版本;数据库支持Oracle 1
12、0G,采用C#开发。系统C/S客户端基于Windows 7运行,采用C#开发。系统基于Windows Visual Studio 2010进行开发,采用C#/WCF/WPF等技术进行开发。系统开发遵循CMMI及ISO9001相关软件流程。考虑到未来还可能要增加其它的系统模块,因此应用系统的开发设计必须基于项目运行环境要求并充分考虑可扩展性。3.2 主要技术应用3.2.1 基于C/S的架构C/S 结构,即大家熟知的客户机和服务器结构。它是软件,通过它可以充分利用两端硬件环境的优势,将任务合理分配到Client端和Server端来实现,降低了系统的通讯开销。目前大多数应用软件系统都是Client/
13、Server形式的两层结构,由于现在的软件应用系统正在向分布式的Web应用发展,Web和Client/Server 应用都可以进行同样的业务处理,应用不同的模块共享逻辑组件;因此,内部的和外部的用户都可以访问新的和现有的应用系统,通过现有应用系统中的逻辑可以扩展出新的应用系统。系统采用C/S架构,能够对外提供数据接口,同时能够通过SNMP TRAP发出事件告警信息。3.2.2 基于C/S架构的三维仿真机房展示、管理功能三维是指在平面二维系中又加入了一个方向向量构成的空间系。三维既是坐标轴的三个轴,即x轴、y轴、z轴,其中x表示左右空间,y表示上下空间,z表示前后空间,这样就形成了人的视觉立体感
14、。三维建模技术WPF缩写为Windows Presentation Foundation的缩写 ,其原来代号为“Avalon”。WPF是微软新一代图形系统,运行在.NET Framework 3.0架构下,为用户界面、2D/3D 图形、文档和媒体提供了统一的描述和操作方法。基于DirectX 9/10技术的WPF不仅带来了前所未有的3D界面,而且其图形向量渲染引擎也大大改进了传统的2D界面,比如Vista中的半透明效果的窗体等都得益于 WPF。WPF相对于Windows客户端的开发来说,向前跨出了巨大的一步,它提供了超丰富的.NET UI 框架,集成了矢量图形,丰富的流动文字支持flow te
15、xt support,3D视觉效果和强大无比的控件模型框架。基于WPF技术,对3D机房进行建模,其中包括3D模型库的设计开发、3D对象抽象类的构建、3D对象事件处理机制的设计开发、对象数据抽象类的构建等。根据不同类型IT设备的特性,进行3D建模,除3D外形外,关联前后面板图片,同时关联事件处理方法,如显示属性、复制粘贴、旋转、3D定位等功能。一个好的系统,友好便捷的用户界面是非常重要的。由于企业的IT资源天生所具有的复杂特性,如何将IT资源展现给用户是许多软件企业一直在探寻的。3D机房的概念,早在2006年就由微软提出来了。当时微软为了推广其WPF三维呈现技术,开发了一个演示版的3D机房管理系
16、统,在当时引起来广泛的关注。然而,由于相关技术的不成熟,到目前为止,还没有一款类似的产品出现。以3D机房的形式来管理IT资源,并不仅仅是锦上添花。通过对真实机房的三维仿真,可以对整个机房的布局一目了然;在三维机房中,可以对机房布局进行规划,从而达到合理利用机房空间的效果;通过在三维机房中整合各种信息,使得使用人员能够以最快捷的方式获取各类信息,如设备信息、告警信息等;通过操作模拟设备来实现对IT设备及系统的信息管理,如日常维护、属性变更、日常巡检等;通过3D定位功能,可以随时随地准确快捷地在三维机房中定位某个设备,真正解决了很多企业用户面临的设备定位问题。机房管理人员的主要日常工作是对机房的巡
17、查。通常的做法是管理人员每天按时进入机房,对机房内部设备及环境进行巡视。这种巡查方法的缺点是耗费人力,而且达不到很好的巡查效果,往往发现不了潜在的一些问题。通过机房三维仿真、大屏幕自动展示、视频图像结合、设备环境监控信息集成,可以保证IT管理人员在大屏幕面前就能够掌握机房内部所有细节,实现了足不出户,全面掌控机房的目的!系统通过全屏自动播放的方式,逐一显示3D机房内各个设备的实时信息,如设备名称、CPU利用率、硬盘利用率、内存利用率等。同时,将环境温湿度信息、各种告警信息叠加到3D显示界面上,使IT管理人员不需要置身机房,就能够实时获取IT机房的全貌。用户可以通过系统界面来定义展示方案,包括哪
18、些机房的哪些设备参与展示,展示方式等。图表3:三维机房仿真3.2.3 分布式监控与自动负载均衡在70年代计算机网络出现之前,信息处理采用集中式处理或分散式处理。集中式处理把各信息包括远程信息都传输到统一的中进行处理。采用集中式处理可以达到设备利用率高的目的,并能保证被的完整性和有效性。一个下设许多工厂的公司采用集中式可以得到整个公司的最佳结果,不像各工厂分散处理那样,考虑的只是每个工厂的优化。集中处理需要的设备比分散处理所用的设备复杂得多,但它可为大部分工厂所共享,避免设备的重复。分散式处理的最大优点是简单,能就地提取数据、变换格式并进行加工,最后输出决定。要把这些工作集中于统一的程序中是非常
19、困难和代价昂贵的。分散程度越大,满足部门的特殊信息处理要求的可能性也越大,但统一和控制信息流的困难也越大。由于要求在数据产生场所进行局部处理的数据比重不断增加,要求应答时间缩短和计算机的处理能力不可能无限增强等原因,常把分散设置的各计算机组合成计算机网,形成分布式处理系统。这样既能克服分散处理的缺点,又可避免集中的困难。70年代以来,随着计算机日益广泛地应用于各个领域,全国性与国际性的计算机网相继出现,这种的功能和结构也越来越复杂。分布式处理将装备从集中的处理系统中分散开来,便能直接从信息源取得信息并进行相互协调的处理。由于IT机房的设备多、类型复杂、监控指标多等特点,要求信息系统运维管理平台
20、能够实时并发处理大量的监控数据。这些指标包括服务器、交换机、路由器、防火墙、KVM、磁盘阵列等。要实现实时并发处理大量的监控指标,需要在信息系统运维管理平台的架构设计上充分采用分布式监控和自动负载均衡技术。系统由应用服务、监控服务、代理程序、客户端构成,其中监控服务负责监控各种指标。为了应对海量的监控数据,监控服务理论上可以分布式部署任意多个实例。每个监控服务实例可以配置监控指标。比如,监控服务实例A可以监控服务器性能指标,监控服务实例B可以监控数据库和中间件性能指标,而监控服务C可以监控机房的环境温湿度等信息。另外,为了减少对中心数据库的压力,每个监控服务在本地缓存一定时间的监控数据。客户端
21、在请求实时监控数据时可以从相应的监控服务实例获取,这样大大减轻了对应用服务和后台数据库的访问压力。同时,也使系统对网络带宽的占用降到最低。XXX(上海)的软硬件环境是动态变化的,这就要求运维系统能够自动适应这种变化。例如,增加了一台服务器,运维系统可以自动将其分配给某个监控服务实例。如果某个监控服务实例退出,系统会自动将该监控服务实例负责监控的指标转移到其它监控服务实例上,实现平滑切换。在批量购进新资产后,可以通过增加监控服务实例的方式自动进行负载均衡,避免出现某一个监控服务实例负担过重,影响监控任务的情况发生。IT运维综合监管系统体系结构是一种C/S模式。其中,基于C/S的客户端软件;服务层
22、包含负责性能监控的监控服务以及应用服务。应用服务是系统的核心,负责数据库的连接管理、元数据的管理、各种用户的权限控制,事件通道、监控服务的负载均衡调度管理等。数据层采用Oracle 10g或以上,为整套系统提供永久数据存储服务,另外还有若干配置文件,用于系统配置参数的存储以及网络设备特征数据的存储。系统包括IT资源管理、环境监控、设备监控、网络管理、系统管理、三维机房仿真视图及交互、三维快速定位、性能监控、事件管理、配置管理、统计分析、日志管理、用户管理、权限管理等,实现了系统的主要功能。技术框架采用微软的.Net框架,远程对象访问采用微软的WCF技术,三维技术基于微软的WPF技术。系统支持两
23、种数据接口:WCF远程对象接口和标准数据接口。WCF远程对象接口为内部接口,用于客户端与应用服务、监控服务与应用服务、WEB服务与应用服务等之间的远程过程调用。标准数据接口基于TCP/IP连接,使用Socket进行数据交换。数据请求包和响应包采用XML格式,实现了平台无关性。3.3 系统功能列表根据用户需求,IT运维综合监管系统的基本功能列表如下:功能模块功能描述是否支持备注统一监控管理系统平台提供统一的IT运维综合监管系统平台,使机房管理人员通过一个系统即可以对机房进行全面的管理。支持系统界面仿MS Office2007,操作极为便利。资源管理提供资产容器、IT设备、环境设备、软件、配件等资
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IT 技术 方案设计 51
限制150内