IT运维关键技术专项方案.doc
《IT运维关键技术专项方案.doc》由会员分享,可在线阅读,更多相关《IT运维关键技术专项方案.doc(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、IT运维综合监管系统软件技术方案索科维尔(北京)软件系统08月03日目 录1.1 设计标准31.2 开发环境41.3 总体架构41.4 系统布署6第2章 数据库设计72.1 数据内容设计72.1.1 数据内容分类设计72.1.2 数据量分析82.2 元数据管理设计82.3 数据采集和维护设计9第3章 软件系统设计103.1 系统概述103.2 关键技术应用103.2.1 基于C/S架构103.2.2 基于C/S架构三维仿真机房展示、管理功效113.2.3 分布式监控和自动负载均衡123.3 系统功效列表143.4 系统功效划分153.4.1 统一IT运维综合管理系统平台153.4.2 基于C/
2、S用户端软件163.4.3 三维机房管理163.4.4 大屏幕机房展示203.4.5 资源管理203.4.6 维护管理283.4.7 统计分析293.4.8 网络管理303.4.9 IP管理383.4.10 监控管理393.4.11 网络设备监控393.4.12 软件系统监控403.4.13 统一告警和预警机制433.4.14 数据检索443.4.15 元数据开发技术453.5 系统管理463.5.1 用户管理473.5.2 日志统计473.5.3 权限管理483.6 运行环境设计493.6.1 布署方案493.7 系统性能50总体设计1.1 设计标准系统设计要遵照以下标准: 实用性和易用性标
3、准作为一个应用系统,实用性是直接影响系统运行效果和生命力最关键原因,也是一个严谨系统开发者要无条件遵照标准。系统建设必需充足考虑使用人员特点和习惯设计软件系统及用户实际需求。系统应重视结果可应用性和可操作性。以满足用户需求为目标,方便用户使用为基础标准。 优异性和创新性标准在技术上,采取目前优异而且成熟技术,使得设计愈加合理、更为优异,同时借鉴成熟经验。选择软件平台不仅是现阶段成熟优异产品,而且是同类产品主流,符合以后发展方向;在软件开发思想上,严格根据软件工程标准和面向对象理论来设计,管理和开发,确保系统开发高起点。 一致性和完整性标准本项目包含到数据采集、数据入库、数据查询等功效,为使系统
4、协调一致开发和运行,整个系统全部数据采取统一编码、统一数据存放格式、统一用户界面。 标准化和规范化标准标准化、规范性是一个信息系统建设基础,也是系统和其它系统兼容和深入扩充根本确保。高性能和稳定性标准在系统设计、开发和应用时,将从系统结构、技术方法、软硬件平台、技术服务和维护对应能力等方面综合考虑,确保系统较高性能和较低故障率。系统建成后能长久运行,数据库维护含有专门更新路径和配套业务步骤。 开放性和可扩充性标准系统设计和实现过程中需要预留和第三方系统接口,对外公布系统接口标准和方法。 安全性和可靠性标准系统安全性是一个优异系统必需待征,是整个系统建设关键。本系统能够对系统关键信息实施备份,以
5、确保系统在出现异常情况下补救方法。 经济和时效性标准系统建设尽可能利用现有资源条件(软件、硬件、数据和人员),按“统筹计划、分步实施”标准在要求时间内高质量、高效率实现系统建设目标。1.2 开发环境系统开发基于Windows Visual Studio ,采取C#/WCF/WPF等技术进行开发。系统运行环境为Windows 7/及以上版本;.Net 3.5框架及以上版本;支持主流Oracle数据库。1.3 总体架构IT运维综合监管系统总体架构以下所表示:图表1:系统架构数据层数据层负责管理多种类型数据获取、存放和访问,包含机房环境设备、网络设备、服务器、第三方系统对接等。数据存放采取分布式,中
6、心数据库负责元数据、资源信息、网络拓扑等信息存放,为了降低中心数据库访问压力,系统支持将采样数据存放在单独数据库中。设备访问控制接口支持对主流环境设备、网络设备等远程监控及性能数据采集,同时也支持和第三方系统对接;通用数据访问接口支持对主流数据库访问,包含Oracle、SQL Server等,也支持数据文件读写。业务层对数据层访问经过微软WCF技术实现,同时支持数据加密和压缩机制。业务层业务层负责实现用户业务需求,包含资源管理、机房管理、网络管理、维护管理、环境设备管理、告警管理、三维仿真、告警策略等。这一层也包含整个系统平台组织和管理机制,如插件管理、用户管理、权限管理、索引服务等。同时,系
7、统支持事件服务组件,实现后台服务对前端应用异步消息通知机制。展现层展现层支持C/S用户端软件。用户端软件利用C/S程序技术优势,实现系统全部界面展现、控制和管理功效。软件采取仿Office 界面风格,方便用户熟悉和操作使用。用户端基于微软WPF技术实现。经过三维机房仿真和交互,在现有资产管理数据库基础上,以三维仿真方法展现数据中心运行情况,实现IT设备可视化管理和服务器等设备物理位置正确定位。经过三维仿真方法实现对机房、IT设备布署情况直观展示。系统能够实现机房设备360度视角手动调整。基于Windows平台及.Net框架,利用微软成熟WPF三维建模技术进行开发,开发语言为C#。1.4 系统布
8、署依据用户需求,应用服务、监控服务将布署在Windows或更高系统平台上,并安装.Net 3.5或.Net4.0框架。利用数据库服务器(可利旧)进行数据永久存放和管理。用户端软件安装在用户Windows7操作系统上。系统确保在以下配置硬件上能长久稳定运行。服务器端:通常服务器,2颗Intel Xeon 2.0GHz CPU,8G内存,千兆网卡。用户端:台式或笔记本电脑,4G内存,独立显卡,百兆网卡。图表2:系统布署第2章 数据库设计2.1 数据内容设计依据信息系统运维管理平台需求,结合未来扩展需要,建立一套较完善信息系统运维管理平台数据体系。2.1.1 数据内容分类设计和信息系统运维管理平台相
9、关数据内容关键包含环境设备、网络设备、软件系统属性数据、实时监控数据和告警数据等数据,数据内容以下:1. 网络设备属性数据网络设备属性数据包含: 静态属性数据包含设备名称、资产编号、购置日期、产品型号、生产厂家、使用人、固件版本号、IP地址、物理地址等。这些信息一部分能够自动取得,其它需要用户手工录入。 三维建模数据包含设备长、宽、高,所属区域,所属机房、前后面板图片等。系统利用这些数据动态生成无线网络设备三维模型,并显示在三维视图指定空间位置。2. 软件系统属性数据软件系统属性数据包含: 静态属性数据包含软件系统名称、资产编号、购置日期、软件厂家、版本号、许可编号、所属设备等。这些信息一部分
10、能够自动取得,其它需要用户手工录入。1、 实时监控数据包含网络设备运行时间、数据流量、连接设备信息、CPU利用率、内存利用率等,软件系统CPU利用率、硬盘利用率、内存利用率、运行时间、运行状态等。2、 告警数据包含告警类型、告警时间、告警等级、告警内容、告警设备编号等。2.1.2 数据量分析数据量分析是建立数据库系统、硬件支持平台、网络交换平台关键依据。信息系统运维管理平台关键数据量起源于实时监控。根据5000个设备和软件系统监控量,每分钟采样一次,每次采样数据量150字节估算,天天数据在1GB左右。考虑到设备和软件系统监控数据不需要长久存放,假设存放时间为三个月,则总数据量在100GB左右。
11、超出三个月数据自动清除。所以,一般500GB硬盘足够满足存放要求。2.2 元数据管理设计为了实现信息系统运维管理平台属性管理灵活性和可扩充性,在系统设计上采取了元数据概念。全部设备类型定义、属性标识、可进行操作等信息均存放在数据库中。系统依据元数据自动生成管理界面中元素及可进行操作选项。这种设计极大增加了系统灵活性。比如,增加一个设备属性字段,只需要在数据库属性表中增加一个字段,不需要修改任何代码。2.3 数据采集和维护设计数据采集由专门监控服务进行采集。采集到数据优异行告警检测,然后入库。检测到告警时会产生告警事件并入库。同一个告警事件反复发生时,系统更新告警时间,不会反复发送告警通知。告警
12、事件会长久保留。考虑到对被监控设备及软件系统影响,采集时间间隔不易过短。综合监控效果及性能影响等原因,设置为1分钟比较适宜。用户能够自行修改时间间隔配置。除了实时监控数据外,其它数据所需磁盘容量有限,关键考虑是数据表定义。第3章 软件系统设计3.1 系统概述我企业IT运维综合监管系统软件是一套优异IT运维管理系统,能够对XXX大厦(上海)进行统一管理,包含IT资源管理、IT机房三维仿真交互、网络管理、监控管理、维护管理、统计分析、权限管理等。经过该系统,能够实现对机房精细化、可视化、标准化、实时化、透明化管理,有效提升XXXIT信息化管理水平,助力XXXIT信息化建设,提升XXX节能减排水平,
13、实现XXX绿色机房目标。本系统采取C/S方法。系统后台服务基于Windows Server运行,.Net 3.5框架及以上版本;数据库支持Oracle 10G,采取C#开发。系统C/S用户端基于Windows 7运行,采取C#开发。系统基于Windows Visual Studio 进行开发,采取C#/WCF/WPF等技术进行开发。系统开发遵照CMMI及ISO9001相关软件步骤。考虑到未来还可能要增加其它系统模块,所以应用系统开发设计必需基于项目运行环境要求并充足考虑可扩展性。3.2 关键技术应用3.2.1 基于C/S架构C/S 结构,即大家熟知用户机和服务器结构。它是软件系统体系结构,经过
14、它能够充足利用两端硬件环境优势,将任务合理分配到Client端和Server端来实现,降低了系统通讯开销。现在大多数应用软件系统全部是Client/Server形式两层结构,因为现在软件应用系统正在向分布式Web应用发展,Web和Client/Server 应用全部能够进行一样业务处理,应用不一样模块共享逻辑组件;所以,内部和外部用户全部能够访问新和现有应用系统,经过现有应用系统中逻辑能够扩展出新应用系统。系统采取C/S架构,能够对外提供数据接口,同时能够经过SNMP TRAP发出事件告警信息。3.2.2 基于C/S架构三维仿真机房展示、管理功效三维是指在平面二维系中又加入了一个方向向量组成空
15、间系。三维既是坐标轴三个轴,即x轴、y轴、z轴,其中x表示左右空间,y表示上下空间,z表示前后空间,这么就形成了人视觉立体感。三维建模技术WPF缩写为Windows Presentation Foundation缩写 ,其原来代号为“Avalon”。WPF是微软新一代图形系统,运行在.NET Framework 3.0架构下,为用户界面、2D/3D 图形、文档和媒体提供了统一描述和操作方法。基于DirectX 9/10技术WPF不仅带来了前所未有3D界面,而且其图形向量渲染引擎也大大改善了传统2D界面,比如Vista中半透明效果窗体等全部得益于 WPF。WPF相对于Windows用户端开发来说
16、,向前跨出了巨大一步,它提供了超丰富.NET UI 框架,集成了矢量图形,丰富流动文字支持flow text support,3D视觉效果和强大无比控件模型框架。基于WPF技术,对3D机房进行建模,其中包含3D模型库设计开发、3D对象抽象类构建、3D对象事件处理机制设计开发、对象数据抽象类构建等。依据不一样类型IT设备特征,进行3D建模,除3D外形外,关联前后面板图片,同时关联事件处理方法,如显示属性、复制粘贴、旋转、3D定位等功效。一个好系统,友好便捷用户界面是很关键。因为企业IT资源天生所含有复杂特征,怎样将IT资源展现给用户是很多软件企业一直在探寻。3D机房概念,早在就由微软提出来了。当
17、初微软为了推广其WPF三维展现技术,开发了一个演示版3D机房管理系统,在当初引发来广泛关注。然而,因为相关技术不成熟,到现在为止,还没有一款类似产品出现。以3D机房形式来管理IT资源,并不仅仅是锦上添花。经过对真实机房三维仿真,能够对整个机房布局一目了然;在三维机房中,能够对机房布局进行计划,从而达成合理利用机房空间效果;经过在三维机房中整合多种信息,使得使用人员能够以最快捷方法获取各类信息,如设备信息、告警信息等;经过操作模拟设备来实现对IT设备及系统信息管理,如日常维护、属性变更、日常巡检等;经过3D定位功效,能够随时随地正确快捷地在三维机房中定位某个设备,真正处理了很多企业用户面临设备定
18、位问题。机房管理人员关键日常工作是对机房巡查。通常做法是管理人员天天按时进入机房,对机房内部设备及环境进行巡视。这种巡查方法缺点是花费人力,而且达不到很好巡查效果,往往发觉不了潜在部分问题。经过机房三维仿真、大屏幕自动展示、视频图像结合、设备环境监控信息集成,能够确保IT管理人员在大屏幕面前就能够掌握机房内部全部细节,实现了足不出户,全方面掌控机房目标!系统经过全屏自动播放方法,逐一显示3D机房内各个设备实时信息,如设备名称、CPU利用率、硬盘利用率、内存利用率等。同时,将环境温湿度信息、多种告警信息叠加到3D显示界面上,使IT管理人员不需要置身机房,就能够实时获取IT机房全貌。用户能够经过系
19、统界面来定义展示方案,包含哪些机房哪些设备参与展示,展示方法等。图表3:三维机房仿真3.2.3 分布式监控和自动负载均衡在70年代计算机网络出现之前,信息处理采取集中式处理或分散式处理。集中式处理把各信息包含远程信息全部传输到统一信息处理系统中进行处理。采取集中式处理能够达成设备利用率高目标,并能确保被处理信息完整性和有效性。一个下设很多工厂企业采取集中式信息处理能够得到整个企业最好结果,不像各工厂分散处理那样,考虑只是每个工厂优化。集中处理需要设备比分散处理所用设备复杂得多,但它可为大部分工厂所共享,避免设备反复。分散式处理最大优点是简单,能就地提取数据、变换格式并进行加工,最终输出决定。要
20、把这些工作集中于统一程序中是很困难和代价昂贵。分散程度越大,满足部门特殊信息处理要求可能性也越大,但统一和控制信息流困难也越大。因为要求在数据产生场所进行局部处理数据比重不停增加,要求应答时间缩短和计算机处理能力不可能无限增强等原因,常把分散设置各计算机组合成计算机网,形成份布式处理系统。这么既能克服分散处理缺点,又可避免集中困难。70年代以来,伴随计算机日益广泛地应用于各个领域,全国性和国际性计算机网相继出现,这种信息处理系统功效和结构也越来越复杂。分布式处理将装备从集中处理系统中分散开来,便能直接从信息源取得信息并进行相互协调处理。因为IT机房设备多、类型复杂、监控指标多等特点,要求信息系
21、统运维管理平台能够实时并发处理大量监控数据。这些指标包含服务器、交换机、路由器、防火墙、KVM、磁盘阵列等。要实现实时并发处理大量监控指标,需要在信息系统运维管理平台架构设计上充足采取分布式监控和自动负载均衡技术。系统由应用服务、监控服务、代理程序、用户端组成,其中监控服务负责监控多种指标。为了应对海量监控数据,监控服务理论上能够分布式布署任意多个实例。每个监控服务实例能够配置监控指标。比如,监控服务实例A能够监控服务器性能指标,监控服务实例B能够监控数据库和中间件性能指标,而监控服务C能够监控机房环境温湿度等信息。另外,为了降低对中心数据库压力,每个监控服务在当地缓存一定时间监控数据。用户端
22、在请求实时监控数据时能够从对应监控服务实例获取,这么大大减轻了对应用服务和后台数据库访问压力。同时,也使系统对网络带宽占用降到最低。XXX(上海)软硬件环境是动态改变,这就要求运维系统能够自动适应这种改变。比如,增加了一台服务器,运维系统能够自动将其分配给某个监控服务实例。假如某个监控服务实例退出,系统会自动将该监控服务实例负责监控指标转移到其它监控服务实例上,实现平滑切换。在批量购进新资产后,能够经过增加监控服务实例方法自动进行负载均衡,避免出现某一个监控服务实例负担过重,影响监控任务情况发生。IT运维综合监管系统体系结构是一个C/S模式。其中,基于C/S用户端软件;服务层包含负责性能监控监
23、控服务和应用服务。应用服务是系统关键,负责数据库连接管理、元数据管理、多种用户权限控制,事件通道、监控服务负载均衡调度管理等。数据层采取Oracle 10g或以上,为整套系统提供永久数据存放服务,另外还有若干配置文件,用于系统配置参数存放和网络设备特征数据存放。系统包含IT资源管理、环境监控、设备监控、网络管理、系统管理、三维机房仿真视图及交互、三维快速定位、性能监控、事件管理、配置管理、统计分析、日志管理、用户管理、权限管理等,实现了系统关键功效。技术框架采取微软.Net框架,远程对象访问采取微软WCF技术,三维技术基于微软WPF技术。系统支持两种数据接口:WCF远程对象接口和标准数据接口。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IT 关键技术 专项 方案
限制150内