数据中心监控系统技术白皮书.doc
《数据中心监控系统技术白皮书.doc》由会员分享,可在线阅读,更多相关《数据中心监控系统技术白皮书.doc(122页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、#+For personal use only in study and research; not for commercial use数据中心监控系统技术白皮书Data Center Monitoring SystemTechnical White Paper中国工程建设标准化协会信息通信专业委员会数据中心工作组2013年10月序言为促进数据中心的技术发展,2012年X月,数据中心工作组开始编制数据中心监控系统技术白皮书。在编写过程中,编写组根据国内外相关技术标准规范的要求,进行了多次专题研究和调查分析,广泛征求各方面的意见,总结归纳国内外数据中心XXXXXXX的实践经验,经多次修改和专家
2、审查,于201X年X月定稿。本白皮书作为数据中心建设的参考文献,技术内容的解释由中国工程建设标准化协会信息通信专业委员会数据中心工作组负责。在应用过程中如有需要修改和补充的建议,请将有关资料XXXXXX主编单位:共济科技有限公司参编单位:银联结算上海数据中心课题技术负责人:钟景华主编:易南昌参编:丁波饶云飞林德昌徐康华刘晓彬审核:排版与文字校对:张莹目 录/CONTENTS1 引言/INTRODUCTION41.1 编写目的/purpose41.2 适用范围/scope41.3 编写依据/reference41.4 编写原则/principle52 数据中心分级与分类/DATA CENTER
3、CLASSIFICATION62.1 概述/general62.2 数据中心等级/data center tier62.3 数据中心类别/data center class72.4 数据中心规模/data center scale82.5 系统匹配设计基本原则/basic system design principle83 系统架构与功能/SYSTEM ARCHITECTURE & FUNCTION103.1 概述/general103.2 系统架构/system architecture103.3 系统功能/system function153.4 系统性能/system performan
4、ce223.5 系统集成/system integration224 系统基础构件与技术/SYSTEM BASIC MODULE & TECHNOLOGY384.1 概述/general384.2 软件系统基础构件/software basic module384.3 硬件系统基础构件/hardware basic module495 系统设计/SYSTEM DESIGN545.1 设计概要/general545.2 设计原则/system design principle545.3 系统设计需求分析/system requirement analysis555.4 监控管理需求分析/moni
5、toring management requirement analysis555.5 需求分析其他相关问题/miscellaneous615.6 系统架构设计/system architecture design625.7 系统功能设计/system function design715.8 系统性能设计/system performance design755.9 设备选型/equipment selection776 工程实施/IMPLEMENTATION836.1 工程实施概述/general836.2 前期准备/preparation836.3 现场实施/implementation
6、 & deployment846.4 验收交付/delivery & acceptance927 总控中心场地建设/ECC CONSTRUCTION957.1 概述/general957.2 总控中心的组成/ecc constitution957.3 总控中心的场地设计/ecc site design967.4 总控中心的工艺设计/ecc process design977.5 总控中心的施工技术要求/technical specification988 发展趋势/TREND1018.1 发展回顾/overall review1018.2 顶层设计/top-level design1018.3
7、 监控管理技术发展/development of monitoring management technique1028.4 监控管理系统与绿色数据中心/monitoring management system & green data center1038.5 实用技术的应用/pratice of related technique1049 名词解释/GLOSSARY1111 引言提高现代数据中心可用性与降低运营管理成本是数据中心管理永恒的主题。数据中心监控系统(下称监控系统,无歧义的地方称系统),能够帮助管理者增强数据中心可用性、提高运维效率并降低运维成本,是现代数据中心必不可少的监控管理
8、信息化工具,在数据中心的运行、维护、管理中,发挥着越来越重要的作用。数据中心监控系统技术白皮书(下称白皮书)将依据国家相关规范,参照国际相关标准与行业最佳实践,定义系统概念、界定系统范围、描述系统架构与构件、介绍系统功能、确立性能指标、规范设计与施工方法。白皮书也对监控管理系统及相关技术的发展趋势作了简要介绍。1.1 编写目的白皮书基于标准,又泛于标准、细于标准。本白皮书的目的在于为现代数据中心监控系统规划、设计、建设、维护、使用人员提供参考资料,也为行业人员进行国内外技术交流提供相对统一的语言范本。1.2 适用范围监控管理系统是数据中心运行维护人员必不可少的自动化、信息化工具,是数据中心规划
9、、建设、必不可少的部分。本白皮书可供数据中心监控系统的新建、改建、扩建工程的技术选择、规划设计、工程实施、运行管理以及系统开发等相关人员参考。1.3 编写依据白皮书是以国家相关标准规范为依据,结合了我国行业现状,参考国际相关规范与行业发展趋势,由多位行业专家编制完成的。主要参考文件有:电子信息系统机房设计规范GB 50174-2008电子信息系统机房施工及验收规范GB 50462-2008 电子计算机场地通用规范GB/T 2887-2011供配电系统设计规范GB 50052电能质量供电电压偏差GB/T 12325建筑物电子信息系统防雷技术规范GB 50343低压配电设计规范GB 50054建筑
10、设计防火规范GB 50016计算机和数据处理机房用单元式空气调节机GB 19413-2010采暖通风与空气调节设计规范GB 50019-2003民用建筑电气设计规范JGJ/T16-2008 Telecommunications Infrastructure Standard for Data CentersTIA942Data Center Site Infrastructure Tier Standard1.4 编写原则实用性原则数据中心是极其复杂的监控管理对象。本白皮书不可能包罗万象、面面俱到,但将按照数据中心不同类型、不同等级、不同规模、不同发展阶段(建设管理阶段)的现实需要,尽可能完整
11、地描述系统主流的、典型的软硬件功能模块、设备与设计,尽量做到能对数据中心基础设施的监控管理相关工作发挥实际指导作用。先进性原则IT技术发展迅速,信息化社会对数据中心的可用性要求也在迅速提高,数据中心管理理念、方法及其信息化技术也在不断推陈出新,数据中心相关的新的管理方法、技术往往能更有效地解决问题。监控管理系统适度超前的设计是数据中心监控管理的实际需要。白皮书将适当介绍相关领域比较前沿的技术与设计方法。2 数据中心分级与分类2.1 概述监控管理系统是数据中心监控管理信息化工具,因此其设计应该与数据中心管理目标、体系与架构相适应、相匹配,这需要我们梳理数据中心的分级与分类。数据中心(DC)是一个
12、安装有场地设施、IT设施与系统,能实现数据的集中处理、存储、传输、交换、管理的场所,是信息系统的核心节点。数据中心可以由具有多个机房模块的楼宇群组成,也可以是一个建筑物中独立的物理空间(俗称机房)。数据中心按规模有大小之分,按用途有类别之分,按重要性(可用性)有等级之分。监控管理系统需要根据数据中心的大小、重要性、类别(管理属性)等进行匹配设计。本章节将继承GB 50174-2008电子信息系统机房设计规范对数据中心基础设施分级的定义,参考国际相关标准,并结合数据中心的其它特性,对不同种类的数据中心进行分级、分类说明,以便在随后的章节中对应不同级别与种类的数据中心介绍不同设计与配置的监控管理系
13、统。2.2 数据中心等级我国GB 50174-2008电子信息系统机房设计规范按机房的可用性将机房分为A、B、C三级,国际数据中心相关研究机构Uptime Institute数据中心场地设施等级标准(Data Center Site Infrastructure Tier Standard)与TIA 942数据中心电信基础设施标准(Telecommunications Infrastructure Standard for Data Centers)把机房可用性等级分为四级,国内外数据中心等级对照如表2.2-1。对于按照国标GB 50174-2008设计的数据中心,系统可用性将按ABC三级匹配
14、设计;对于参照国际标准设计的数据中心,系统可用性则应按四级匹配设计。表2.2-1 机房可用性等级定义GB 50174-2008冗余度级别定义(GB)可用性描述国际标准 A容错1、电子信息系统运行中断将造成重大的经济损失;2、电子信息系统运行中断将造成公共场所秩序严重混乱。该级别数据中心具有多重的、独立的、物理上相互分隔的冗余设备与线路,各设备与线路并行工作,无单点故障,所有计算机设备都具备双电源并按照场地架构拓扑连接。制冷系统也要求不间断工作。Tier 设备与线路冗余该级别数据中心具有冗余设备与线路,所有计算机设备都具备双电源并按照场地架构拓扑连接。Tier III只要求任何时刻有一条线路被使
15、用。Tier B冗余1、电子信息系统运行中断将造成较大的经济损失;2、电子信息系统运行中断将造成公共场所秩序混乱。该级别数据中心具有冗余设备,但是所有设备仍由一套线路系统相连通。Tier C基本满足需求不属于A 级或B 级的电子信息系统机房应为C 级。该级别数据中心满足数据中心运行所需的基本需求,无冗余。Tier 2.3 数据中心类别数据中心按照服务的对象主要分为两大类:一类是企业数据中心(EDC),另一类是互联网数据中心(IDC)。EDC包括金融、电力、石油、研究院等企事业单位的数据中心和政府的数据中心(GDC)。该类数据中心主要特征是由机构自建、自管、自用,且主要使用自建或租用的网络资源组
16、成相对封闭的私有广域网络(俗称内网)为本单位的业务与管理提供信息化支撑平台,不盈利或不直接盈利。当然,越来越多的单位也会通过互联网(俗称外网)为其业务服务对象提供安全访问入口。在我国,这类数据中心以前更多地被称为“信息中心”。小型组织可以有一个数据中心,大型组织往往因为业务或管理范围覆盖全国甚至全球,其信息系统通常包含分布于不用地域具有一定管理层级关系的多个数据中心。与管理架构(决策层、管理层、执行层或三层网络架构)匹配,EDC与管理层级对应可分为数据中心、数据分中心或一级、二级、三级数据中心等。随着信息共享要求的提高,数据大集中成为趋势。相应地,较大型组织EDC通常匹配组织管理架构,呈金字塔
17、形分布,越往组织的低层,机房规模越小,数量越多,或反之。IDC是互联网营运企业建设的数据中心。该类数据中心主要特征一是主要面向企业以出租各种数据中心相关软硬资源而盈利为目的,如机房场地、网络、存储、计算等资源出租,并提供IT设备托管等Iaas服务业务,以及IT系统运行监控、维护、运维管理等相关增值服务;二是IDC租户主要面向公众用户提供基于互联网的信息服务。中国拥有IDC的企业主要有两类,一类是拥有网络(有线、无线)资源的电信营运商,另一类是第三方IDC服务商。表2.3-1EDC与IDC数据中心分层对比表EDCIDC“中央”级信息中心数据中心(可含多栋楼)“省级”数据中心楼栋(可含多个机房)“
18、地市、区级”数据分中心机房(独立物理空间)“网点”(业务集中受理点)级机房微模块、虚拟机房、机柜表2.3-1说明:1、 “中央”级信息中心的规模可能是很大的,如各大银行总行信息中心也会由多栋建筑多个机房模块组成,此时EDC既有跨地区联网管理的层级关系(“中央”级、“省级”、“地市、区级”、“网点”),其“中央”级大型数据中心也有如单个大型IDC分层管理的层级关系。2、 在中国,目前中小型组织自建的为自身业务信息化服务的小型数据中心数量相当多。这些数据中心层级结构很简单,可能接入机房都没有,用户通过散布的交换机直接接至机房。相信随着社会诚信度与网络安全技术的提高、数据中心运维成本压力的加大,这类
19、组织将成为IDC的用户而不再自建机房。2.4 数据中心规模按面积,数据中心大致可以分为超大型、大型、中大型、中型、小型数据中心(如表2.4-1)。通常IDC以大型、超大型为主。而小型、超小型数据中心主要是机构的接入层机房(比如银行、证劵的网点机房、政府各部门服务窗口),汇聚层机房(多个接入层机房的汇聚)等。超大型数据中心可由多栋建筑组成,每栋建筑包含多个机房模组(独立物理空间),每个机房包含多个微模块、虚拟机房、列。数据中心监控管理的最小管理域可达机柜。多个机房模块组成的超大型数据中心可以由不同等级的机房组成,这样可以以相对合理的建设与运维成本满足用户对不同可用性等级的需要。表2.4-1数据中
20、心规模划分数据中心规模使用面积(平方米)值守情况小型数据中心小于200酌情值守中型中型200-500基本24小时值守中大型500-200024小时值守大型大型2000-1000024小时值守超大型大于1000024小时值守另外,数据中心的值守模式也影响监控管理系统设计。根据数据中心的重要性程度与运行管理成本,通常独立的小型、超小型机房基本上不会安排现场值守,中型数据中心一般会根据业务需要安排值守,联网管理的数据中心群、大型、超大型数据中心都会安排24小时值守(如表2.4-1)。随着信息化应用的深入,人们的工作、生活对信息化系统依赖程度的进一步增强,通过24小时实时监控与及时的维护来保证中小型数
21、据中心的可用性成为必然。有些企业已经开始依托监控管理系统提供远程监控值守与运维外包服务,较好地解决了中小型数据中心运行值守要求与运维成本的矛盾。2.5 系统匹配设计基本原则2.5.1 系统与数据中心可用性等级匹配设计原则系统的可用性设计应与数据中心基础设施的可用性等级相匹配,原则上监控管理系统的可用性设计应该不低于该数据中心基础设施的可用性等级。如对于A级机房,监控管理系统也应该设计成容错的。同一个数据中心,不同业务的机房按其重要性也需要按不同可用性设计,相应地基础设施监控管理系统的可用性也应匹配设计。如IDC为满足租户对可用性不同要求,会按机房模块、微模块设计不同可用性;2.5.2 系统与数
22、据中心类别匹配设计原则 不同类别(服务对象)的数据中心,系统设计也有不同,其架构、功能等都要针对性地匹配设计。如IDC管理主要具有局域特征,而EDC除具有局域特征外,还具有广域特征,即分级监控管理或全国(跨地区)统一(联网)监控管理;IDC围绕商业目的开展运营管理,EDC围绕保证组织的业务运作开展运行管理,两者的管理重点也不相同,因此其系统设计与管理功能模块匹配是不尽相同的。2.5.3 系统与数据中心规模匹配设计原则 数据中心规模不同,监控管理系统设计方案也不同。数据中心规模与可用性要求有一定关系,一般规模越大,数据集中度高,影响面大,可用性要求也越高(需要说明在大型、超大型数据中心,不同机房
23、模块的可用性等级设计可以根据业务或市场需求而有所不同);数据中心规模越大,监控对象越多,对监控系统的处理能力要求越高。对于中大型数据中心,一般标配总控中心系统,有24小时值班安排;而对于小型特别是超小型机房,则往往是组织的接入层机房而只需进行采集信息,重要的可以使用24小时监控值守外包服务(一种由服务商通过VPN网络提供的远程监控职守服务)。3 系统架构与功能3.1 概述监控管理系统是数据中心工作人员的信息化工具,系统架构设计应考虑与数据中心组织管理架构相对应,以便相关人员履行岗位职责,系统功能必须满足数据中心工作人员对数据中心进行监控、维护与管理的需要。监控管理系统应用计算机软件技术、网络通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 监控 系统 技术 白皮书
限制150内