欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据中心运维手册.docx

    • 资源ID:73471442       资源大小:155.50KB        全文页数:42页
    • 资源格式: DOCX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据中心运维手册.docx

    数据中心基础运维手册数据中心基础运维手册如今,随着数据中心容量的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在 加大。但是,无论如何,提高数据中心性能、降低数据中心能耗、降低数据中心运维成本始终是数据中心管理人 员的终极目标。具体来讲,如何做好数据中心冷却?如何保证数据中心电源系统稳定高效的运行?如何对数据中 心实现“绿色”运营?如何对数据中心网络进行监管,并保证数据中心的网络性能?这一切都是摆在数据中心管理 人员的难题,本技术手册将对这些问题进行解答。数据中心冷却数据中心服务器和关键设备时刻受到以温度过高为代表的各种威胁,这些威胁常常使得工程师和IT技术人员 夜不能寐、寝食难安。尽管大家都有广泛的防范意识,但要找到一个长期有效的解决办法也并非易事。数据中心冷却策略:如何防止服务器过热? 优化数据中心的冷却水生产提高数据中心水冷却装置的冷却容量数据中心电源管理过去的一年中,许多数据中心管理员的设备出现了电源问题,这很让人担忧。当然,我所指的问题并不是设 备组件的失效,而是指数据中心IT架构的电力供应无法得到保障。有些人在这个问题变成灾难之前就有所注意, 而有些人却因为负载过重而经历了数据中心的供电中断事故。使用双电源服务器提供2N冗余如何确定全新UPS(不间断电源)单元的规格如何使用UPS负载总线同步控制器?如何在UPS维修期内维持设备的正常运行? 如何防止数据中心电力中断用SNMP工具来监控数据中心电源和冷却设备数据中心能耗管理如今的数据中心正面临着一个异常现实而又紧迫的问题:能源危机。导致这一问题的罪魁祸首是服务器和交 换机,尽管说如今的服务器和交换机的规模要比之前小的多,但能源消耗量却在大幅增加。如何战胜数据中心能源危机如何通过空气通道控制来降低数据中心PUE 数据中心绿化 结构管理至关重要如何利用电费分摊模式降低数据中心能源消耗(上)如何利用电费分摊模式降低数据中心能源消耗(下)数据中心网络监管在数据中心中,最至关重要的一项任务是对网络设备、服务器和数据中心本身的监控。大部分相关规划都集 中在选择有效的监控解决方案和持续的数据中心网络设备管理办法方面。一个有效的监控方案对于数据中心网络 维护显得至关重要。如何监控和管理数据中心网络? 管理虚拟网络关系服务器虚拟化环境中网络性能和吞吐量数据中心冷却策略:如何防止服务器过热?服务器和关键设备时刻受到以温度过高为代表的各种威胁,这些威胁常常使得工程师和IT技术人员夜不能 寐、寝食难安。尽管大家都有广泛的防范意识,但要找到一个长期有效的解决办法也并非易事。虽说业界已尝试过统一数据中心冷却方法,如标准化热或冷通道机柜布置,VUF(vertical underfloor)和VOH(vertical overhead)通风系统等等,但我们要做的还有很多。为了帮助大家尽可能降低风险,进一步改进这些标准做法,以便它们能长期发挥作用,下面将介绍一些具体 策略:灵活设计:鉴于大多数关键任务设备在使用生命期中都会经历4到5次计算机设备彻底更换,所以我们需要 对它们进行灵活的设计,既要保证升级过程中的成本和风险最低,又要保持连续正常的运行时间。灵活设计的关 键是多方面的,其中包括安装大号的管道、为额外的计算机和机械电子设备安装留有富余空间等等。设计过程中的交流:在规划机房布局时,IT人员一定要与设计工程师交流,以便他们能够更好地了解如何应 用热通道和冷通道策略布局设备机架、如何布置多孔板以优化冷气分配。此外,通过交流还可以帮助IT人员了解 会长期存在的空间限制。利用出版的指南:为了协助大家进行空间规划、估算负载增长和机械电子系统设计,行业的某些集团已经开 始发布全球性标准了,如American Society of Heating,Refrigerating and Air-conditioning Engineers(ASHRAE),7×24 Exchange和Uptime Institute等。这些指南迈出了更高标准数据中心设计的第一步。利用计算流体力学(CFD ):CFD模型可以通过如下方式得到应用:设计工程师通过输入物理空间描述来对机房进行描述,其中物理空间描述包括墙壁、天花板、活动地板、设备布局和设备负载。然后,CFD软件会将机房空间分隔为几百万个“小单元”。然后,CFD软件会通过迭代过程同时计算出每个单元的能量、质量和动量守 恒方程式,输出的结果是每个小单元的温度、压强和速度等状态。人们对这个过程中的物理学和数学非常清楚, 可以帮助我们对实际应用提供良好的预测。CFD模型不仅可以在数据中心的初始设计阶段发挥重要的作用,还应该在设备的整个生命周期中得到应用从初始设计到各种升级和扩展,主动防止设备过热和停机的发生。开发替代性系统设计和布局:为了减少冷通道中的热点(hot-spot),数据中心设计还必须有替代性设计 和布置,比如除了CFD分析以外还应有置顶空气分配(overhead air distribution)和组合气流处理设备等。要对各个替代性系统设计进行比较,最好使用几个测量指标来衡量冷却系统的有效性。惠普公司开发的SHI(Supply Heat Index)和RHI(Return Heat Index)可以帮助大家记录热气流再循环进入冷通道的情况和回流入空气调节单元的冷气量。此外,Magnus Herrlin开发的RCI(Rack Cooling Index)还可以帮助我们评估冷却系统是否适合特定的环境。尽管设备过热的威胁在IT领域依然存在,在设计更加标准化和成本高效性的数据中心的过程中,本文介绍的 这五个步骤占有不可或缺的地位。来源:数据中心世界 (作者:Christopher Johnston,Vali Sorell )优化数据中心的冷却水生产对于数据中心冷却,Mike Flaherty提出了优化冷却水生产的概念。本系列共有三部分,本文为第一部分, 重点强调了水冷却系统配置、控制策略和设备选择等的优化。尽管没有人使用汽油进行冷却,但4美元每加仑的价格应该让所有数据中心人员吃惊。自由市场下的所有不 可再生能源价格是相互关联的,大多数数据中心用于冷却的煤、石油、天然气等的价格也有所上升。服务器消耗的每吨冷却水都是由水冷却系统生产的,如果要节省成本,就既要减少冷却需求,也要提高冷却 水生产效率。如果这些道理你都熟记于心,你可能会感到疑惑:“为什么绝大多数技术发展和贸易的媒体报道都只针对减 少冷却消耗,却很少注意如何提高生产冷却水的效率?” 本系列将探讨这个被忽视的方面并提出一些解决方案, 帮助大家减少电力消耗(每吨冷却水耗电量减少0.1到0.4千瓦)。很多水冷却装置每年生产5百万以上吨小时(ton-hour)冷却,当这个量不能满足实际的冷却需求时,如果 能够提高生产的效率,原本需要的额外冷却投资可能得到大大的推迟,甚至不用增加任何冷却投资就可以满足现 在的冷却需求。提高水冷却生产效率要提高水冷却装置的效率,需要注意以下三个方面:管道配置或循环水冷却装置;控制系统和控制策略;机 械设备选择。这三个方面都共同带来0.1到0.4千瓦的节约量,而且它们所能带来的节省量会受到水冷却装置的 原始设计、控制策略、当前操作方法和设备条件等因素的影响。水循环装置:水冷却装置一定要用能源利用效率高的管道设计来连接各冷却器、水泵、冷却塔和CRAC,而 且管道设计一定要最大限度地利用节约装置进行自然冷却。遗憾的是,大多数冷却水系统使用的都是过时的P/S(primary/secondary)模型。这个模型是二十世纪七十年代开发的一种方案,当时冷却器需要有恒定的蒸汽 流,电费1千瓦只收1分钱,所以节约装置不用太重视。到了二十世纪九十年代中期,冷却器改进了,可以处理变速流(variable flow),所以VP(variable primary)模型应运而生,更好地利用了VP设计低初始成本的优势。从那以后,很多聪明的人发现VP流系统比P/S系统更 加节约能源,因为VP系统最大限度地利用了冷却水的温差(T),从而降低了水泵的耗能、优化了冷却器的装 载。他们还发现,在天气较冷的时候使用户外空气进行冷却可以最大限度地利用节约装置。因此,如果你想要冷 却水系统变得高效一些,一定要使用VP装置,最大限度地利用节约装置进行免费冷却。控制策略:通常,水冷却装置都是按照传统的操作顺序进行操作的。这样的操作顺序设计时只考虑了如何满 足冷却需求,只是尽量多的生产冷却水而没有考虑生产效率的问题。因此,这样的控制程序只是由简单地由“如 果,那么”逻辑和固定的设定点构成,唯一的程序调整仅限于工作人员的修补工作。要获得高效的冷却生产,就要坚持最优化操作顺序以最低的耗电量满足冷却需求。控制程序使用合适的 算法自动持续地调整设备操作也同样重要,好的控制程序应该能够根据实际负载和实际情况对设备进行调整。不 用多说大家也会明白,这里所推荐的操作次序和控制技术比较复杂,但并不是所有人都应遵循的准则,所以大家 要详细咨询顾问工程师和控制承包商,以免陷入标准式的模式。设备选择:如果你已有一个高效的管道装置和控制系统,那么剩下的三个设备决策也会让你的水冷却装置与 众不同:离心式冷水机代表了初始成本、电能消耗和可靠性三者的最佳平衡变速冷却塔不仅散热快而且耗电量最低CRAC/AHU线圈上的双向、高性能旋转阀提供了必要的压力范围和关闭压力,可以对所有系统负载和压力 进行合理控制。下文:优化现有水冷却装置本文的一些建议仅仅局限于一些新建的水冷却装置,很多现有的冷却装置已经成功地进行了翻新,改进了循 环装置、控制和设备等。在本系列的下文中,我们将重点讲解如何翻新现有的冷却装置,帮助节省电能损耗。来源:数据中心世界 (作者:Mike Flaherty )提高数据中心水冷却装置的冷却容量在不久前的AFCOM大会和Data Center Decisions会议上,很多专家都探讨了数据中心容量(capacity) 限制的问题以及它对新设备的影响。处理器能力、电源功率、冷却场所空间等任何容量限制因素都会导致新的设 备需求。如果能更充分地利用现有设备的容量,可能你就不用投入新的设备了。在会议上,IT专家们探讨了如何更好地利用服务器和房地产,也有一些业内人士谈及了占地空间方面的策略,但没有任何人涉及到数据中心的另一关键资源:冷冻水循环装置(CHW)。有意思的是,尽管根据经验大多数 冷却装置经常处于未充分利用状态,冷却容量限制却往往成为新建数据中心的原因。因此,冷却容量也是数据中 心的一个关键考虑因素。即使暂时不会受到容量限制,提高水冷却装置效率也可以降低运营成本。CHW冷却基本原则冷却生产量与两个量成比例:通过冷却器的水的流速和水流进出冷却器前后的温差。用数学表达式表述为Tons = (Q * T)/ 24,其中Q(单位为GPM)为每分钟通过冷却器的水量(加仑),T单位为华氏度。要确定CHW的冷却容量是否充足,只需对比一下“安装容量”和“实际最大容量”即可。安装容量是指冷却器 的总额定吨位数,实际最大容量可以根据Q*T关系计算得出。总之,如果安装容量远远小于计算得出的实际最大容量,则需要考虑更新如下的CHW,如果安装容量足够, 也可以考虑一下降低耗电量。效率低下的CHW装置T是评估冷却装置容量和性能的关 键参数。尤其是较低的T,几乎每个CHW系统都会存在。如果水流返回到冷却器时没有吸收足够的热量,就会导致T比较低。由于水流离开冷却器时的温度是恒定的,所以实际T会比设计的T要小一些。热能方程式(Q×T)可以告诉我们为什么低T会对CHW容量和效率产生不良影响。一个冷却器的冷却产出是和Q×T成比例的,所以产出的而定吨数要视设计的T与设计的水流量(Q)而 定,或者增加水流量来抵消低T。但是,由于在通常的循环装置中CHW的水流量是不变的,所以实际 最大容量与T成正比。因此,我们就不得不启用备用冷却器来帮助现有冷却器来满足冷却需求。如果 没有多余的备用冷却器,现有装置就已经达到了它的实际最大容量了,尽管它还有一定的容量是可用的。 冷却容量实际上已经丢失了。考虑到普通冷却装置的安装成本,每吨冷却大概要花费1000美元,太昂 贵了。无论什么时候,只要安装的冷却器(以及水泵和冷却塔)数量比必需数量多,低T都会增加每吨冷却的耗电量。这种情况对耗电成本的影响尤为重要,因为在高负荷期间经常会运行过多的设备。系统的T过低还会导致同样的冷却需要更多的水流量。Q×T关系告诉我们,如果实际的T是设计的T的一半,那么就需要两倍的水量。由于泵能是和水的立方数成比例的,那么两倍的水就需要八倍的泵 能。下面是你可以采取的一些减少电能浪费的措施。图2是采取这些措施之后的样子。恢复丢失的容量,降低耗电量有的人在冷却容量不足时花钱增加了新的设备,而实际上他们可以解决T过低的问题,从而恢复丢失的容 量。他们并不知道,导致容量限制的两个根本原因是可以轻松解决的:传统的水循环装置设计需要保持恒定的冷却水流,因此CHW的产出也是恒定的。所有多余的冷却水都会流 通到分离器(decoupler)路线,然后与从机房空调(CRAC)路线返回的热水混合。这次混合会降低 返回水的温度,从而降低T。CRAC和AHU(空气处理机组)控制阀会确保有足够的水流量流经线圈(coil),而不是确保合适的水流量。 只有控制阀可以控制水流量与热量的合适比例,才能够让热交换变得高效。渗漏线圈控制阀(leaking coil control valves)让多余的冷水通过,进一步降低了系统的T。因此,要增加最大可用冷却容量和降低耗电量,可以从减少CHW直通道开始,CHW直通道降低了系统的T。如下三个步骤至关重要:替换渗漏线圈控制阀首先从最大的CRAC开始,检查进出水流的温度,并与规范水温相比较。如果通过线圈的T比规范T高两 度,那么水流量就太多了,应该替换控制阀。不要使用低质量或错误类型的控制阀,要使用高质量、高变化幅度、 防气泡的阀门,你会发现T比设计的T还高。高性能的回转阀会在规范和价格之间进行绝佳的平衡。消除分离器水流由于在多数系统设计中CHW水流都会流经分离器,所以解决这个问题就需要将基本的循环模型修改为VP装 置。如今,VP是人们比较倾向的一种方法,因为它降低了初始成本(本系列第三部分的话题)。不过,在翻新P/S系统时VP比较受欢迎的关键是它的高效性和对容量的影响。幸好,多数现有系统转换为VP模型只需要几步机械修改即可,其中包括:在分离器线路中安装调节阀(modulating valve) 在冷却器中安装隔离阀(isolation valve)在冷却器蒸发器上安装DP传送器(transmitter)采取合适的控制策略消除直通水流和安装调节阀后,首要水泵(primary pump)和第二水泵(secondary pump)就是串联的了。在这个更改后的循环线路中,可变速第二水泵(variable speed secondary pump)将单独负责整个循环线路,而首要水泵不再使用。这个更改非常重要,它显然需要一个新的操作控制次序。同时,它也为新的控制 策略打开了一扇大门。在新控制策略中,控制算法会持续自动地进行实时调整,从而有效地生产冷却水。通常, 合适的算法包括:冷却器设定次序优化冷却器的staging或de-staging第二水泵控制通过速度调整减少水泵的总耗能冷凝器水平衡降低塔风扇耗能和chiller lift节约装置优化,最大限度地利用免费冷却操作T更高的CHW 总结由于内在的设计限制、设备规格和实际操作维护条件等因素,冷却装置通常会未充分利用和效率低下。大多 数数据中心业主在降低耗能成本或建设成本时都忽视了改善冷却装置操作的需要。要想最大限度地利用现有的CHW装置,就要寻找造成低T的原因,解决它们,采用合适的控制技术。然后,自然会看到冷却容量提高,耗能降低。来源:数据中心世界 (作者:Mike Flaherty)使用双电源服务器提供2N冗余电源是数据中心的基础要素之一,通常由服务器管理员负责管理。而且,断电或低质量电源是造成数据中心 服务器停机的一大主要因素。这里,我指的不是公用电源故障,而是电源分布系统的操作和管理的通病。在数据中心,有如下几个关键的基本电源组成部分: 公用电源和主电源板备用发电机和自动转换开关(ATS)不间断电源(UPS)和支路维护板(maintenance bypass panel) 电源分配单元(PDU)机架级PDU服务器的内部电源在大多数情况下,服务器管理员都不会涉及到前四项的设计或操作。不过,他们会直接掌管着机架级PDU 和服务器电源。大多数电源故障都发生在这里。双电源服务器的实际情况在关键任务环境下,双电源服务器是比较普遍的做法,它可以提高数据中心的可靠性。然而,尽管服务器管 理员想尽可能地充分利用双电源提高冗余,但有时这些双电源服务器并未得到合理地部署。有时,不合理的操作 实际上反而会降低电源的冗余。在“完美”的安装执行中(如,Tier 4数据中心),应该有两条完全独立的电源线路,每条线路分别由上述6 个部分组成。而且,每条线路必须能够独立承载整个数据中心的负载。这就是我们所说的2N冗余。2N冗余意味 着电源故障绝不会中断数据中心设备的运行。当然,并不是每个人都那么走运能操作一个Tier 4数据中心。尽管我们谁都想拥有完全的电源冗余,但鉴于成本因素,我们通常不得不采取一些折中的做法。由于受到成本预算的限制,所以通常尽管服务器有双电源,但 其它5项却没有两条完全独立的线路。服务器管理员对冗余的理解通常有偏差在本文前面已提到,管理员直接负责服务器和机架级PDU的安装和管理。通常,每个机架只有一个PDU。因 此,双电源服务器的冗余度就仅限于服务器电源本身的故障。然而,更普遍的情况是有两个机架级PDU,服务器的两条电源线分别插到不同的PDU上。这让大多数管理员 有了一种冗余的错觉,实际上其中也隐藏着电源故障的威胁。通常,服务器安装和操作环境的两个机架级PDU都是可用的。当两个电源都正常时,双电源会分担服务器负 载,大概各占50%。当其中一个发生故障或失去电源输入时,剩下的一个电源必须承担100%的负载。因此, 最佳的做法应该是PDU的负载不要超过短路开关的跳闸值。即使每个PDU的负载只占它最大额定负载的60%,也可能会出现问题。实际上,即使PDU有测流计显示负 载达到额定功率的60%,大多数管理员也会以为机架级PDU还可以承载更多的服务器,因为现在“才使用了60% 的功率”。实际上这已经超载了,但很多管理员没有意识到这一点。为什么呢?如果服务器的电源发生故障,那么剩下的电源和PDU就要承担服务器的全部负载。这意味着120%的PDU功率负载会落到剩下的那个PDU身上,短路开关会跳闸,关闭机架内所有设备。这是一个典型的串 联故障。同样,如果添加服务器或其它设备使负载超过其中任何一个PDU的跳闸负载值,也会出现这样的问题。正确地执行双电源服务器要确保双电源服务器和双PDU机架的安全,唯一的办法是不要超过机架PDU额定值的40%。PDU和它的供 电电路必须总是受到断电开关的保护。根据UL和NEMA的规范要求,只有不超过PDU额定值的80%才是安全的。例如,一个额定值为20安的PDU,负载不能超过16安。这就是说,在一个双PDU机架里,所有设备负载不 应该超过16安。因此,每个PDU应该只有8安的负载,以免出现超负荷。现在,很多机架的PDU都没有测流计,有时是因为它们太老式,有时是因为预算不足。不过,即便是有测流 计,有些管理员也不会意识到如果它们负载超过了40%,就会有串联电源故障的危险。另外,由于服务器随时 都有可能更新和添加,所以危险会不知不觉地越来越高,直到问题出现时已为时已晚。从这一点来看,很多人都 误以为它们是“完全冗余的”。如果你有幸能避免这个错误的观点,我建议你检查一下每个机架级PDU的使用情况。如果没有PDU测流计, 可以考虑一下升级。如果你的机架数量较多,那么可以考虑远程监测(通过SNMP或网络)PDU。这可以减轻你 手动监测成百上千PDU的沉重负担。实际上,上述方法适用于电路中的所有部分。总之,在执行冗余时如果要确定当其中一条线路发生故障时另一条线路是否能承担全部的负载,就审查一下 负载结构,主动监测和管理所有PDU的负载程度和电路中其它所有要素。更改PDU布置可能会需要一些停机时间。 不过,和其它任何电路维护一样,如果要实现真正的2N冗余,一定的停机时间可能是必要的。要么是一些计划 内停机时间,要么是意外的断电停机风险,你可以任选一种。(作者:Julius Neudorfer )如何确定全新UPS(不间断电源)单元的规格在你需要创建一个全新UPS(不间断电源)单元的时候,你是不是感觉到很难确定其规格?有些系统是以kW 为规格,而有些又是以kVA为规格的。那么究竟如何对其进行区分并最终确定其规格呢?首先,我们先回顾一些 容易混淆的术语和概念。kW和kVA的意思分别为千瓦和千伏安¬“千”往往被作为前缀来形容更大的数字。根据基本的物理定律,在直流(DC)电路中,“瓦特=伏特×安培”。而通常我们建筑物和设备中用的是交流 电(AC)。因为对于电力公司来讲,交流电输送起来更为高效,损失较少。但当交流电到达设备的变压器之后, 它往往会产生一种电抗(电容和电感在电路中对交流电引起的阻碍作用)特征。从表观功率(volt-amperes)的角度来看,电抗会降低可用功率(瓦特)的数值。我们把这两个数据的比 值称为功率因数(PF)。因此,交流电路的实际功率公式是“瓦特=伏特×安培×功率因数”。然而不幸的是,尽 管说大多数用电设备的功率因数始终是稳定的,但通常只有1.0或是更少,而据我所知功率因数能够保持1.0的 设备只有电灯泡。多年来,大型UPS系统的设计都是基于0.8的功率因数,这意味着100 kVA的UPS电源实际只能支持80 kW 的电力负载。如今,大多数UPS系统还是在继续按这种规格设计,即使现在大多数技术已经能使设备的功率因数 达到0.95-0.98。对于UPS电源来讲,无论是用千瓦来衡量还是用千伏安来衡量,都无法超越其额定的供电能力。然而,目前 市场上也有一些UPS系统的PF值得到了进一步的修正,这使得我们可以将千瓦和千伏安等同看待。UPS系统铭牌上的数据在确定UPS单元的规格时最大的问题就是如何确定其实际负载。许多数据硬件制造商在设备上提供的功率数 据都与事实不符,有的甚至是完全错误的。大型制造商通常会在自己的网站上设一个链接或配置评估装置。这使 他们可以提供相当准确的信息。要小心使用设备的铭牌。这是一个法定的额度标识,但通常来讲它所标注的额度比设备实际所能提供的功率 要高得多。例如,假如一个UPS单元铭牌上标注着在90到240伏的电压标准下可以提供4到8安培的电流,那么 它的实际功率可能只有500瓦。首先,这些数据是可能会缩水的。电流越大,电压就越低。假如电压是120伏,电流是8安培,那么你能得 到的功率是960伏安。在功率因数为0.95的情况下,它所能提供的功率就是912瓦。任何电源的效率都不会那么 低,电源也从不会在满负荷的情况下运行。因此,这台UPS单元的功率恐怕永远都不会超过500瓦,但是如果你 真的很保守,按1.1的功率因数来算,电源的输入功率规格也应该在550瓦特左右。此外,不要被双接线(dual-corded)设备所迷惑。电源是要共同承担负载任务的,其中,要求每个单一电 源都能支持满负荷运行。因此,一个拥有两台500瓦功率电源的UPS单元也应该被看成和一台500瓦电源一样。关于作者:Robert McFarlane是建筑物布线设计领域的前驱。他已经无数次被邀请参加建筑物电子通信基础设施以及交易大厅和数据中心设计技术要求等领域的研讨会,并在会上做专业报告。Interport Financial Inc. 是一家专注于金融交易大厅和核心数据中心设计的公司,McFarlane担任其公司总裁已有12年时间。(作者:Robert Macfarlane)如何使用UPS负载总线同步控制器?大多数UPS(不间断电源)主要制造商都提供额外收费的LBS(Load Bus Synchronization)系统。LBS 系统旨在保证多个提供相同临界负载的UPS系统的输出功率彼此同步。如果可能的话,当UPS系统间需要切换临 界负载时,LBS系统还可以提升操作可靠性。通常,这样的切换是由SBTS(Static Bus Transfer Switch)完成,它可以在4到20毫秒内完成电源的开路换接。乍一看,好像每个有多个UPS系统的项目都应该使用LBS。实际情况并非如此。正如生活中的很多事一 样,决策并不如想的那么简单,也不可能没有任何风险。首先,你需要考虑的是你的项目是否真的能受益于LBS。如下是几点需要注意的考虑:现代的计算机设备都带有切换式电源,无论电源是否同步,切换电源时都不会有任何问题。整个负载都由直 流电源供电。使用交流电的发动机(如,机柜冷却风扇或冷却泵)在切换电源时,如果前后电源不同步,则会受到机械应 力,可能导致瞬间冲击电流(inrush current)。瞬间冲击电流会导致发动机失常。如果切换电源不同步,在SBTS下游的变压器(如,PDU)会受到机械应力,产生强烈的冲击电流。不过, 如今的SBTS技术进步了,可以有效地解决这个问题。然后,你应该考虑到LBS可能带来的不良后果:共用同一LBS的某些UPS系统输出的电流可能与它们的旁路电源(bypass source)不同步。通常,LBS会指定其中一个UPS系统为主系统(master),其它系统为隶属系统(slave)。每个隶属UPS系统的输出电流被 强制与主UPS系统的输出电流同步。这样,在通常的操作中LBS下所有UPS系统的输出电流都是与主UPS系统的 旁路电源同步的。如果一个隶属UPS系统的旁路电源与主UPS系统旁路电源不同步,那么该UPS系统的输出电流 就与它的旁路电源不同步。如果隶属UPS系统在不同步的情况下一定要将输出转换到旁路,会导致一些严重的后果,还可能损坏该隶属UPS系统。这些也是LBS希望避免的问题。事实上,有些制造商的产品可以防止隶属UPS在不同步的情况下转换 到旁路,或者进行开路换接。开路换接的过程中可能会导致关键计算机负载而断电。Syska Hennessy Group认为,最佳的做法应该是:如果现代的计算机设备(有切换式电源)是唯一的UPS系统临界负载,那么就没有必要使用LBS了。简约就 是优雅。如果UPS系统临界负载包括交流电发动机,就使用LBS。PDU一侧的所有SBTS或UPS下游的其它变压器都应该应用最新的技术,防止切换电源时出现强烈的变压器 冲击电流(inrush current)。(作者:Christopher Johnston )如何在UPS维修期内维持设备的正常运行?在UPS维修期内,企业一般都会利用移动电源为各类客户提供服务。通常来讲,这些设备都表现得不错,而 且易于管理。当然了,这并不能得到完全的保障,如果你要征求某些群体的意见,他们或许更希望得到企业的保 证,确保可以持续地提供服务。我最主要的建议就是安装一个优质的瞬间电压脉冲抑制器(TVSS)来对你的电力馈线(Power Feeder) 进行保护。这无疑是个很好的措施。如果你的数据中心空间是租来的话,很有可能它已经安装了TVSS保护装置。 但如果没有的话,UPS的维修期将会是一个不错的时机,你可以选择在这个时候来安装这一保护装置。该装置具体的类型和规格则要取决于待保护设备的特征。我的建议是咨询一下熟悉你所在建筑物电力设施具 体细节的电气工程师。之后你可以去任何事情,除了购买单独的UPS保护装置并将它安装到设备最为核心的部件 上之外,一定要确保你选用的是真正的“双转换”UPS保护装置。前者虽然更为廉价,但这种“交互式”的保护装置 单元在被连接到发电机时会出现一些让你啼笑皆非的问题。我最关心的问题是在对UPS进行维修期间如何将设备在发电机间实现转换。如果中央UPS已经完全失去控 制,就不会有什么问题。他们可能会让发电机继续运行,然后绕开它进行设备转换。但如果只是对中央UPS进行 内部维护,就需要在转换发电机前将所有设备统统关闭。在这种情况下,你可能需要依次关闭数据中心,等其它 所有负载设备都完成转换后再开始进行系统备份。在UPS设备恢复之后,你恐怕还要做同样的事情。最重要的是所有的负载不能突然被切换到发电机,否则的 话,很可能会导致在负载转换完成后的几秒内设备运行不稳定。你一定希望最后再对核心设备进行转换,特别是 如果这种电源中断会影响到非UPS设备运行的话,比如说大楼的电梯或空调的运行。无论在对任何电子设备进行 转换时,都要提前对这些设施进行保护。关于作者:Robert McFarlane是建筑物布线设计领域的前驱。他已经无数次被邀请参加建筑物电子通信基础设施以及交易大厅和数据中心设计技术要求等领域的研讨会,并在会上做专业报告。Interport Financial Inc. 是一家专注于金融交易大厅和核心数据中心设计的公司,McFarlane担任其公司总裁已有12年时间。(作者:Robert Macfarlane )如何防止数据中心电力中断过去的一年中,许多数据中心管理员的设备出现了电源问题,这很让人担忧。当然,我所指的问题并不是设 备组件的失效,而是指数据中心IT架构的电力供应无法得到保障。有些人在这个问题变成灾难之前就有所注意, 而有些人却因为负载过重而经历了数据中心的供电中断事故。然而,像这样的电力灾难是可以避免的。下面我们来讨论IT管理员如何监控数据中心的电耗增长及实际供电 与电力需求的偏差。数据中心电力监控市面上各种不同的产品都允许管理员数据中心中每个电路的负荷进行监控。现代电力分布单元(PDUs)都 有此项功能,但奇怪的是,很多对象并未被监控到。即使你不够幸运,管理着30多年前生产、没有监控功能的PDUs,你仍然可以测定数据中心的电力能耗。这使我回想起我在一家金融公司的第一份数据中心管理工作。1979年,我大一学年结束后在一家数据中心 找了一份暑期兼职工作。负责安装并维护数据通信设备,使用一台Fluke手持电表监控数据中心的电耗。我需要 去查看每一个配电盘,读取每个电路的电耗值并将其记录下来。每个月我会打印两份报告,将其交给数据中心的 高级电工以便于他们用这份信息来预测电力需求的增长情况。那个时候,UPS是很昂贵的。数据中心需要尽量少 使用UPS的容量。因此我们关心的是那些使用了UPS系统的设备,而不是非UPS、由发电机支持的设备。如果你无法确定可以将旧设备升级成具有集成电力负载监控功能的现代PDUs,就可以选择手持电表来监测 数据中心的电耗趋势。所有的数据中心应该至少有两种可使用的工具。应该定期对电路进行监测,用于电力需求 趋势的计算。在给新设备或替换设备插上电源之前,应该养成检查电路的习惯。这可以确保电路不出现意外过载。 记住,为PDU供电的电路容量通常比所有分支电路的总容量小。这就意味着PDU的供电也应该进行定期的监控。 就像我的一名同事所说,“你无法确定哪些设备是不需要监测的”。必须采取一种适当的流程来监控数据中心的电 耗趋势。没有这些方法,你的一切工作都显得很盲目,并且会引发一场数据中心的电力灾难。当需求超过供给因此你会定期监控并预测数据中心的电力需求,向领导层汇报监控结果以证明对一个全新或现有设备的升级 是行之有效的。但经济低迷阻碍了大笔资金的开支计划。你能做什么?首先,经济形势很可能也会拖延你的IT 设备扩容计划。如果数据中心的电力需求也停止了增长,可以呼口气放松一下,但不要总是等着吃老本。经济终 将好转,你最终也要对这些需求有所反应。现在开始为将来作计划来确保你可以免遭数据中心的电力灾难。关于 预防性的措施,这里有一些相对简单的方法:实施虚拟化。如今是选择越来越多,开支越来越少。在普通服务器市场,来自微软和Citrix的解决方案正在 与VMware竞争。对于小到中型商业市场,Virtual Iron软件在合理的价格下提供了一个引人注目的虚拟化架构管理产品。强制采用虚拟化工具的IT组织可以将数据中心扩建项目推后四年,要知道这可是在其高速发展时期。考虑用设备托管来解决数据中心的增长问题。我曾经与一个大型供应商沟通过,他们已经预见到电能会在何 时消耗殆尽。他们采用了虚拟化并计算出建设另一个数据中心所需的时间,使自己避免一场电力灾难。但该公司 的领导层却拒绝为这个新的数据中心投资这是IT职员们未曾考虑过的。我建议那家公司通过将业务外包给设 备托管商来解决它的扩张问题。随着新的数据中心建设项目的出现,托管方式正日趋成熟。淘汰旧的服务器。我与一家数据中心容量即将饱和的大型厂商沟通过,他们需要借助其它设备来实施扩张计 划。这家公司对自己的设备清单进行整理之后发现有25%的设备需要被淘汰。在公司的IT业务中,淘汰IT设备 的业务优先级是最低的,有些通知甚至在18个月后还没有被实施。服务器及其它一些多余设备的淘汰和更新是 弥补空间与电力不足的一种相对简单的方法。避免电力灾难的最好方式是在电力分布路径上监控所有点的电力增长趋势。为减少数据中心的能耗增 长,作为数据中心管理人员,尽早执行干预计划,如实施虚拟化、淘汰老旧设备,并在数据中心有扩展需求时考虑设备托管。(作者:Bridget Botelho )用SNMP工具来监控数据中心电源和冷却

    注意事项

    本文(数据中心运维手册.docx)为本站会员(暗伤)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开