《基于模型预测控制的数据中心节能调度算法-赵小刚.pdf》由会员分享,可在线阅读,更多相关《基于模型预测控制的数据中心节能调度算法-赵小刚.pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、软件学报ISsN 1 0009825,cODEN RUxUEw,D“,w口,矿SQ,w口陀,20 l 7,28(2):429442【doi:1 O1 3328jcnkijos005026】中国科学院软件研究所版权所有毒基于模型预测控制的数据中心节能调度算法赵小刚1,胡启平1,丁玲2,沈志东1(武汉大学国际软件学院软件土程系,湖北武汉430079)2(湖北科技学院计算机科学与技术学院,湖北咸宁 437100)通信作者:赵小刚,E-mail:zxgan9302whueducnEmail:josiscasaccnhttp:wwwjoso唱cnT色l:+86一lO62562563摘要: 如今日益增长的
2、数据中心能耗,特别是冷却系统能耗已日益受到重视,降低系统能耗能够减少数据中心碳排放提出了一种基于模型预测控制(modd predjcti曲con仃ol,简称MPc)的节能调度策略,该策略可以有效地减小数据中心冷却能耗该方法采用动态电压频率调节技术来调整计算节点频率,从而减少节点间的热循环;所有节点的峰值温度可被保持在温度阈值下,在任务的执行中稳态误差较小该方法可以通过动态频率调节来抑制由于负载类型变化造成的模型不确定性带来的内部扰动,分析结果表明,基于模型预测的温控算法系统开销较小,具有良好的可扩展性基于该算法设计的控制器能够有效地降低输入温度,提高数据中心能耗效率通过在实际数据中心内运行的模
3、拟网上书店,该方法与安全最小热传递算法和传统反馈温控算法这两种经典方法相比,无论是在正常条件下还是在扰动存在的情况下都能取得较好的温度抑制效果,系统性能如吞吐率也达到最大在相同的负载条件下,该方法能够获得最小的输入峰值温度和最小的冷却能耗关键词: 模型预测控制;反馈控制;热传递;阈值温度;内部扰动;能耗效率中图法分类号:TP316中文引用格式:赵小刚,胡启平,丁玲,沈志东基于模型预测控制的数据中心节能调度算法软件学报,2017,28(2):429_442http:wwwjoso唱cnl000-98255026|htm英文引用格式:zhao XG,Hu QP,Ding L,Shen zDEner
4、gy saving scheduling strategy based on model prediction control fordata centersRuan Jian Xue BaoJoumal of software,2017,28(2):429442(in Chinese)http:wwwjoso唱cIl1000一98255026htmEnergy Saving ScheduUng Strategy Based on MOdel Prediction C0ntrol fbr Data CentersZHAO XiaoGan91, HU QiPin91, DING Lin92, S
5、HEN ZhiDon911(Depanment of SoRware Engineering,Intl Sch00I of Software,wuhaIl University,Wuhan 430079,China)2(C01lege ofComputer Science and TechnologyHubei University ofScience and Technology,Xianning,437100,China)Abstract:Tbday the ever-growing energy cost,especially cooling cost Of data centers,d
6、raws much anention for carbon emissionreductionThis paper presents an ene唱y e衔cient scheduling strategy based on model prediction control(MPC)to reduce cooling cost indata centersIt uses dynamic voltage frequency scaling technology to adjust the frequencies of computing nodes of a cluster in a way t
7、ominimize heat recirculation efrect among the nodesThe maximum inlet temperature of nodes can be kept under temperatIlre limits withlittle stable errorThe method can also deal with inner distIlrbance(system modeI variation)by dynamic frequencies regulation among thenodesAnalysis shows good scalabili
8、ty and small overhead,making the method applicable in huge data centersA temperatureawarecOntroller is designed to reduce inlet temperatures to improve energy efficiency of data centersUsing a simulated online bOokstore run ina heterogeneous data center the proposed method is proved to haVe 1arger t
9、hroughput in both noHnal and emergency cases compared withexisting solutions such as safe least recirculation heat temperature controller趾d traditional feedback temperanlre contr01leL The基金项目:国家自然科学基金(6l003185);湖北省自然科学基金(201FFB04505)Foundation item:National Natural Science Foundation of China(6l0031
10、85);Natllral Science Foundation of Hubei ProVince ofChina(20lFFB04505)收稿时间:20150l一14;修改时间:20150910,20151222;采用时间:20160105万方数据430 如”朋口,Q厂蜘陀软件学报v0128,No2,Febmary 2017MPC_based scheduling metllod also has 1ess inlet temperature aIld cooIing cost comparing with those two methods under same workloadKey w
11、ords: model prediction control;fcedback control;heat recirculation;temperature threshold;inner disturbance;energy e简ciency随着信息社会的迅速发展,网上购物、在线搜索和云计算服务等使得数据中心日益成为计算密集和存储密集的中心环节海量的计算和存储需求使得数据中心必须增大硬件规模来获得快速的响应而硬件规模的增长带来的不仅仅是购买成本的迅速增加,庞大的硬件能耗更是给数据中心带来巨大的运行成本Gartner估计到2015年,约占全世界数据中心71比例的大型数据中心能耗将超过1 262
12、亿美金【而到2016年2018年,数据中心的能耗将达到600亿千瓦时1 300亿千瓦时【21巨大的能耗成本使得数据中心的运行维护成本已经远远超过了数据中心的建设成本。即购买数据中心所必须的大量硬件设备和场地所花的费用p】减小数据中心能耗是学术界和工业界目前的共识【4一”数据中心能耗的一部分为硬件运行时需要的能耗,称为计算能耗艮多硬件设计公司和数据中心建设公司都致力于减小计算能耗,并已经从不同层次开发出了硬件节能技术Intel等芯片公司主要从芯片级进行节能,如低电压集成电路、动态电压频率调整技术(dynamicvoltage aIld frequency scaling,简称DvFS)8】等HP
13、,IBM等服务器公司则主要从机架级进行节能,如刀片服务器集合层能耗管理【91、硬件能耗监控和能耗优化的一体化方案【1 o11】j艮多研究侧重于从数据中心负载的特性来减少能耗:如按照系统功率需求动态提供能耗的虚拟能耗技术,该技术基于可存储电能的电池设备【121;尽量减少CPU空闲时间的后填充任务发射技术;当CPU,硬盘或网络空闲时将其转入睡眠态节能【H1 51这些技术都取得了较好的效果,但都局限于部件级的节能,缺乏对温度引起的冷却能耗的关注数据中心能耗的另一部分为冷却能耗密集硬件运行时的高能耗会使数据中心产生大量热量,而热量的增加会使硬件的温度增加,工作稳定性降低为了维持数据中心的持续健康运行,
14、需要较低的环境温度,而由此产生的热循环现象是目前数据中心能耗效率低下的主因研究表明,比较理想的制冷能耗和硬件能耗为1:12011年对500个大型数据中心进行调查发现【l 61,绝大多数的数据中心制冷能耗和硬件能耗比为18:1由此可见,数据中心的制冷成本非常高,而制冷能耗过大对环境也有较高的要求一个传统的15kw的水冷数据中心需要一天36 000加仑的水来制冷【1 71冷却能耗的计算涉及到比较复杂的热力学过程,机器表面材质的散热系数、刀片服务器本身的间隔、数据中心内空气的流速等都会影响冷却能耗大小服务器厂商和数据中心建设厂商主要从这个方面进行节能研究【18】COracle通过分析数据中心节点目前
15、温度分布状态,估计其采用不同的作业调度算法后节点未来的温度变化,最终来选择合适的调度方法,是一种离线作业调度策略【18;Thenocast通过时间序列方法估计未来5分钟内数据中心节点温度的变化情况,但缺乏实际的温度调节方案【l圳;The衄ostat则从仿真角度出发,以流体热力学理论建模数据中心,准确度很高,但没有给出具体的仿真参数及过程【201这些调度方法都缺乏在线作业调度机制,难以对温度进行实时控制,特别是对紧急情况引起的温度异常的处理数据中心作业调度算法对数据中心冷却能耗影响较大不同的调度算法会使数据中心节点的峰值温度不同,从而使得冷却设备的供应温度有差异数据中心的冷却能耗与冷却设备的供应
16、温度成反比【2l221目前大多数调度算法都是通过降低节点的峰值温度来减小对空调的制冷能耗要求CoCon采用控制算法来协调集群内主机能耗和主机上虚拟机的响应时间,但没有考虑温度的变化【2列;算法MinHR【24J根据每个节点的热传递系数(heatrecirculation fraction,简称HRF)来分配任务,对降低冷却能耗有一定的效果;算法xint【22】采用基因算法来离线进行计算作业调度,能够求得较优的冷却能耗,缺点是计算时间过长,不能用于在线作业调度这些算法都能提高数据中心能耗效率,但都没有从温度角度考虑作业的性能要求数据中心的供应温度高低直接影响数据中心冷却能耗的大小因此保持数据中心
17、各节点温度的稳定性对于设定合理的供应温度。降低数据中心能耗有关键作用本文拟研究温度敏感的节点能耗调度算法对数据中心温度的影响,着重于冷却能耗的降低该算法采用先进的模型预测控制算法在节点间分配功耗,然后根据任务温度时域模型估算各节点温度;采用温度反馈控制算法实时控制各节点频率,以达到准确跟踪参考温度的目的;如果在任务执行过程中发生温度异常情况造成热点产生,可以利用调度算法来动态地调整节点频率,在达到降温万方数据赵小刚等:基于模型预测控制的数据中心节能调度算法 43l目的的同时,吞吐率受影响较小,从而最小化系统冷却能耗本文第l节将简述节点功耗模型,数据中心热交换模型和冷却功耗模型第2节分析模型预测
18、温控的基本原理、总体架构、稳定性和控制器开销第3节运行模拟实验,对模型预测温控算法的控制准确度、性能分析、扰动抑制和冷却能效分别设计不同的实验,以证明该算法的有效性第4节讨论模型预测温控对系统能效的负面影响,并给出负载均衡的解决思路第5节对本文加以总结,并指出进一步的工作方向1数据中心功耗模型数据中心普遍采用刀片服务器,采用机架方式将刀片服务器进行固定,通过空调进行制冷从图1可以看出,同一机架中,空调供应的冷空气从底部往上部流动,从机架顶部散发的热空气被循环到空调处因此,机架上部的服务器温度较高而冷空气从刀片服务器的进风口流入,带走服务器内部工作部件(cPu、内存、硬盘、主板和网络设备等)的热
19、量,从出风【流出Flg1 A1r flOw in d,lta centers图1数据中心空气流动因此,研究数据中心功耗模型的主要工作是要计算机架中节点的功耗和带走节点产生热量的制冷设备功耗11服务器功耗模型许多研究表明服务器节点功耗与服务器频率成正比【23,251,因此服务器在后r时刻的功耗模型可以表示成只(灯)2口iZ(灯)+c; (1)口。c,为与机器硬件相关的常量,丁为获取功耗的时间间隔根据上式可以得到节点功耗动态模型:P,(七十1)丁)=只(尼丁)+q颤(七十1)r) (2)JPi(斛1)乃为f节点在(斛1),时刻的功耗,斯(斛1)刀为(斛1)丁时刻与七丁时刻f节点CPu上的频率差异,
20、商用计算机CPu频率不能连续变化,存在若干个P状态12热能交换模型图2描述了数据中心内服务器之间存在的热循环研究表明,一台服务器的热量输出会对它周围所有服务器的输入温度产生影响研究人员提出了很多方法来对数据中心内的热循环进行建模这些模型的有效性已经由真实数据中心内使用传感器测得的温度数据进行了验证与复杂且耗时的传统CFD(computational nuiddynamics)仿真模型相比,这些温度预测模型的准确度和快速性都很高【22】从图2中得出服务器节点f的温度模型为咒。=瓦+K只 (3)其中,磕为服务器j的输出温度,砭为服务器f的输入温度,K为热力学常量节点输入温度所包含的热量和节点功耗产
21、生的热量之和就是节点的输出热量221,则丁时刻节点j所产生的热量如式(4)所示残。(七r)=绋丁)+P(七r) (4)气气L空空一应冷热I引_|供一|R一:置基冠一口l|螽一万方数据432 乃“M口,D厂勘历馏坩软件学报v0128,No2,Febmary 2017011f l节点lI笋、j!。皑死文一,=、整一棚幽mm州x州3FA蛳2rM融喇h”-毡Wse耐啊Ib啦,1一1 删I咔=飞mF蜘s吼w-D喇t礓岬h髓$r-血t勘r呲-1nr唧e,?啊b删峥1唧P幽-15日rnhN_t像口阿曲酣lFr-h,舶r-孔r帅b。r抽tlp_,ke)fal拈l艘f盛*nP_|: (b)汛If辽数拟门驯贝I
22、J!,JiFig5 Temperature sensors configuration and XML temperature data which genemted by MiniGoose II图5 温度传感器配置和MiniGoose II生成的xML温度数据万方数据赵小刚等:基于模型预测控制的数据中心节能调度算法 437初始实验中,我们使用了一个包含4个节点(2台服务器CPu为Pentium,另2台为xeon)的集群,放入第l行第1列的底盘A,来观察基于模型预测的控制器对节点温度的影响分别采用4个温度传感器安置在服务器的输入端4台服务器上均安装Linux系统,内核版本为26,其中3台机器
23、需安装Apache服务器作为wEB服务器,另有1台机器安装Mysql作为数据库服务器在机房外独立安装一台服务器(与机房内机器属于同一个网络),在此服务器上安装LVS(Linux virtual server)模块来充当负载分配器,与此同时,MiniGoose II也直接与该服务器连接该服务器负责收集各节点温度,同时按照实时获得的温度进行频率的调节,也就是说,调度算法也在该服务器上实现在4个节点的服务器集群上部署按TPCw标准生成的在线书店程序数据中心模拟器也按照这里的初始设定模拟了一个四节点的集群,节点的功耗参数参考实际硬件(PowerEdge 220)的白皮书设定这4个节点处于同一个机架内在
24、四节点的集群情况下,fr。f为25。C,而供应温度为240C通常,大型数据中心的温度阈值也是25。C此外,PowerEdge R220的处理器都有6种功耗状态(踟,P1,尸5),分别对应频率34 GHz,30 GHz,26 GHz,22 GHz,18 GHz和16 GHz实验中所有采样时间均为1s第33节第36节中的温度均来源于实际温度传感器33对比方法我们将采用了MPc控制理论的温度控制器称为模型预测温控这里,我们还设计了其他两种温度控制器,分别为热传递最小温控和传统反馈温控这3种方式都是在线温控方法,因为它们在每个采样周期通过频率调整方法来最小化热量传递从文献22中我们已经知道,在负载一定
25、的条件下,在数据中心内求解合理的负载分配来实现最小化输入温度是一个NP问题,因此,通常在线求解最小温度都是采用启发式算法而热传递最小温控方法是由文献21,26中的启发式算法推导得出的为了阐述热传递最小温控方法,我们必须在式(7)介绍的热循环系数矩阵D的基础上进一步讨论数据中心内节点的热效率节点的热效率在很大程度上依靠节点本身和其相邻节点的热循环热传递最小温控算法严格根据数据中心节点的热向量矩阵描述的节点热效率进行负载分配数据中心热向量矩阵可以用j僻。皿:,皿加一皿。)来表示,其中,垦为节点f产生的热量对所有节点的影响,坼为代表热循环重要性的权值,谚,代表热循环矩阵D中的对应元素旦生R=办p,“
26、,=嘭rp罗 (18),=l f_I安全热传递最小温控算法(safeleast recirculation heat extended,简称safeLRHex)在每个采样周期,当集群内所有节点的最大输入温度没有超过参考温度时,该方法从可用节点中选出具有最小月,的节点,将其频率增加一级;当集群内有节点的最大输入温度超过参考温度时,则从可用节点中选出具有最大R,的节点,将其频率减小一级;节点具有的R,值越大,说明其热效率越高当集群内节点的最大温度低于参考温度时,增大具有最小R,节点的频率对整个集群的峰值温度影响最小;当最大温度高于参考温度时,减小具有最大尺。节点的频率,对整个集群的峰值温度下降得最
27、快由于该算法为一种试凑型算法,因此我们通过设定一个安全裕度来消除正误差,称其为安全热传递最小温控算法传统反馈温控算法(traditional feedback)参考文献18】提出了一种通过动态调整节点负载来降低节点内各部件温度的反馈控制算法然而该方法只是一个单节点温度控制算法,因为它只控制节点内功能部件,如cPu、硬盘等的温度该方法使用单输入单输出(single inp州single output,简称SIso)比例控制器来控制负载的变化,达到对组件温度的控制,但并没有考虑节点间的温度影响这里,我们对该方法做了改进,使其适合分布式计算系统在每个节点上我们都部署一个SIS0 PID型温度控制器,
28、每个温控器通过调节本节点CPU频率来控制自己节点的温度为了保证整个集群内所有节点的温度不超过阈值温度,这里采用了一个保守方法:将集群内所有节点的最低频率分配到每个节点在每个采样周期末尾,所有节点都被分配同样的频率,该频率可以保障最高温度节点的温度不超过阈值34性能分析在这个实验中,我们比较集群级的温度控制,即安全热传递最小温控和模型预测温控对系统性能的影响在万方数据438 如“朋日,疗w盘陀软件学报v0128,No2,Febmary 201 74节点的集群中,分别将参考温度设定为247。C,248。C和25。C,我们把这两种温控算法各运行3次从图6可以看出,模型预测温控算法的吞吐率要高于安全热
29、传递最小温控算法,特别是当参考温度较低,集群负载较低时此外。图中虚线所示为没有采用DvFs温度控制算法的集群的最大理想吞吐率,所有节点的频率均为最大当参考温度在250c时,模型预测温控的性能较之理想状态有10左右的降低这个损失是可以接受的,因为集群温度得到了控制,减少了系统冷却功耗(第36节)事实上,如果集群不采用温度控制,在虚线所示的最大理想吞吐率下,集群的峰值温度将超过参考温度,冷却能耗增加Fig6 Ttlroughput comparison between Safe-LRHex and MPc_based temperature controllersunder dif兜rent re
30、fbrence temperatures图6不同参考温度下的安全热传递最小温控与模型预测温控吞吐率比较从第22节的分析过程可知,模型预测算法在相同的参考温度下会有较小的稳态误差和较大的集群利用率;安全热传递最小算法的调度策略则是先增加热效率较低的节点(节点2和节点1),而这些节点的吞吐率较小(相同功率下)此外,安全热传递最小算法由于安全裕度的问题,节点利用率本身就比正常情况要低,所以这两种算法在负载较低时吞吐率差距较大当参考温度增大时,所有节点利用率都较高,所以两种算法吞吐率 接近35内部扰动抑制在本节中我们分析当系统温度模型(式(15)由于功率模型的不确定性引发输入温度波动时,模型预测温控算
31、法如何保持整个系统温度的稳定性这里我们对比传统反馈温控算法,传统反馈温控基于经典控制理论,因此也可以获得离散频率来逼近浮点型频率在经过20个周期后,节点2上的负载从订购模式变化到浏览模式,而浏览模式下,1个浏览请求消耗的功率是订购模式下的15倍从图7可以看出,传统反馈温控和模型预测温控对这种突变的处理过程是类似的,在节点2的温度升高后的一个周期,所有节点的温度都有所下降其差别在于,在模型预测温控中剩余节点的温度下降幅度不大经过短暂的温度调整后,传统反馈温控算法中节点2的温度回归到参考温度;而在模型预测温控中,节点2和4的温度都接近参考温度在第40个周期,所有节点上的访问模式由目前的浏览模式切换
32、到购买模式,1个购买请求消耗的功率是1个预定模式的08倍因此,所有节点的温度在接下来的几个周期都有所下降,因为在相同的请求个数下会消耗更少的功率接着,在反馈环路作用下,随着各节点请求数的增加,频率会随之上升从图7可以看出,所有的节点温度都有所上升万方数据赵小刚等:基于模型预测控制的数据中心节能调度算法255已25o捌零245簿240l+s1一一一&十+krI1、 。r 誊j一f一采样周期。型赠一簿j二虹一二二:ii焉三三;(a)传统温度控制器 (b)模型坝测温度控制器Fig7 Temperature nuctuation containment under traditional feedba
33、ck and MPCbased temperaturecontrollers for different workload types:l browsing=15 ordering,1 shopping=08 ordering图7传统反馈温控和模型预测温控对不同负载类型引发温度波动的抑制,1个浏览=15预订,1个购买=08预订439图8展示了在访问模式变化的情况下,在两种不同的温控算法下,集群吞吐率的变化从图8中更加确定了当负载类型变化时,模型预测温控的性能损失较小(公式(16),MPc控制器在控制过程中寻找最小化代价函数的解)当节点2上的负载访问模式功率消耗量为原来的15倍时,根据公式(15
34、)可知,集群内节点的峰值温度会有很大的升高,无论是节点2还是相邻节点基于温度的反馈,模型预测算法通过动态调节频率使每个节点的温度都回归到峰值温度下:节点2的频率上升,用来容纳功耗更大的请求;其他节点的频率下降,用来降低系统峰值温度,而总的吞吐率就不会下降太多而在传统反馈温控算法中,所有节点的频率都是同时下降到相同的大小,因此,在浏览模式下,两者吞吐率的差异最大当所有节点的负载模式消耗的功率在第40个周期下降到原来的08倍时,传统反馈温控和模型预测温控都提高所有节点的频率来适应增加的负载量,在该模式下,所有节点的利用率均达到最高,两种算法的吞吐率差异很小Fig8 Tllroughput comp
35、撕son beMeen仃aditional feedback and MPC-based tempe例=11re con仃ollerswhen workload types change图8负载类型变化时传统反馈温控和模型预测温控的吞吐率比较36冷却功耗比较在本节中我们比较模型预测温控、安全热传递最小温控、负载均衡这3种算法的功耗效率负载均衡是指节点不进行DvFs频率调节,将负载平均分布到各个节点上这个实验基于50个节点的数据中心,参考温度为25。c从图9中可以看出,在相同的负载下,不同调度算法下的冷却功耗大小,其中,模型预测温控可以获得最小的冷却功耗从图9中可以看出,负载越轻,模型预测温控优
36、势越大,因为此时调度优化的裕度很大;当负载较高时,各节点负载都很高,调度优化的余地很小万方数据4讨论104而甜朋日,o厂勋,w口陀软件学报v0128,No2,Febnlau 2017胜过MPCBased臣受圆SateLRHex雪 冒 阏 嚣50 7050个节点的数据中心负载Fig9 C001ing power comparison among three methods图9 3种方法下的冷却能耗比较节点频率的调整确实会影响某些强耦合应用,造成该应用在频率下降的某些节点上cPU利用率过高,进而任务的运行时间增大,这样会造成一定比例的能耗增加,降低MPC的控制效果我们的解决办法是通过一定的负载均衡
37、方式,将由于频率降低而引起过载的节点上的负载迁移到轻载节点上,进行二次调度来控制其运行时间的增加,降低系统能耗节点上的运行时间增加主要是由于CPu利用率过大引起的,因此,我们假设为每个节点的CPu利用率设定一个最大阈值【,m。、。6如85利用率超过该值则为过载,响应时间较长同时我们定义节点利用率的最低阈值(,mi。f,如40,利用率小于该值则节点轻载,能耗浪费较多因此,我们的二次调度的思路是将集群内的节点分为3种类型:过载、轻载和适中负载均衡是将过载的节点中的负载迁移到轻载节点上,这样整个执行时间就可以降低;适中节点则不进行负载迁移这样处理的原因是,迁移会有定的能耗成本,因此尽量减少迁移动作我
38、们的算法如下1)将集群节点按照【,mjn-ref,【,m。;。f分为过载集合P,轻载集合矿和适中集合r2)对过载集合P中的集合按照节点的热效率R降序排列3)对轻载节点矿中的集合按照节点的热效率R升序排列4)选择集合P中的第1个节点f,在该节点中选择使节点利用率升高最多的任务七;如果移除该任务后节点利用率低于己,m。f则将该节点从P移动到死否则继续保留5)选择集合矿中的第1个节点,装入该任务七如果装入后,节点矿的利用率高于己,min-ref,则将该节点从y移动到乃否则保留6)返回步骤4),直至P为空将P,矿集合分别按降序排列和升序排列的目的是将热效率较高的节点上的任务迁移到热效率较低的节点上,这
39、样对整个集群的峰值输入温度影响较小我们对第36节中的50个节点,负载为50的数据中心按照MPc温控算法调度后的场景进行二次负载均衡调度,调度算法如上所示,调度结果如图10所示从图10可以看出,经过MPc温控后进行了节点频率调整,确实造成了一定的时延和节点计算能耗的增加,而经过我们的负载均衡算法后,时延和计算能耗都有接近8的降低图中虚线所示的运行时间和计算能耗是经过归一化后的结果,归一化的参考是没有经过DvFs频率调节的集群的运行时间和能耗87654320一一罐罄嚣佥万方数据赵小刚等:基于模型预测控制的数据中心节能调度算法5结束语WithDot load balance Wlth load ba
40、lance50个j,?、i的数捌心债拔50Fig1 0 Execution time and computing ene唱y comparison between load balaIlceand no load balance after MPCbased temperature controller图10 MPc温控后采用负载均衡和不采用负载均衡的执行时间与计算能耗对比441本文提出的模型预测温控算法是一种数据中心能耗管理应用技术其主要应用范围为传统的风冷型数据中心,应用的场景为面向Intemet的电子商务类型的事务型场景但该算法对目前日益流行的液冷、风冷和液冷相结合的综合冷却技术以及高性
41、能计算等应用场景具有一定的局限性,今后的工作可以向该方向延伸,希望能够在更广阔的场景下设计更高效的能耗管理技术将该方法应用于网络设备和存储设备的温度调节存在一定的难度对网络设备和存储设备来说,没有频率可以控制,因此,这里可以将控制变量频率转为设备利用率于是,存储设备和网络设备的能耗模型就可以与这些设备的利用率建立线性关系这样,理论上也可以采用模型预测算法来调节各存储节点或网络节点的利用率,以此对这些设备的温度进行控制但真正的难点在于,对存储节点来说,设备利用率的控制很难通过负载的调度来实现因为存储设备的负载与其设备上的文件块放置策略和访问频度有关,这些难以通过任务调度来实现对网络节点来说。其利
42、用率的调节涉及到数据包的路由策略的选择,同样难以调度但研究数据中心内所有设备的能耗管理,并对它们统一进行温度控制无疑是最完全的解决方案,也是我们下一步工作的重点References:1 Mukherjee T,Banerjee A,VarsamopouIos G,Gupta sKsspatioTemporal thermalaware job scheduling to minimize energyconsumption in vinualized heterogeneous data centerscomputer Networks,2009,53(17):28882904【doi:101
43、016jco砌et2009060082】 Reducing ene唱y consumption aJld cost in the data center2014http:wwwdatacenterknowledgecolllarchiVes,201412川reducingene唱yconsumptioncostdatacente“3 In the data center,power and c001ing costs more than the IT equipment it supports2007htqp:,wwwelectronicscoolingcolll,200702inthedat
44、acente卜powe卜andcoolingcostsmorethantheitequipmentitsupports【4】 Li S,Le H,Pham N,Heo J,Abdelzaher TJoint optimization of computing and cooIing energy:Analytic model and machine roomcase stlldyIn:Procof the Int1 Conf on Distributed Computing Systems(ICDCS 2012)IEEE,2012396405【doi:lO1 109ICDCs201264】5
45、Parolini L,Sinopoli B,Krogh BH,wang zKA cyber-physicalsystem approach to data center modeling and control for energyefnciencyIn:Procofthe IEEE,20l l,100(1):254268doi:101 109JPROc201 12161244】6 Breen TJ,Walsh EJ,Punch J,Shan AJ,Bash CEFrom chip to cooling tower data center modeling:Part I_Innuence of
46、 serVer inlettemperahIre and temperature rise across cabinetIn:Procof the 12th IEEE Intersociety Conf on Thermal and Thermo MechanicalPhenomena in Electronic Systems(ITherm)IEEE,20101一lO【doi:lO1 109ITHERM2010550142l】7 Chen,Y,Gmach,D,Hyser C,wang zK,Bash cE,HooVer C,Sin曲al SIntegrated Management of a
47、pplication performance,power and c001ing in data centersIn:Procof the Network Operations and Management Symp(NOMS)IEEE,2010615622doi:101109NOMS20lO5488433】万方数据442【8】910】【ll】12】13】14】【1516】171819】【20】【21】2223】2425】26】国“朋口,Q厂跏陀软件学报v0128,No2,Febnlary 2017Intel CorporationDualCore Inte尸Xeon唧processor LV and ULVDatasheet,2006Ranganathan P,Leech P,Ifwin D,Chase JEnsembleLevel power management for dense blade serversIn:Procof the 33rdAnnual Intl Sympon Computer Architecture(ISCA 2006)Washington:IEEE Computer Society,20066677doi:lO1109ISCA200620】Brunschwiler T,smith B,Ruetsche E,Michel BTo
限制150内