书签分享收藏举报版权申诉 / 9

当前位置：首页 > 研究报告 > 论证报告 > 分布式系统中基于非合作博弈的调度算法-童钊.pdf

分布式系统中基于非合作博弈的调度算法-童钊.pdf

上传人：1890****070

文档编号：101817

上传时间：2018-05-12

格式：PDF

页数：9

大小：2.37MB

( 4.5 )

《分布式系统中基于非合作博弈的调度算法-童钊.pdf》由会员分享，可在线阅读，更多相关《分布式系统中基于非合作博弈的调度算法-童钊.pdf（9页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第4 3卷第1 0期2 0 1 6年1 0月湖南大学学报(自然科学版)Journal of Hunan University( Natural Sciences)Vol. 43, No. 10Oct. 2 0 1 6文章编号:1674- 2974(2016)10- 0139- 09分布式系统中基于非合作博弈的调度算法童钊1,肖正2,李肯立2,刘宏1,李俊1( 1.湖南师范大学数学与计算机科学学院,湖南长沙 410012;2.湖南大学信息科学与工程学院,湖南长沙 410082)摘要:针对分布式系统中任务调度问题,根据分布式环境下的任务调度特性,建立了一个非合作博弈的多角色任务调度框架,在此基础上

2、提出了一种基于纳什均衡联合调度策略的分布式强化学习算法.相比于静态调度算法,该算法需要更少的系统知识.能使调度器主动学习任务到达和执行的相关先验知识,以适应相邻调度器的分配策略,目标是使得调度器的策略趋向纳什均衡.模拟实验结果表明:所提出的算法在任务的预期时间和公平性上相对于OLB(机会主义负载均衡)、M ET(最小执行时间)、M CT(最小完成时间)等同类调度算法具有更好的调度性能.关键词:分布式计算;强化学习;任务调度;负载均衡中图分类号:TP301. 6 文献标识码:AScheduling Algorithm in Distributed SystemsBased on Non- Coo

3、perative GameTONG Zhao1,XIAO Zheng2,LI Ken- li2,LIU Hong1,LI Jun1(1. College of M athematics and Computer Science,Hunan Normal Univ,Changsha,Hunan 410012,China;2. College of Computer Science and Electronic Engineering,Hunan Univ,Changsha,Hunan 410082,China)Abstract: To address the task scheduling pr

4、oblem in distributed systems, based on an important fea-ture of task scheduling in distributed computing environment, we have established a non- cooperative gameframework for multi- layer multi- role, and put forward a distributed reinforcement learning algorithm of thejoint scheduling strategy of N

5、ash equilibrium. Compared with static scheduling algorithm, the proposed al-gorithm needs less system information. It enables the scheduler to actively learn task arrival, perform re-lated knowledge and adapt to the adjacent scheduler allocation policy. The target is to move the schedulersstrategy t

6、oward Nash equilibrium. Simulation experiments show that the proposed algorithm achieves ex-cellent performance in expected response time of tasks and fairness, compared with classical scheduling al-gorithms such as OLB, M ET and M CT.Key words: distributed computing; reinforcement learning; task sc

7、heduling; load balance收稿日期:2015 07 24基金项目:国家自然科学基金资助项目( 61370095, 61502165) , National Natural Science Foundation of China( 61370095, 61502165) ,湖南师范大学大学生创新性实验项目( 201501023)作者简介:童钊( 1985- ) ,男,湖南岳阳人,湖南师范大学讲师,博士通讯联系人, E- mail: tongzhao hunnu. edu. cn万方数据湖南大学学报(自然科学版) 2016年随着科技的发展,基于Internet的计算方式发展迅速

8、.如今云计算试图对线上资源进行虚拟化整合并使得需求更加透明 1- 2 .可以得知,当今的计算方式从独立的计算模式向网络化方向发展.云计算作为目前广泛部署的分布式系统,该系统可以提供巨大的计算能力满足并发请求,使得云计算在日常生活中变得更加重要.而在云计算系统中,任务的负载均衡是发挥其巨大潜力的关键因素 3 .在分布式系统中,存在大量的不确定性.由于网络不稳定的通信消耗以及计算能力的波动,导致任务的执行时间是随机的,这些参数取决于系统的当前状态.基于历史记录或工作负载建模的预测用来评估工作的执行时间 4 .精度差和复杂度高是这类方法的缺点.此外,由于任务随机到达,其大小和CCR( Computa

9、tion to Communication Ratio,计算通信比)是无法预测的.因此,在分布式系统中动态算法受到广泛研究.在分布式计算系统中,批处理模式是一类动态调度方法. M in- M in, M ax- M in和Suffrage是三个典型的启发式批处理算法,这种算法为了获得任务到达和执行信息,很多时间用于等待和评估,缺乏实时性.相反,在线模式中,任务到达后被立即调度,如机会主义负载均衡( OLB, Oppor-tunistic Load Balancing)的算法,最小执行时间( M ET, M inimum Execution Time) ,最小完成时间( M CT, M inim

10、um Completion Time)等调度算法 5- 6 .然而它们忽略了后续任务的到达和对整体性能的影响.为了获得全局优化,诸多学者提出了新的动态算法来适应任务的到达和执行过程, Kwok提供一个资源计划系统来存储下面工作的资源 7 .Yang提出一种基于应用程序级和系统级的性能预测任务调度方案 8- 9 .在分布式系统中,负载均衡涉及众多的调度器之间的协作.据统计,这类问题研究较少.就合作型调度而言,几个决策者合作决策以使整个系统性能最佳, M ashayekhy等基于合作博弈理论研究了该调度问题 10- 11 ; Peter提出基于经济学中竞标概念的合同网协议 12- 13 ; Sub

11、rata等将网格负载均衡问题建立为一个非合作博弈模型 14 .在上述研究中,博弈论是一个建立协同问题模型的主要工具.对于该类问题,现有大多数研究使用全局方法,目标是最小化所有任务的平均响应时间.实际上,这些算法在非马尔科夫环境下可能会导致失败 15 . Subrata等人研究非马尔科夫环境下任务调度算法的执行性能 13 - 15 .由于分布式系统存在的诸多不确定性,越来越多的研究人员将“强化学习”这种方法引入到该研究领域.通常,将“强化学习”定义为智能系统从环境到行为映射的学习,使得奖励信号(即,强化信号)的函数值最大,在强化学习中由环境提供的强化信号是对产生动作好坏的一种评价(通常为标量信号

12、) ,而不是告诉强化学习系统RLS( Reinforcement Learn-ing System)如何去产生正确的动作.由于外部环境提供的信息资源较少,使得RLS必须靠自身的经历进行学习.通过这种方式,强化学习系统在行动评价的环境中获得知识,改进行动方案以适合当前环境 15 .分布式环境中的处理机,在本文中称为处理单元PEs( Process Elements) .在分布式环境中,一个高效的任务调度算法是必要的.而在分布式环境的调度中,一个调度器可以将任务分配给其管理的处理单元,或其他相邻调度器.因此,调度器之间存在合作的关系,相对于集中式调度,分布式调度有两个重要的问题需要解决: 1)调度

13、器之间,尤其是来自不同域的调度器之间,如何调度. 2)调度器之间是如何相互作用.在本文中,针对自利型调度引入强化学习方法,使得在多个调度器之间进行协同调度时考虑环境具有的不确定性,同时还能适应其他的调度器的策略,达到最优调度的目的.1分布式系统调度框架企业或者是科研机构中的所有资源通过互联网连接在一起,但他们可能属于不同的管理域.每一个域中都有一个或者多个调度器来处理到达的任务.由于缺少必要的资源或是计算效率低,任务可能会被转送到其他域.以分布式计算为例,用户并不关心任务请求是在何地处理的.图1是一个分布式计算系统,资源以管理域分割开,系统中有多个调度器.用户提交任务给这些调度器,并且由后台的

14、调度器分派相应的计算单元去执行.面对如此多的调度器,首先是怎样将它们组织起来. Rao等提出了一个分布式资源共享框架 16 ,它提供了两个调度器之间详细的相互关系.因此,本041万方数据第10期童钊等:分布式系统中基于非合作博弈的调度算法图1分布式计算系统Fig. 1 Distributed computing system本文提出了一个分层调度模型(图2) .在更高层次中的调度器具有更广阔的视野,所以这种分层设计可以减少通信和提高效率.在图2中,所有的PE都位于资源层,最终是由处理器分配任务给它们.一个PE属于一个或多个自治域并且在多个调度器中管理,一个调度器可以和其管理的PEs进行通信.换

15、而言之,调度器可以知道它管理的每一个PE的状态,在同一层的调度器管理下一层的元素.调度器之间通过细线连接起来,这些细线代表它们是相邻并且可以进行通信,当在调度时,任务可以被分配给调度器直接管理的PE或由其相邻的调度器图2调度器组织架构Fig. 2 The scheduler framework对应管理的PE中,如果任务仍然不能被合理分配,则调度器将其移交给更高一层的调度器.在分布式计算系统的资源可以分为3种角色:1) PE( Process Element) :用于计算.2)协作型调度器:和其它的在相同组的协作型调度器共同去处理接收的任务.共享相同的利益,在执行任务时又充分合作的调度器被称作协

16、作型调度.通常一个域形成一个组,本文不做讨论.3)自利型调度器:能够自主接受或拒绝任务以达到自身利益最大化;其所代表的组之间通过达成一个联合战略,实现利益的双赢.图2显示了调度器的组织结构和角色之间可能的关系, PE由一个或多个调度器负责.在中间层,四边形代表一个域,协作型调度器以组的方式划分,他们分配任务给在同一个组内的其它调度器或附属于它的PE.一个重要的问题是,这样一个可能由成千上万的资源组成的分布式计算平台是怎样协同进行工作的,各角色之间的各种协议使之成为一个松散耦合的系统.1)站内分配协议:适用于PE和协作型调度器之间. M in- M in, M ET, M CT等调度算法属于该协

17、议;2)站内合作协议:适用于协作型调度器之间.在一个组的协作型调度器互相帮助来优化整个组的性能,再调度和合作型博弈使用这样的协议;3)站间合作协议:适用于自利型调度器之间.在其所代表的组之间通过达成一个联合战略,实现利益的共赢.这个协议的研究相对较少,是本文的研究重点.这个框架来自于Sakellariou, R.提出的分层semi- selfish网格模型 17 .但本文所提出的模型更普遍,是Hanna H中的模型成为一个特例 18 .这个框架具有大规模的分布式计算环境的管理特性.2博弈型调度在分布式系统中,任务的到达是一个服从一定概率分布的随机事件 19 ,每一个调度器将这些到达的任务作为一

18、个序列缓存起来.假设分布式计算系统可以处理m种不同的任务,集合T = t1 , t2 , ,141万方数据湖南大学学报(自然科学版) 2016年tm代表了所有可能的任务类型, PE集合定义为PE= PE1 , PE2 , , PEn ,其中n代表PE的数目.调度器的集合形式为S = S1 , S2 , , S| S| ,其中| S|为调度器数目, ji ( k)定义为在时间点k,到达调度器Sj类型为ti的任务,调度器Sj中的所有任务根据它们到达的时间定义为任务流,用TFj代表调度器S j上的任务流,每一个独立的任务流可能会有不同的到达过程,一个任务 ji ( k)可以被分配到相邻的调度器或者

19、是附属于该调度器的PE.本文用一个元组 ji ( k) , b ( b PE S)代表一个任务分配,任务的响应时间是指:从被调度到达完成的时间间隔,以此作为任务调度的目标.2. 1博弈模型在图2的基础上,假设顶部调度层有n个自利型调度器,则自利型调度模型如图3所示.图3自利型协同模型Fig. 3 The collaborative model of heter. scheduler任务以 i的速率到达调度器i ;调度器以速率sii接收任务并以速率s ii传递剩余的任务给调度器j ;调度器i也以速率s ji接收来自调度器j传递的任务.这些变量之间存在如下关系: i + j is ji = sii

20、 + j is ij , ( 1)i i = is ii . ( 2)让 i为自利型调度器i所代表组的服务率,如果这个组建模成M / M / 1类型排队系统,式( 3)确保有限的排队长度.sii i . ( 3)根据式( 2) ,式( 3)可推导出以下关系:i i i i . ( 4)在这个模型中,自利型调度器决定自身的接受率sii和拒绝率s ij ,调度器的策略可以用向量si si1 , si2 , , sii , , sin 来表示多个调度器的联合策略表示为s s1 , , sn .自利型调度器有自己的利益目标,调度器根据给定的目标独立决策,对于分布式系统中的大多数应用,响应时间被广泛关注

21、.本文假设自利型调度器旨在最小化它们接受任务的响应时间,期望响应时间RT i ( s)由式( 5)给出:RT i ( s) = CT i ( s) + TT i ( s) . ( 5)式中: CTi ( s)为调度器i接受任务的期望完成时间;TTi ( s)为拒绝任务的期望传输时间.如果M / M / 1模型是适用的,期望完成时间可按式( 6)计算:CT i ( s) = 1i - sii. ( 6)Grosu当把通信网络也看作为一个M / M / 1排队系统时 19 ,一个任务的期望传输时间的近似值可以由式( 7)得到.在式( 7)中参数t取决于平均任务长度,带宽等.TT i ( s) =

22、t1 - tni= 1ns ij, ni= 1ns ij 1t .( 7)ni= 1ns ij为通过网络的全部流量.从式( 5) 式( 7)中可以得知,一个调度器的决策受到其它调度器调度策略的影响,自利型调度可以看作是一个博弈过程,通过竞争,慢慢形成一个没有调度器愿意改变它当前的调度策略的状态.换而言之,没有调度器可以由单方面调整他们的策略来进一步减小他们的响应时间,这种状态在博弈论中称为纳什均衡.事实上,自利调度器的协作旨在找到促成纳什平衡的联合策略.根据博弈理论,本文使用下面的博弈来定义所研究的负载平衡问题.定义1(自利型调度器的负载平衡) :自利型调度器的负载平衡问题由以下几个部分组成:

23、选手: n个自利型调度器.策略:联合策略s s1 , . . . , sn ,由每一个调度器的接受率和拒绝率组成.偏好:每个选手的偏好由它的期望响应时间RT i ( s)来表示.当且仅当RT i ( s) RT i ( s ) ,则相比于策略s更偏好s .由于期望响应时间是连续、递增的凸函数,则上述博弈存在唯一的纳什平衡. Abdallah提出了两种241万方数据第10期童钊等:分布式系统中基于非合作博弈的调度算法基于排队理论的算法来得到博弈的均衡解 20 .但是需要预测对象的到达率和服务率等参数.此外,这些算法在Non- M arkovian环境下可能失败.所以接下来本文提出了一种基于在线学

24、习的算法,它不再需要预测参数或使用受M arkov限制的式( 6) ,式( 7) .2. 2基于学习的博弈调度算法本文需要通过解决上述的博弈,实现负载均衡.一个解是指纳什均衡对应的联合策略,但满足式( 1)式( 3)的限制,见以下的定义.定义2(纳什均衡)定义1中的负载均衡博弈的纳什均衡是指联合策略s对每个调度器i ( i= 1, ,n)满足:sI argminRT i , s1 , , si , , sn .在给出该算法之前,为方便起见,本文将调度器的策略转变成概率形式,使得最终策略满足式( 1) 式( 3)而无需在计算时考虑.策略被重新定义成调度器分配任务给其他调度器的概率: i = i1

25、 , . . . , in ( nj = 1 ij = 1)代表这个新的策略,这里 ij为调度器i分配任务给调度器j的概率,策略 i和s i是等价的.下列关系表示了接受率或拒绝率sij与概率 ij之间的关系:sij = ij . i + js ji . ( 8)由于 nj = 1 ij = 1,式( 1)得以满足.当解决定义1, 2的问题时,每一个调度器需要知道任务到达过程和处理过程以及其它调度器的策略和网络性能等,这使问题变得非常复杂.在本文中,使用机器学习方法去学习这个非合作博弈过程,机器学习是一门研究通过样本自动挖掘知识的各种方法的学科.强化学习是一种在线学习方法,它对比较有利的行为进行

26、强化,样本是历史的分配.这种方法的显著优势就是与模型无关,这就意味着不需要得到像任务到达过程以及网络性能等任何背景信息.本文使用强化学习算法中最常用的Q学习求解上述博弈调度问题.在Q学习中Q函数代表累积响应时间,当任务被分配并完成后,根据任务的响应时间,更新该分配的Q值.式( 9)表示一个任务被分配到j的时候调度器i的更新操作:Qi ( Agtj ) = ( 1 - ) Qi ( Agti ) + r + maxkQi ( Agtk ) . ( 9)这里Agtj为调度器j ; ( 0, 1为学习率; r为一个实时响应时间的单调递减函数; 为折扣因子( Q学习的一个参数) .按式( 10)迭代,

27、确保式( 9)的收敛. = 11 + visits( Agtj ). ( 10)visits( Agtj )是迄今为止分配给Agtj的次数.式( 11)表示调度器i的策略 i . ij = Qi( Agtj ) kQi ( Agtk ) .( 11)式( 9) 式( 11)给出了寻找最少响应时间的调度策略的算法,但是还存在两个问题:1)当使用这个算法时,调度器难以稳定在均衡状态,因为每一个调度器的策略是摆动、不断调整的.所以必须设立一个机制去测试是否达到均衡并引导策略的调整.当达到均衡时,没有一个调度器愿意违反他们当前的策略.当调度器企图从它的老策略 oldi变成新策略 newi前,观察其它调

28、度器的性能,如果m个调度器的性能由于上述策略的调整而得到提高,那么就表示m个调度器受益于改变,然后调度器i的策略根据式( 12)的概率被更新. i mn oldi or i 1- mn newi . ( 12)在式( 12)中,如果m= 0,则没有调度器性能提高,则 newi以概率一的方式被接受.如果m= n,则说明离均衡存在较大的偏差, oldi被保留.如果所有的调度器停止更新,那么当前的策略就认为是一个纳什均衡的联合策略.2)任务转发循环.由于转发增加了任务的响应时间和浪费了网络带宽,所以多次转发的概率很小,但仍然存在这种可能性,任务一直被转发,形成了循环.为了避免这种异常情况的发生,一个

29、任务在被调度器接受之前允许最多转发3次.由于不超过3次的转发限制,最终所有的到达任务都被接受,因此,式( 2)得到满足.单个调度器的算法如下所示.它是一种分布式算法,每个调度器独立运行这个算法,最后停止到唯一的均衡策略.341万方数据湖南大学学报(自然科学版) 2016年算法1基于强制学习的非博弈调度算法Input: / /输入Set ij = 1n , Qi ( j ) = 0, 1 j n;Output: / /输出strategy iat Nash equilibrium; / /纳什均衡策略if Forward Times = 3 then/ /循环转发次数Allocate jobs

30、 to itself; / /分配任务elseAllocate jobs randomly; / /随机分配任务Increase its forward times by 1;end ifif Current job is assigned to schedulerjthenW ait for its response timerfromj; / /等待响应时间Compute new strategy newijby Eq. 9 and 11; / /按方法迭代Observe the performance of other schedulers; / /观察调度器性能Update its s

31、trategy by Eq. 12; / /更新操作if m = 0 theninform other schedulers this possible equilibrium strate-gy;if All the schedulers report their equilibrium strategy thenreturn newij ;end ifend ifend if/ /整个算法结束3实验及结果分析本节通过模拟实验研究在不同系统利用率、异构性下所提出方法的性能.实验中使用的系统参数类似于Abdallah中的设置 20 .有32个完全连接的候选调度器.表1给出了参数配置.调度器i的

32、任务到达率根据到达比例因子q i计算: i = qi ,这里为全部到达率之和 i i .平均通信时间t被假设成0. 001 s,即传输一个任务平均花费t s.表1系统配置ITab. 1 The system configuration I调度器1. 6 7. 12 13 14. 18 19. 22 23. 26 27. 32服务率10 50 100 100 150 200 250到达比0. 002 5 0. 01 0. 02 0. 025 0. 04 0. 05 0. 07使用的性能指标是均衡时的期望响应时间和公平指数.公平指数在自利型调度器中是重要的,它被定义为:I( C) = nj = 1

33、Cj 2n nj = 1C2j. ( 13)输入C是向量, C = ( C1 , C2 , . . . , Cn ) ,这里Cj是调度器j的期望响应时间.如果I = 1,所有的调度器有相同的响应时间,这表明负载达到均衡.如果I 1,表明某些调度器可以承担更多的负载.出于比较的目的,实现了两个负载均衡算法:全局最优算法( GOS) 21 :这个算法的目标是最小化系统执行任务的期望响应时间,提供最优解.通过解决下列非线性最优问题而得到每一个调度器的策略:min RT = 1 i js ijCT j + ( i - sii ) TT i .( 14)比例算法( PROP_M ) :每个调度器依据各个

34、调度器的处理速度,按比例分配给它自己或者其他调度器,如式( 15)所示:sij = i jk k. ( 15)下面将展示并分析实验的相关结果.3. 1最佳响应策略的收敛性每个调度器i的初始策略是元素1/ n组成的向量.然后每个调度器在每一次迭代中改进和更新其策略.在第一组实验中,本文研究最佳响应策略的收敛性,即当其余的调度器保持策略不变时的最好调度策略.实验模拟一个32个调度器的异构系统以及设置系统利用率为60% ,即整个系统的到达率是2 316.初始调度策略在满足式( 1) 式( 3)的条件下随机产生,并且在其它调度器保持他们初始策略时让一个调度器运行该算法.上述实验重复20次,每一次调度器

35、的初始策略是随机生成的,取20次实验的平均响应时间.图4显示了当系统利用率为60%时,调度器的最后两个策略的期望响应时间的差.大约200次迭代之后绝对差下降到10- 4 ,被认为达到收敛.算法的收敛速度是F. Noriguki 22 和N. N. Dang 23 静态算法的10倍,这是因为算法需要更多的时间用于学习.但本文认为较慢速度是可以容忍,因为在分布式系统处理的数以千计的任务中只有数百个任务受到收敛时间的影响 24- 25 .图5显示了在不同的系统利用率下收敛时的迭代次数.随着系统的利用率越来越高,本文的算法需要更多的迭代来获得最佳响应策略.这是因为系统441万方数据第10期童钊等:分布

36、式系统中基于非合作博弈的调度算法只有在大量的任务到来之后才会达到稳定的状态.对于利用率为90%时,收敛速度增加到大约460次迭代.迭代次数图4最佳响应策略的收敛性Fig. 4 The best response strategy of convergence系统利用率/ %图5系统利用率对收敛性的影响Fig. 5 The influence of systemutilization of convergence3. 2系统利用率的影响模拟一个异构系统用于研究系统利用率的影响.这个系统由32个调度器(见表1)组成.用表示系统利用率.它由公式 / i i及条件0 1计算而得.且越大,系统负载越大.

37、图6,图7是当从10%提高到90%时对应的计算结果.其中图6是不同系统利用率下期望响应时间.随着系统的利用率升高,期望响应时间变得更长. PROP_M算法效果较差,因为对于性能较差的调度器负载过大.而GOS算法效果最好,它提供了最优系统解决方案.我们的算法有一个次优的性能,例如,当系统利用率为60%时,响应时间比PROP_M算法少25%左右,比GOS多10%左右.系统利用率/ %图6响应时间Fig. 6 Expected response time系统利用率/ %图7公平指数Fig. 7 Fair index图7显示了3种算法的公平指数. PROP_M算法和我们算法的公平指数在1左右,对所有的

38、调度器都很公平. GOS算法的公平指数介于1和重负载情况下的0. 935之间.图7也说明了调度器特性:由于自利性而缺乏充分的合作.3. 3异构性的影响在本节中,研究异构性对负载均衡性能的影响.处理器的速率是描述系统异构性一种简单的方法.速度偏斜度( speed skewness)常用于表征异构性,其定义为系统中计算机的最大处理速率与最小处理速率之比.通过改变速度偏斜度研究负载均衡方案的有效性.实验模拟了一个包含32个调度器的系统,调度器分为3组,如表2所示.调度器1 8代表快速组,9 24代表中速组, 25 32代表慢速组.起初,模拟一个同构系统,通过改变速度偏斜度进行了6个实验,系统利用率均

39、设为60% .总的达到速率如表2所示,任务到达比例qi如表1所示.541万方数据湖南大学学报(自然科学版) 2016年表2系统配置IITab. 2 The system configuration IISpeedskewness 1 4 16 36 64 100 i ( i = 1 8) 10 100 200 300 400 500 i ( i = 9 24) 10 50 50 50 50 50 i ( i = 25 32) 10 25 12. 5 8. 33 6. 25 5Over arrival rate 192 1 080 1 500 1 960 2 430 2 904实验结果如图8,

40、图9所示,随着偏斜度的增加,系统的计算能力增强,进而期望响应时间减少.对于同构系统而言,这3个算法有相同的性能.当系统资源性能存在差异时,本文的算法和GOS期望响应时间减少的更快.当偏斜度超过50,本文的算法与GOS算法接近.这意味着在高度异构系统下,本文所提出的算法是有效的.从图9中的公平指数可知:增加速度偏斜度时,本文所提出的算法和PROP_M算法公平指数几乎为1. GOS公平指数从低偏斜度时的1下降到高偏斜度时的0. 82. GOS算法的分配并不能保证平等的期望响应时间,尤其在高偏斜度情况下.均衡的负载和接近最优的性能是本文提出算法的主要优势.速度偏斜度图8期望响应时间Fig. 8 Ex

41、pected response time速度偏斜度图9公平指数Fig. 9 Fair index4结论本文研究并行分布式系统中调度问题.在这种情形下,调度器不仅适应任务到达的随机性和系统负载的多变性,而且适应其他调度器的分配策略.本文基于强化学习提出了相应的调度算法.调度器主动学习任务到达和执行以及与之相邻的调度器行为知识,通过这种方法,在一定程度上实现了调度器之间的协作并且降低了平均响应时间.模拟实验证明,该算法相比于几个经典的调度算法在任务的预期时间和公平性上具有更好的性能.参考文献 1 XU Yu- ming, LI Ken- li, HE Li- gang, et al . A hyb

42、rid chemi-cal reaction optimization scheme for task scheduling on hetero-geneous computing systems J . IEEE Transactions on Parallel& Distributed Systems, 2014, 26( 12) : 3208- 3222. 2 郑明玲,蒋句平,袁远,等.一种面向大规模计算机的监控管理系统 J .湖南大学学报:自然科学版, 2015, 42( 4) : 107- 113.ZHENG M ing- ling, JIANG Ju- ping, YUAN Yua

43、n, et al . Amonitoring and management system for the large- scale comput-er J . Journal of Hunan University: Natural Sciences, 2015,42( 4) : 107- 113. ( In Chinese) 3 林闯,苏文博,孟坤,等.云计算安全:架构、机制与模型评价 J .计算机学报, 2013, 36( 9) : 1765- 1784.LIN Chuang, SU W en- bo, M ENG Kun, et al . Cloud compu-ting securit

44、y: architecture, mechanism and modeling J . Chi-nese Journal of Computers, 2013, 36 ( 9) : 1765 - 1784. ( InChinese) 4 GUTIERREZ- GARCIA J O, RAM IREZ- NAFARRATE A.Collaborative agents for distributed load management in clouddata centers using live migration of virtual machines J . IEEETransactions

45、on Services Computing, 2015, 8( 6) : 916- 929. 5 BRAUN T D, SIEGEL H J, BECK N, et a l. A comparison ofeleven static heuristics for mapping a class of independent tasksonto heterogeneous distributed computing systems J . Journalof Parallel and Distributed Systems, 2011, 61( 6) : 810- 837. 6 LI Ken-

46、li, TANG Xiao- yong, LI Ke- qin. Energy- efficient sto-chastic task scheduling on heterogeneous computing systems J . IEEE Transactions on Parallel and Distributed System,2014, 25( 11) : 2867- 2876. 7 KW OK Y K, HW ANG K, SONG S S. Selfish grids: game-theoretic modeling and NAS/ PSA benchmark evalua

47、tion J .IEEE Transactions on Parallel and Distributed Systems, 2007,18( 5) : 621- 636. 8 YANG L, SCHOPF J M , FOSTER I. Conservative schedu-ling: using predicted variance to improve scheduling decisionsin dynamic environments C / / International Conference on Su-percomputing. Leipzig, Germany: IEEE

48、Computer Society,641万方数据第10期童钊等:分布式系统中基于非合作博弈的调度算法2003: 15- 21. 9 ZHANG Long- xin, LI Ken- li, ZHANG Fan, et al . M aximi-zing reliability with energy conservation for parallel task sched-uling in a heterogeneous cluster J . Information Science,2015, 319( 20) : 113- 131. 10朱夏,宋爱波,东方,等.云计算环境下基于协同过滤的个性化推荐机制 J .计算机研究与发展, 2014, 51( 10) : 2255-2269.ZHU Xia, SONG Ai- bo, DONG Fang, et al . A collaborativefilter recommendation mechanism for cloud c

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

此文档不允许下载，请继续在线阅读

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 分布式系统基于合作博弈调度算法童钊

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：分布式系统中基于非合作博弈的调度算法-童钊.pdf
链接地址：https://www.taowenge.com/p-101817.html