《基于局部位移信息的多智能体编队控制策略研究-孙鑫.pdf》由会员分享,可在线阅读,更多相关《基于局部位移信息的多智能体编队控制策略研究-孙鑫.pdf(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类号U D C密 级单位代码大连海事大学硕士学位论文基于局部位移信息的多智能体编队控制策略研究孙鑫1015l指导教师 于双和 职称 教授学位授予单位 大连海事大学申请学位类别 学术硕士 学科(专业) 控制科学与工程论文完成日期 2017年1月 答辩日期 2017年3月答辩委员会主席 递挫万方数据Research of Formation Control Strategy of Multi-agentSystem Based on Local Displacement InformationA thesis Submitted toDalian Maritime UniversitylII I
2、IIIlllllill1llllllllllllllllllllllllllllllIY320281 0In partial fulfillment of the requirements for the degree ofMaster of EngineeringbySun Xin(Control Science and Engineering)Thesis Supervisor:Professor Yu ShuangheMarch 2017万方数据大连海事大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博硕士学位论文
3、竺基王屋壑僮整信息丝多蟹篮签缠丛控制筮整硒塞:。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经公开发表或未公开发表的成果。本声明的法律责任由本人承担。学位论文作者签名:麴鑫学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即:大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。
4、同意将本学位论文收录到中国优秀博硕士学位论文全文数据库(中国学术期刊(光盘版)电子杂志社)、中国学位论文全文数据库(中国科学技术信息研究所)等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于: 保密口在年解密后适用本授权书。不保密口 (请在以上方框内打“”)论文作者签名:韵、会导师签名:掀#日期:伽17年弓月叶日万方数据中文摘要摘要智能体,指的是具有智能的实体,在信息技术尤其是人工智能和计算机领域,可以被看做是通过传感器感知周围环境、通过自主行为实现一系列提前设定的任务或目标的计算系统。多智能体系统的编队控制指的是多个智能体基于一些简单的计算和检
5、测能力,独立运动,最后形成期望的队形并在完成既定任务的过程中保持队形的稳定,而系统编队控制问题的核心是对于编队控制算法的研究,目的是使多个相互独立运动的智能体在控制算法的作用下形成期望的几何队形,并保持队形的稳定。本论文主要研究多智能体系统的编队控制问题,主要包括多智能体系统的编队形成和编队保持(轨迹跟踪)两个方面。在研究多智能体系统编队形成控制时,以分布式控制策略为基础,对多智能体系统的编队形成问题进行研究。这一部分将多智能体系统的通信结构用代数拓扑图表示,系统中每个智能体只需要获取部分相邻智能体的相对距离和相对角度信息,并在此基础上设计基于位移信息的一致性控制算法。然后运用李雅普诺夫稳定性
6、判别方法和Matlab仿真,在理论和实际两方面对控制律的有效性和稳定性做出验证。在多智能体系统编队形成之后考虑系统的编队保持控制问题。该部分以领航一一跟随法为基础,目的是使整个系统在按照预定轨迹运动的同时保持整个系统编队队形的稳定。研究时将系统中的两个智能体依次看做领航者和跟随者,其中跟随者只需要获取与领航者之间的相对位置信息,并设计控制算法。同样地,通过运用李雅普诺夫稳定性判别方法以及拉萨尔不变性定理和Matlab仿真,在理论和实际两方面对所设计的控制算法的有效性和稳定性做出验证。关键词:多智能体系统;编队控制;一致性算法;轨迹跟踪;领航跟随法万方数据英文摘要ABSTRACTAgent is
7、 an intelligent entity,especially in information technology,artificialintelligence and computer science,which Can be seen through the sensor to sense theenvironment,independent action,calculation system and realize some preset targetsor tasksThe formation control of multi-agent system mean as the ag
8、ents that in thesystem Can make independent act,which based on some simple calculation anddetection abilityThen the system make independent movement,finally form theexpected formation and complete the assigned task while it maintains the stability ofthe formationThe core of the formation control iS
9、the research of the controlalgorithm that makes the mumal independent agents form the expected geometricformation and keep the stability of the formationIn this thesis,we mainly researchthe formation control of multiagent system,mainly including two aspects:theformation forming and the formation kee
10、ping(trajectory tracking)The formation forming bases on the distributed control strategy,the formationforming of multiagent system is researchedIn this part,we use algebraic topologygraph to express the communication structure of the multi-agent system,the agent inthe system only need to get the pos
11、ition information of some adj acent agents,and onthe basis of this we design the consensus control algorithm based on displacementinformationThen the effectiveness of control law is verified by Lyapunov stabilityanalysis and Matlab simulationAfter the multiagent system formed the formation,we consid
12、er the problem offormation keeping of the whole systemIn this part,based on the leader-followermethod,aims at keeping the stability of the formation while the system moveaccording to the predetermined trajectoryDuring the researching,every two agentswas regarded as the leader and follower in the sys
13、temThey only need to get therelative position information of each other,and then design the control algorithmSimilarly,the effectiveness of control law is verified by Lyapunov stability analysis,Lasalle invariance principle and Matlab simulation万方数据英文摘要Key Words:Multi-agent System;Formation Control;
14、Consensus Algorithm;Trajectory Tracking;Lead-following Law万方数据目 录目录目录一1第1章绪论111课题研究的背景和意义一112多智能体系统编队控制的研究现状一213研究内容以及结构安排一6第2章基础知识一821引言一822图论的相关知识8221图论的基本概念8222图论的矩阵描述一923一致性理论相关知识10一231一致性算法一10232编队控制一致性算法1124李雅普诺夫稳定性理论12241稳定性概念12242李雅普诺夫第二法(直接法)一1325拉萨尔不变性定理1426本章小结一15一第3章基于局部位移信息的多智能体编队形成控制策略
15、一1631引言1632编队形成控制算法1633编队形成控制算法稳定性分析1934编队形成仿真验证2335本章小结一30-第4章基于局部位移信息的多智能体编队保持控制策略一31_41引言一3 142编队保持控制算法一3卜43编队保持控制算法稳定性分析36万方数据II录44编队保持仿真验证一3845本章小结一42第5章总结与展望4351论文总结4352工作展望44参考文献一46致谢:50万方数据基于局部位移信息的多智能体编队控制策略研究第1章绪论11课题研究的背景和意义在现实生活和自然界中,普遍存在着一些系统,这些系统之中通常包含很多个体,系统中的这些个体在具有一定的独立性的同时,相互之间又以某种
16、方式保持着直接或者间接的联系而构成群体,与此同时形成一定的有规律的队形序列。这些由具有简单智能的个体构成的群体,可完成许多单个个体不能完成的复杂的任务。比如:大雁为了迁徙而形成“一”字或“人”字形飞行队形,如图11中(a)所示;蚂蚁为了搬运食物而形成特定队形,如图11中(b)所示;狼群为了捕猎食物形成捕猎队形,如图11中(c)所示。同时,由于处于编队中的每一个个体之间的相互协作,大大提高了它们行动成功的几率。仅以大雁迁徙为例,科学家通过研究发现,当大雁以“一”字或“人”字形队形飞行进行迁徙的时候,在飞行过程中会产生涡流效应,该效应使得编队飞行的大雁比单独飞行时节省了百分之七十还要多的能量“3。
17、另外形成编队也有利于在完成某个特定任务的过程中,保护(c)图11自然界中动物的编队行为Fig 11 Formation Behavior ofAnimals in Nature万方数据绪论群体中的个体,使其免于受到来自群体之外的伤害。当然,有时候由于外部环境的影响,群体队形会出现成员丢失、队形破坏以及增加新的成员等现象,这时就需要对编队进行重组。正是由于动物界的群体编队行为所体现出的及时性、效率性、稳定性等显著优势,已经有越来越多的学者致力于多智能体编队控制算法的研究之中。近年来,国内外广大学者对多智能体系统的研究,尤其是对多智能体编队控制、协同合作问题的研究逐渐成为热点课题,主要原因有以下几
18、点晗3:第一,无线通讯技术以及计算机技术的快速发展,使得由多个智能体组成的多智能体系统通过协同合作来完成本来由单个智能体无法或难以完成的工作成为可能,这为多智能体系统编队控制的研究提供了有力的技术支持。第二,多智能体系统具有单个智能体难以拥有的突出的感知能力、高效率的并行执行能力、稳定可靠的鲁棒性和出色的容错能力等优势,使得多智能体协同合作可以完成许多单个智能体所不能完成的任务。第三,构造一个由几个简单智能体所组成的多智能体系统所需的成本比构建一个大型智能体小得多3。最后也是最重要的一点,对这一领域的研究有着广阔的应用潜力,并对交叉学科的生成以及其它学科的推动有着深远的影响H1。与此同时,多智
19、能体编队也已经在社会生活的各个领域得到了广泛的应用。例如:移动机器人协同完成任务、无人机编队侦查、水下航行器编队航行、战斗机编队飞行,这些任务中每个个体虽然是完全自主的,但同时又要求每个个体与其它个体协同来完成既定的任务晦3。又如,蚂蚁智能体己经广泛应用在通讯网络中来完成负载均衡的任务1。另外,在交通运输业中,还可以控制多个智能体以特定的队形运输物品等等。综上所述,对于合理、有效的多智能体系统编队控制方法的研究,具有非常重要的理论意义和现实意义。12多智能体系统编队控制的研究现状到目前为止,众多国内外学者已经针对多智能体编队形成以及编队保持的控制策略的研究开展了大量的工作。早在1987年,Re
20、ynolds等人针对自然界中鸟群、鱼群等的运动特点进行了建模分析,提出了Boid模型盯1。模型中提出了编队控制的三条基本规则,简单来说分别是:(1)避免个体之间相互碰撞的分离规则;(2)保持个体之间联系的内聚规则;(3)匹配个体之间相对运动速度的排列规万方数据基于局部位移信息的多智能体编队控制策略研究则。这三条规则保证了多智能体系统协同完成任务的可能,对后续关于多智能体编队控制的研究产生了深远的影响。20世纪70年代,一致性研究在管理科学中产生隅3,此后该思想逐渐渗透到计算机领域和自动化控制领域,并在分布式计算、决策和智能体通讯融合方面得到了普遍应用。伴随智能体技术的快速发展,尤其是多智能体编
21、队研究的不断进步,一致性问题在多智能体编队领域得到了更加普遍的研究和运用。在编队控制领域,一致性问题主要指的是在编队控制的过程中使编队中各个成员的状态随着时间的变化逐渐趋于一个特定值。1982年,Borkar阳1等人对渐进同步的一致性问题开展了研究,并在研究过程中加入了分布式策略。1995年,Vicsekn伽等人对二维平面中智能体的离散模型进行了研究,并提出了一种利用相邻智能体状态信息和自身状态信息的控制策略。2l世纪初期,Jadbabaienu等人用矩阵论的方法,对Vicsek所提出的一致性策略进行了分析并发现:如果多智能体之间的拓扑网络能够保持连通,那么该系统的各个状态在一定的时间内必然会
22、趋于一致。与此同时,2004年Murray和OlfatiSaber等将多智能体系统中各个智能体的通讯拓扑关系运用代数图论进行表示,并在此基础上设计了一致性算法,并得到结论n 21:系统的收敛速率可以用拓扑网络的连接度来表征,同时也给出了系统取得平均一致性的前提。该结论成为了一致性算法在多智能体系统编队控制研究领域的理论基础。至此,关于一致性算法的研究逐渐成为编队控制研究的一个热门方向。2005年,Renu副等人提出只要多智能体系统的通讯拓扑图中包括一个有向生成树,那么该系统就可以实现一致性收敛。该结论简化了线性条件下多智能体系统的一致性收敛条件。此后由于对一致性问题研究的不断深入,以及应用领域
23、的不断扩展,同时又因为社会对于多智能体系统需求的不断增加,使得针对一致性问题研究进入了一个快速发展的阶段。与此同时,可控性问题的研究伴随着一致性问题的发展而衍生。2004年,HGTanner(University ofNew Mexico)第一次提出多智能体系统的可控性问题,其本质是将编队控制问题转化成固定拓扑前提下的经典可控性问题及切换拓扑前提下的切换可控性问题n 4|。同样文献n邑161对编队过程中各成员间通信被干扰而导致的通信时断时续问题,即通信拓扑的切换问题进行了研究,也正是由于对编队系统的通信拓扑图的随机切换的研究,导致多智能体系统随机一致性的研究逐渐引起学者的普遍关注。从国内外众多
24、学者的研究中不难发现,多智能体控制策略从广义上大体可以万方数据绪论分为两大类:集中式控制策略和分布式控制策略。集中式控制策略的优点是便于实现,而且在理论上已经相当成熟,但其缺点是当系统中智能体数量增加时,系统的信息交换量会变大,导致无法实现对整个系统的实时控制。相对于集中式控制策略,当一个多智能体系统采用分布式控制策略的时候,系统中的任意一个智能体只需要获取临近的一个或者几个智能体的状态信息,就可以规划整个系统的运动。正是由于分布式控制策略所体现出的灵活性强、信息交换少等优点,该策略己吸引广大研究学者的注意,并取得了大量的研究成果:文献n71通过运用分布式控制策略,主要依靠两个相邻智能体的相对
25、位置关系,通过计算与理想位置的实际偏差实现多智能体的编队控制。文献n踟中,多智能体分布式控制策略与线性化理论和中心流形理论相结合,使得多智能体系统在保持最小刚性编队的同时又保证整个系统具有局部渐近稳定的特性。同时,分布式控制策略也有许多问题有待解决,比如编队控制的稳定性问题、时效性问题、可靠性问题等。针对这些问题,Balch、Arkin和McInnes等人率先将行为方式应用到多智能体编队系统和飞行器编队系统中n 91;Khatib于1986年最先提出人工势场法,文献瞳妇通过运用Khatib提出的人工势场法协同控制原理,把人工势场法延伸应用于飞行器编队的协同控制;文献乜21中,作者提出了虚拟结构
26、的概念之后,Lewis和Tan瞳加于1997年第一次将虚拟结构法运用到多智能体系统的编队控制中;JE Desai等人在研究多机器人系统的队形切换过程中,应用了代数图论的相关知识,解决了编队系统的队形切换问题乜4251;文献瞳刚的作者JE Desai,在领航一跟随控制策略的研究中创造性的提出了在二维平面中基于距离一角度的反馈控制器和基于距离一距离的反馈控制器,即,一fo控制器和,一,控制器。上述五种多智能体系统编队控制策略可归纳为:基于行为的编队控制策略、基于人工势场的编队控制策略、基于虚拟结构的编队控制策略、基于图论的编队控制策略和基于领航跟随的编队控制策略。由于基于图论的编队控制策略和基于领
27、航跟随的编队控制策略在理论上已经很成熟,以及适用性强和操作简单等原因,这两种策略在多智能体编队控制研究领域中得到了众多学者的普遍应用。具体的,基于图论的编队控制策略的基本思路是:将多智能体系统的分布情况映射成为加权图,图中的每个顶点代表系统中的智能体个体,图中的边代表智能体之间的通信关系,图中边的权值代表每个智能体之间的理想距离。文献乜71中详细地讲述了关于图论的基本概念和理论,主要包括图的基本概念以及图的矩阵万方数据基于局部位移信息的多智能体编队控制策略研究描述。文献乜81主要介绍了编队控制中固定拓扑和随机切换拓扑领航一跟随一致性问题,运用代数图论,黎卡提不等式和李雅普诺夫不等式分别给出两种
28、情况下领航一跟随一致性的详细分析。图12所示为三种典型的多智能体系统编队拓扑结构。图12多智能体系统编队拓扑结构Fig 12 Topology of Multiagent Formation System该控制策略的优点是可以表示任意多智能体系统的编队队形,同时有成熟的理论作为研究基础。但其不足之处是要真正把理论与实际应用相结合具有一定难度I 3 0|。基于领航一跟随法的编队控制策略的基本思路是:在多智能体系统编队控制过程中,指定其中一个或者几个智能体为领航者,剩下的为跟随者,只需要对跟随者与领航者之间的相对距离以及相对角度进行控制就可以实现对整个系统的编队进行控制的目的。文献瞳61的作者JE
29、 Desai,设计的,一qo控制器和,一,控制器的基本思路是:前者在编队控制过程中通过利用领航者和跟随者之间的距离误差和角度误差来控制自身的运动状态,使得系统中各个成员的状态达到一个设定的值,后者是将系统中任意两个智能体看做领航者,跟随者通过利用自身与两个领航者的距离误差来控制自身的运动状态,通过保持一个预设的距离误差来维持整个系统编队队形的稳定。文献口们主要研究了离散时间模型基础下的多智能体系统领航一一跟随编队控制算法,并设计了一种不同于,一矽控制器和,一J控制器瞄2333的新型控制器,该控制器只需要对领航者和跟随者的坐标进行设定就可以实现对整个系统的编队进行控制的目的。文献口43中,作者运
30、用基于领航一跟随法的分布式编队控制策略,设计了一阶控制律,并在控制律中加入了对领航者速度进行观察的积分项,同时选取适当的李雅普诺夫函数对编队的稳定性做出证明。文献b51中,作者为了避免单一领航者在编队控制中可能出现故障这一情况,提出了蕊厂厂鬻一万方数据绪论在编队控制过程中设置两个领航者的思想,当其中一个领航者出现故障时由另一个领航者发挥作用,进而可以继续保持整个编队的稳定性。图13所示为基于,一,控制器的领航一跟随案例,跟随者砟通过维持0。和o:的恒定来保证整个系统编队队形的稳定。i,图13基于,一,控制器的领航一跟随案例Fig 13 An Case ofLeader-follower Bas
31、ed on tl Controller该控制策略的优点是完全由领航者决定整个多智能体系统的运动轨迹,并且控制算法简便,易于实现。缺点是因为在控制过程中领航者和跟随者相互独立,使得领航者得不到整个系统编队误差的反馈,当领航者速度太快时容易导致整个系统编队失败。综上所述,国外对于多智能体系统编队控制的研究水平远远高于国内的研究水平。另外我们应该注意到,虽然国内学者对与多智能体系统编队控制的研究起步较晚,但受到国外学者的影响以及国内研究学者的不断钻研,经过多年的发展也已经取得了很了不起的成就。13研究内容以及结构安排对于多智能体系统编队控制的研究具有深远的理论和实际意义,尤其是三智能体系统,作为多智
32、能体系统的最小单元,更是引起了广大研究学者的关注。在研究多智能体系统编队形成的过程中,本文结合图论知识,采用以分布式控制策略为基础的一致性控制算法,智能体系统中的每个智能体获得相邻部分智能体的位移信息,以控制整个系统编队的形成。在研究整个系统的编队保持(轨迹跟踪)的过程中,本文以领航一跟随法为基础,保证系统在沿着既定轨迹的运动过程中保持系统编队队形的稳定。论文的具体结构安排如下:第一章论述多智能体编队控制的研究背景和研究意义,并阐述该课题的研万方数据基于局部位移信息的多智能体编队控制策略研究究现状,同时给出论文的主要内容。第二章介绍一些预备理论知识,包括图论、一致性算法和李雅普诺夫稳定性以及拉
33、萨尔不变性定理等相关知识。第三章基于分布式控制策略,提出多智能体系统编队形成控制算法,并对控制算法的有效性和稳定性进行验证。第四章基于领航跟随法,提出多智能体系统编队保持控制算法,并对控制算法的有效性和稳定性进行验证。第五章对论文主要的研究内容进行总结,并对后续需要开展的研究工作进行展望。万方数据基础知识第2章基础知识21引言本章主要介绍论文后续对于多智能体系统编队形成、编队保持控制策略的研究中所需要的基础理论知识,主要包括图论的相关知识、一致性理论的相关知识和李雅普诺夫稳定性相关知识以及拉萨尔不变性定理的相关知识。22图论的相关知识图论,最早应用于计算机科学领域和应用数学领域,用以建立物体之
34、间相互联系的数学模型。最近几年,图论以及其代数性质在解决多智能体系统编队问题中也逐渐发挥出越来越大的作用。本节将对图论的相关概念以及代数性质进行简要的介绍,具体内容可参考文献乜7,3引。221图论的基本概念一个具有个结点,相互连接的无向(Undirected Graph)G,可以用一个二元组G=(V,D来表示。其中矿表示节点集,E表示任意一对节点构成的边集,具体的:V=娩,i=1,2,3,奶,E=(惕,nj)Vx V ninj),其中,(吩,nj)c yy表示存在一条从节点聆,到一的无向边,吩、吩分别被称为父节点(Parent Node)和子节点(Child Node)。节点nf的邻集(Nei
35、ghbor Set)N,定义为M=nj矿:(ni,nj)毋。节点n。的度定义为:再给定的图G中,节点n,的邻集中所含节点的个数,即deg(ni)=。如果无向图G中(吩,乃)(咒,吩),那么(玩,咒J)就是一条有向边,这条边可以用带箭头的线段来表示,并且如果图G中所有边都是有向的,那么图G就可以称为有向图(Directed Graph)。如果对于Vn,njV(i),图G总是存在一条从n,到n,的有向路径,那么该图就叫做强连通图,如果不考虑路径的方向得到的无向图为连通的,那么该无向图叫做弱连通图。另外,为了方便本文研究分析,做出如下规定:(1)凡是文万方数据茎王旦塑垡堑笪昼塑墨塑!竺塑坠笙型箜堕翌
36、壅中所提的父节点和子节点均为互异节点;(2)每个父节点和子节点之间最多存在一条边。图21有向图Fig 21 Directed graph图23强连通图Fig 23 Strongly connected graph图22无向图Fig 22 Undirected graph图24弱连通图Fig 24 Weakly connected graph222图论的矩阵描述为了便于本论文后续章节中对于多智能体系统编队控制问题的分析和研究,本节主要介绍图的矩阵描述。给定一个具有个节点的图G=(矿,E),它的邻接矩阵是一个二元矩阵,矩阵中的元素定义为:n:l,女口果(吩nj)E (21)2 1o,其他毕万方数据
37、基础知识如果满足N瑚aU=:。口,那么称邻接矩阵是平衡的。如果V协,njy,都有a,=a那么就称邻接矩阵是对称的。很明显对于无向图来说,它的邻接矩阵是平衡的、对称的。具有个节点的图G的度矩阵是个对角阵,矩阵中的元素定义为:略=悟巍如影叫 亿2,具有个节点的图G的拉普拉斯矩阵,更准确的来说:Ideg(n,),如果i=J厶=一1,如果i,(,行,)E (23)l 0,其他23一致性理论相关知识231一致性算法一致性问题最早由DeGroot在1960年提出口引。一般来说,一致性指的是:一个相互联系的系统,通过控制算法,使得系统中每个个体的状态可以达到一个约定的值,即通常所说的状态对齐问题。状态对齐问
38、题由Borkar和Varaiya提出并解决啪1。对于多智能体系统来说,状态对齐问题主要取决于系统中每个智能体的状态。解决此问题最典型的方法就是规定一个通信协议,用以约束和某个智能体进行信息交换的相邻智能体的个数。本文中,利用图论中的拓扑图来代替多智能体系统,利用拓扑图来代替多智能体系统的通信结构,在研究和分析过程中会用到上一节所提到的所有理论。对于一个由个智能体组成的多智能体系统,假设系统中每个智能体都是单积分模型,即:Ui(f)=Jq(t),一致性算法的目的就是使得所有智能体的状态最后都达到x,。文献町提出了一个简单的一致性算法,具体如下:姒归一驴沪删删,其中乏男洲 (24)M IV,一”当
39、岛(f)=0时,式(24)可表示为:(25)万方数据基于局部位移信息的多智能体编队控制策略研究上述一致性算法之所以在编队控制中得到了广泛地使用,主要是因为每个智能体只需要获取与它相邻的智能体的状态信息就可以实现状态对齐。上式可以表示为图2。5。从上一节中关于拉普拉斯矩阵的定义中我们可以知道:L1=0,其中,这就表明一致性反馈是渐进稳定的,同时也可以保证系统在该一致性算法的控制下趋于一个平衡点心引。一旦系统中智能体的状态趋向于平衡状态,那么式(24)就会等于零,即:毫(f)=0。图25一致性算法的反馈控制Fig 25 Feedback control of consensus algorithm
40、232编队控制一致性算法目前,在多智能体编队队形形成方面,主要存在两种基本思路:一种是将编队队形看做一个刚性的结构,设计智能体之间的势能函数,并基于这些势能函数来控制每个智能体的行为,进而实现编队;另一种就是本文所研究的,用图论中的拓扑图来代替多智能体系统中智能体之间的通讯关系,通过运用上一小节所介绍的一致性算法,使得每个智能体的所需要控制的控制量达到一个期望值,从而使多智能体系统形成理想的编队队形。在一个具有个智能体的多智能体系统中,我们假设秘和Yd为两个维向量,分别表示智能体的理想(期望)横坐标和纵坐标。现在我们定义:Z=x一嘞,那么式(24)变成:拍)=一(z,(t)-Z如)=一(一(f
41、)一t,d)一(x少)一Xj,d):差;(t)-x彤)-兹-X埘) (26)=一(t ,o)一(,d J,d)、7万方数据基础知识令勺=誓,d一,d,那么勺表示的是智能体玎,和智能体咒,理想横坐标之间的差值,代入式(26),变为:三心)=一(Xi(t)-xj(t)-rij (27)jeNi结合上一小节关于一致性理论的介绍,可以得出:智能体刀,和智能体,z,的横坐标之间的差值,在式(27)的控制下会逐渐趋近于理想的横坐标之间的差值。同理,智能体之间纵坐标的差值也会渐进稳定于理想的纵坐标之间的差值,最终使整个系统实现期望的编队队形。24李雅普诺夫稳定性理论在研究多智能体系统的编队控制过程中,编队的
42、状态稳定性是很重要的一个性能指标。而在自动控制理论中最基本、最常用的系统稳定性判别理论是李雅普诺夫稳定性理论。李雅普诺夫稳定性理论主要指的是李雅普诺夫稳定性判别第二法,又叫做李雅普诺夫直接法。因为李雅普诺夫稳定性判别第二法可用于任意阶次的系统,而且使用这一方法时不需要对系统状态方程进行求解而直接判定稳定性,又因为对非线性系统和时变系统的状态方程进行求解常常是非常困难的,因此李雅普诺夫第二方法在判别这两个系统的稳定性时就显示出很大的优越性。241稳定性概念(1)李雅普诺夫意义下的稳定性设系统初始状态位于以平衡状Xe为球心,万为半径的闭球域s(8)内,即0xoXe_to (29)则称系统的平衡状态
43、X,在李雅普诺夫意义下是稳定的。该定义的平面几何表示如图26(a)所示。式中l为欧几里得范数,其几何意义是空间距离的尺度。实数6与占有关,通常也与t。有关。如果万与气无关,则称平衡状态是一致稳定的。万方数据基于局部位移信息的多智能体编队控制策略研究(2)李雅普诺夫意义下的渐进稳定性若系统的平衡状态兄不仅具有李雅普诺夫意义下的稳定性,而且1im kf;,,o)-xJl-o (210)t-ao则称此平衡状态是渐进稳定的。这时,从S(万)出发的轨迹不仅不会超出S(s),且当tj时收敛于兄,其平面几何表示如图26(b)所示。一一一一 s(艿沙, 。;攀? 弋 x j一; 黪 誊 熬,7_、” 醪 ;i
44、 1|1| ?、 毒聋季_,7、 一。参一7s(谚, I、0j 弋 恐j一鏊 蒸饕蕊,jj影?o纂蘸j、逛二 一_二一77【a) 【b)图26有关稳定性的平面几何表示Fig 26 Plane Geometric Representation of Stability(3)李雅普诺夫意义下的全局(大范围)渐近稳定性当初始条件扩展至整个状态空间,且平衡状态均具有渐近稳定性时,称此平衡状态是全局渐进稳定的。此时,万-y00,S(艿)-y00。当t-)时,由状态空间中任一点出发的轨迹都收敛至艺。2。42李雅普诺夫第二法(直接法)古典力学中,振动系统的能量伴随时间的推移而衰减,系统最后会达到稳定状态,但
45、是要想找到实际系统的能量函数表达式并不容易。李雅普诺夫提出,可虚构一个能量函数,即李雅普诺夫函数V(x,f)或矿),它是个标量函数,由于系统的能量总大于零,因此能量函数始终为正定函数。李雅普诺夫第二法就是运用y及矿的符号特性,直接对系统的平衡状态的稳定性做出判断,无需对系统的状态方程进行求解,故称直接法。考虑如下系统:X=f(x,f),x(to)=Xo,xR” (211)万方数据基础知识引理2-1 R 假设吒=0是式(211)所示系统的平衡点。v(t,x)为正定函数,其对时间的导数定义为,=掣嘻掣r,(a)若对于某个rO有矿(f,X)0,Vtto,则Xe=0是稳定的。(b)若是V(t,X)正定递减的,且对于某个,0有V(t,X)0,Vt0,则t=0是一致稳定的。(c)若V(t,x)是正定递减的,且V(t,x)是负定的,则Xe=0是一致渐进稳定的。(d)若在尺”中y(f,x)是正定递减径向无界的,且在R”中y(f,曲是负定的,则艺=0是全局一致渐进稳定的。匕述引理就是李雅普诺夫稳定性第二法的具体描述。25拉萨尔不变性定理在介绍拉萨尔不变性原理之前,先介绍几个定义。考虑如下方程:戈=厂 (212)设x(f)是方程(212)的解,如果存在一个序列乙),当n j时乙专,使得当n专时x(tn)专p,则称点P为x(f)的一个正极限点,把x(f)所有的正极限点组成的集合
限制150内