《《多智能体控制概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多智能体控制概述》PPT课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Donghua University多智能体控制概述多智能体控制概述齐洁信息学院,东华大学2014.5.15.Donghua University提纲提纲什么是多智能体系统应用研究意义研究方法分类 基于图的离散方法基于PDE的连续方法研究进展-多智能体队形控制Donghua University多智能体系多智能体系统统Donghua University什么是多智能体系统什么是多智能体系统What kind of systems?什么是多智能体系统Groups of agents with control,sensing,communication and computing能控制,感知能力,
2、能相互通讯,能计算Each individual senses its immediate environment 感知周围环境communicates with others 交互能力processes information gathered 信息处理,计算能力takes local action in response 响应,决策能力Donghua University生物界的群体自生物界的群体自组织组织行行为为Donghua UniversityAble to 控制目控制目标deploy over a given region 将多个自主体部署到指将多个自主体部署到指定区域定区域ass
3、ume specified pattern 形成指定的形成指定的队形,形,队形控形控制制rendezvous at a common point 所有智能体集合到所有智能体集合到一个点一个点jointly initiate motion/change direction in a synchronized way 协同的运同的运动模式,同步运模式,同步运动方向方向Species achieve synchronized behaviorwith limited sensing/communication between individualswithout apparently followi
4、ng group leader(Couzin et al,Nature 05;Conradt et al,Nature 03)Donghua University多智能体系多智能体系统统的的应应用用Embedded robotic systems and sensor networks forhigh-stress,rapid deployment|e.g.,disaster recovery networks(在危险的地方工作)Distributed environmental monitoring|e.g.,portable chemical(分布式环境下的监视)and biologica
5、l sensor arrays detecting toxic pollutantsAutonomous sampling for biological applications|e.g.,monitoring of species in risk,validation of climate and oceanographic models 自主采样 Science imaging|e.g.,multispacecraft distributed interferometers flying in formation to enable imaging at microarcsecond re
6、solution 科学成像Donghua University嵌入式机器人飞机编队飞行,队形控制小卫星群无线传感网络Donghua UniversityDonghua UniversityDonghua UniversityDonghua UniversityDonghua UniversityDonghua UniversityDonghua UniversityDonghua UniversityLocal agent interactions giving rise to global behavior哈佛大学的研究团队公布,他们应用多智能体协同控制技术开发了小机器人协同建造系统,模仿白
7、蚁处理信息的方式,系统可以自动产生底层个体的简单规则,建造指定的复杂结构。每个自主小机器人,功能简单只感应局部的信息,并通过共享的环境来协同他们的行为,实现分布式控制。研究发表在2014年2月14日的科学杂志上。J.Werfel,K.Petersen,and R.Nagpal,“Designing collective behavior in a termite-inspired robot construction team,”Science,vol.343,no.6172,pp.754758,2014.Donghua UniversityDonghua University2014年年科学
8、科学杂志十大科学志十大科学进展之一展之一Donghua UniversityTermites机器人的特点机器人的特点没有中央控制(整体规划)的情况下,依靠个体之间相互作用的简单规则,完成复杂的建造任务。机器人只拥有觉察到附近有块砖或有一个机器人的能力,就能决定自己下一步的行动。它们是在没有详细的规划或中央通讯的情况完成这些工作的;而为这些机器人所设的程序只是若个简单的规则。由用户定义的结构,来决定机器人需要遵循的规则.独立且具有分散性控制的机器人有众多的优点。冗余性:个别的机器人可能会出毛病,但其余的机器人可继续运行。整个系统不会因为有一处关键环节出现了故障而瘫痪。灵活性:这样的系统也具可缩放
9、性。“如果要从事更大规模的工作,人们只需要增加更多的机器人(甚至在工作进行中)而无需对它们的编程进行改动。”Donghua University让机器人合作机器人合作:新的软件和互动机器人正向人们证明,机器人终于能在无需人监督的情况下一同工作;例如,指示成群的受到白蚁启发的机器人来构建一种简单的结构,或提示一千个25美分硬币大小的机器人形成方块、字母及其它二维形状等。Donghua University应应用例子用例子例子 robotic submarine 寻找马航失联客机autonomous underwater vehicle在海底寻找,多个水下机器人形成协同搜索,效率更好,每个搜索一片
10、区域,相互之间传递消息。应用于无人驾驶机群的编队飞行,可移动机器人的定位和位置部署,可移动传感网络的布局,运输车辆的协调,飞行器或者小卫星群的空间布局等无人网络系统的控制,在人类难以到达或者危险的地方,完成环境探索、科学采样、地图绘制、监测和侦查、搜索和营救以及分布式传感等协同任务。多智能体协同控制的研究可派生出各种分布式算法,解决不同领域的科学问题,例如异步网络通讯、分布式协同决策、信息融合以及耦合振子系统等。Donghua UniversityDonghua UniversityResearch program:what are we after?Design of provably co
11、rrect,distributed coordination algorithms 分布式协同算法设计Mathematical tools to study convergence,stability,and robustness of coordination algorithms 对算法性能进行分析Coordination tasks 执行协同任务exploration,map building,search and rescue,surveillance,odor localization,monitoring,distributed sensing 勘探,绘制地图,搜索营救,侦查,气味
12、定位,监视,分布式传感。Donghua University要用到的方法和技要用到的方法和技术术Optimization Methods 优化方法resource allocationgeometric optimizationload balancingGeometry&Analysis 算法结构,非光滑分析Control&Robotics 机器人技术和控制algorithm designcooperative controlstability theoryDistributed Algorithms 分布式算法,图论,PDEDonghua UniversityCooperative rob
13、otic networksDistributed coordination algorithmsLocal agent interactions giving rise to global behaviorLimited information,Veriably correct,rigorous assessment of properties要实现的目标:构建机器人协同网络;采用分布式协同控制律;能够通过有限的信息,局部的作用规则实现全局复杂的行为。Donghua UniversityConsider rendezvous/deployment/agreement scenarioConse
14、nsus=reach common value for some variable 一致性算法Rendezvous=get together at certain locationDeployment=deploy over a given regionDonghua University目前的研究方法分目前的研究方法分类类离散的一致性控制律研究多智能体协同控制的传统方法是基于图论的离散分析方法,即以代数图论为框架,以谱分析、矩阵论、控制理论与最优化为工具进行建模、分析和设计控制器。等价于连续的扩散方程(偏微分,包含空间变量)Donghua University研究进展研究进展多智能位置部署多
15、智能位置部署图1 Agent系统分析和设计过程Donghua University网络拓扑通讯图:其中的一个实例网络拓扑通讯图:其中的一个实例图2 412个agent映射到连续空间单位圆上的通讯拓扑图Donghua University用用PDE建模建模因此agent的动态特性就可以用PDE来描述一阶积分的动态关系可以用抛物PDE表示:,二阶积分的动态关系可以用双曲的PDE表示:,(5)Donghua UniversityPDE的平衡点的平衡点PDE的平衡点对应系统的稳定状态我们令PDE的状态量表示agent的位置,可以得到agent的稳态位置方程通过变化参数 和边界输入(也是领导者agent
16、的位置),可以实现系统的不同稳态解,对应不同的部署流形。Jie Qi,Rafael Vazquez*,Miroslav Krstic,Multi-agent Deployment in 3-D via PDE Control,IEEE Transaction on Automatic Control.Accept available online:http:/ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=6914569&queryText%3Dmultiagent+deployment+in+3-D+via+PDE+contro
17、lDonghua University两个二维复值方程确定的位置部署流形两个二维复值方程确定的位置部署流形边界条件如下,其中f(theta)是一个2pi为周期的周期函数图 3 多智能体三维位置部署Donghua UniversityDonghua UniversityDonghua University多智能体系统边界控制器设计的基本思路多智能体系统边界控制器设计的基本思路这些流形由PDE的边界输入驱动,即改变领导者agent的位置可实现系统在不同部署队形之间的转换。在实际应用中,大多数需要部署的流行对应的平衡状态不稳定。我们将采用backstepping方法设计边界反馈控制器使系统稳定。图2
18、 基于PDE的方法设计多智能体控制律实现位置部署与队形控制Donghua UniversityPDE描述的多智能体模型描述的多智能体模型边界条件,也可看作边界控制器Donghua University控制器设计控制器设计最后用傅立叶级数对全部子系统求和,得到整体系统的控制器如下:通过采用傅立叶级数展开,得到与theta独立的子系统,然后再对简单的子系统设计控制器,其backstepping的核函数如下:Donghua University证明系统在证明系统在L2,H1和和H2空间稳定空间稳定对于二维的系统,如果要确保系统状态具有较好的函数性质,例如连续性,需要证明H2范数下稳定。连续性使得在通
19、讯拓扑网络上相邻的智能体在物理空间上也相邻,这个特性对于系统的实际应用非常重要,因为agent的通讯范围是有限的,这样agent就不会跑出与邻居的通讯范围之外,使系统失效。Donghua University观测器设计观测器设计为了实现真正的分布式控制,即每个agent只需要局部邻居的信息就能完成整体的控制目标,我们设计的观测器,能够估计所有agent的状态,也就是leader agent能够通过测量最近邻居的状态,计算出所有agent的状态。观测的设计与控制器的设计是对偶的,我们得到了精确的封闭表达式Donghua University证明带观测器的系统在证明带观测器的系统在L2,H1和和H
20、2空间稳定空间稳定 估计系统中也有一个核函数在角度0-2pi上积分 将估计的状态作为状态反馈进行边界控制,可实现级联系统的稳定控制Donghua University离散化获得分布式控制律离散化获得分布式控制律用有限差分方法离散化,离散化的误差取决于agent的数目和离散方法。用三点中心法离散化,得到各个agent的分布式控制律中间的智能体Donghua University离散化获得分布式控制律离散化获得分布式控制律得到一组常微分方程,描述每个agent的控制律(行为规则)。领导者智能体靠近极点的智能体Donghua University仿真仿真Donghua University仿真仿真D
21、onghua University仿真仿真Donghua University仿真仿真Donghua UniversityDonghua UniversityKhepera III机器人机器人Khepera III机器人机器人小型机器人小型机器人 Khepera III机器机器人上安装的多人上安装的多传传感器感器阵阵列,可列,可以有效的以有效的检测检测出不同距离范出不同距离范围围的物体。自身携的物体。自身携带带可更可更换换充充电电电电池,可使它高度自主。池,可使它高度自主。机器人装有机器人装有9个用于障碍个用于障碍检测检测的的红红外外传传感器,感器,5个个远远距离障碍物距离障碍物检测检测的超声的超声传传感器。前面装有感器。前面装有一一组寻线传组寻线传感器以及感器以及边缘检测边缘检测。电电机模机模块块使用的是瑞士生使用的是瑞士生产产的的高高质质量量传动传动模模块块。高精度伺服。高精度伺服电电机保机保证证了它移了它移动动的准确性和的准确性和高效性高效性Donghua UniversityKhepera 4用多个Khepera 4 小机器人作为多智能体协同控制的实验载体,验证算法的有效性。Donghua UniversityThanks谢谢大家!
限制150内