足球机器人决策系统的设计与实现.pdf





《足球机器人决策系统的设计与实现.pdf》由会员分享,可在线阅读,更多相关《足球机器人决策系统的设计与实现.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2 4 卷第9 期计算机仿真2 0 0 7 年9 月文章编号:1 0 0 6-9 3 4 8(2 0 0 7)0 9-0 1 2 9-0 4足球机器人决策系统的设计与实现陆永忠,柯文德(华中科技大学软件学院湖北武汉4 3 0 0 7 4)摘要:为了改进由协调层、运动规划层和基本动作层组成的足球机器人决策系统,提出了将基:B e 五e r 曲线的机器人路径选择法、“以小球为中心,守门员为主要执行对象”的防守策略和场地分区法综合地运用到三层递进的央策系统中,并分别给出了每层的实现算法。在此基础之上,建立了机器人和球的动态模型。利用C+编程并导人M i d d l eL e a g u eS i
2、m m-0 S o t(5 v s 5)仿真环境进行r 仿真实验。仿真实验结果表明:所提改进的决策系统具有可行性和有效性,较好地解决r 进攻和防守的问题。关键词:多智能体;足球机器人;路径规划;仿真策略;国际机器人足球联合会中图分类号:T i t 2 7 3文献标识码:AD e s i g na n dI m p l e m e n t a t i o no fD e c i s i o nS y s t e mf o rS o c c e rR o b o tL UY o n g z h o n g K EW e n d e(S o f t w a r eE n 画n e e t i n g
3、C o l l e g e,H u a z h o n gU n i v e r s i t yo fS c i e n c e T e c h n o l o g y W u h a nH u b e i4 3 0 0 7 4,C h i n a)A B S T R A C T:I no r d e rt oi m p r o v et h ep e r f o r m a n c eo fd e c i s i o ns y s t e mf o rf o o t b a l lr o b o t a na p p r o a c hw i t ht h ec o m b i n a t
4、i o n o f t h ep a t h p l a r m i n gb a s e d0 nB e z i e rc u r c-e,d e f e n d i n gd e c i s i o n“r e g a r d i n g t h eb a l l e p i c e n t e ra n dg o a l i ea st h em a i ne x e c u t i v e”a n da r e as e p a r a t i o ni sp r e s e n t e di nt h r e e l a y e ri n c r e m e n t a ld e c
5、 i s i o ns y s t e mT h e ni m p l e m e n t a-t i o na l g o r i t h mo fe a c hl a y e ri sg i v e nr e s p e c t i v e l y B a s e do ni t,d y n a m i cm o d e l sf o rr o b o ta n db a l la l ee s t a b l i s h e dT h ep r o g r a m sa r ed e v e l o p e db yC+a n dp u ti nt h es i m u l a t i
6、o np l a f f o n nc a l l e dM i d d l eL e a g u eS i m u r o S o t(5 v s 5)f o rs i m u l a t i o nt e s t i n g n er e s u l t si n d i c a t et h a ta b o v e m e n t i o n e dd e c i s i o ns y s t e mi sf e a s i b l ea n dv a l i d f u r t h e r m o r es o l v e st h ep r o b l e m so fa t t
7、a c ka n dg u a r db e t t e r K E Y W O R I X S:M u l d a g e n t;R o b o ts o c c e r;P a t hp l a r m i n g;S i m u l a t i o ns l a u t a g y;F e d e r a t i o no fi m e r n a t i o n a lr o b o ts o c c e ra s s o e x a t t o n1 引言近年束,多机器人问题(M u l t i r o b o t)、多智能体问题(M u l t i a g e n t)倍受关注。
8、机器人足球系统融合r 机器人学、机电一体化、通讯与计算机技术、图像处理、传感器数据融台、决策与对策、模糊神经网络、人工生命与智能控制等学科内容,是研究多智能体系统理沧的良好实验平台。目前机器人足球系统一般包括4 个子系统:视觉子系统、决策子系统、无线通讯系统和机器人(小车)系统”0 1。决策系统的任务是根据比赛场上的态势作出是进攻还是防守的的决定给己方的每个机器人分配角色,并且协调不同机器人之问的合作”J。比赛成功与否很大程度上决定于策略系统的性能和可靠性。因此,专家学者们对决策系统进行了深入的研究”1 1。文献1 4 中研究了基于遗传进化方法的足球机器人策略子系统。文献 5 中提出了一种基于
9、全局视觉的分层结收稿日期:2 0 0 6 0 7 2 5 修回日期:2 0 0 6 0 8 1 3构模型的机器人足球策略系统,能够适应比赛中机器人数目的变更。文献 6 中提出了一种六步推理模型的改进模型和球场的智能分区概念,并实现了这个决策子系统。文献 7 中介绍了一种决策子系统的分层控制结构设计,它由协调层、运动规划层和基本动作层组成。为了改进由协调层、运动规划层和基本动作层组成的足球机器人决策系统,我们这里提出将基于B e z i e r 曲线的机器人路径选择法9o、“以小球为中心,守门员为主要执行对象”的防守策略”o 和场地分区法综合地运用到三层递进的决策系统中。较之传统的中垂线法和人工
10、势场法,B e z i e r 曲线规划路径具有很多优点:算法时问复杂度较低,控制方便灵括,编码实现较为简单,可适应不同环境,并能准确地预测机器人下N 个周期位置。“以小球为中心,守门员为主要执行对象”的防守策略可以使守门员较好地根据场地上足球位置的动态变化做出有效的防守。场地分区法能顺利地完成场地数据的知识提取、目标的制定和机器人的角色分配协调。目前将这三者结合在一起来改进足球机器人决策系统的文献资料很少。所以我们选择其一1 2 9 万方数据作为研究的内容。在分男U 给出了每层实现算法的基础之上,我们建立了机器人和球的动态模型,利用C+编程并导人M i d d l eL e a g u eS
11、 h n u r o S o t(5 v s 5)仿真环境进行了仿真实验。结果表明:所提改进的决策系统具有可行性和有效性。所研究的机器人系统在2 0 0 5 年F I R AJ 址界杯足球机器人比赛巾国区选拔赛中获得仿真M i d d l eL e a g u eS i m u r o S o t(5 v s 5)二等奖的好成绩。2 足球机器人决策系统的分析与设计21 足球机器人守门员防守策略设计以小球为中心对守门员进行具体策略的设计时,根据球的不同运动情况将策略整体分为“不向球门方向运动”和“向球门方向运动”两个模块。仅以“不向球门方向运动”模块加以说明。为方便阐述,将球在球场中的位置抽象为
12、b a l l(x,y),以下叙述中用b a l lx 和b a l lY 代表球在球场啦标系下X 轴坐标和Y 轴坐标。场地抽象如图1 所示。当球在1、7、1 0、1 3 时,这些区域均靠近边线,可整体考虑。守门员应在向禁区上方某一位置附近进行拦截。但由于球和门区的距离不同,其危险等级也不同,所以守门员应该到达的位置也不同。1 区域危险性较高,守门员应到A 位置去等。此位置离禁区边沿较近,可在对方队员进攻时,将球卡在禁区以外,这样做是为了不违反比赛规则。若球在7 区域,守门员应到B 位置去等。该位置的确定是通过门区中心与该区域中心的连线与球场坐标系下X=6 这条直线的交点所确定的因为小球的方向
13、往场地下方跑时,必经过中线附近区域(5,6,8),所以可在相应区域进行位置调整。小球往上方跑的几率比较大,所以应去该位置防守。同理,若球在1 0 区域,守门员到C 位置去等。若球在1 3 区域,守门员到D 位置去等。确定守门员需要到达的日标点后,若目标点与守门员前进方向在同一条直线上,小车做直线运动到目标点,若不在同一条直线上,则作曲线运动到目标点。中线防守、死角防守与边线防守比较类似,这里不再详述了。X1 6噩1 7古我对青31 21 8图1 球场抽象2 2 足球机器人进攻路径规划智能机器人进攻路径规划是实现机器人钭能的一个关键技术。其任务是在具有障碍物的环境中,按照一定的评价标准,寻找一条
14、从起始状态(包括位置及姿态)到达目标状态一1 3 0 一(包括位置及姿态)的无碰路径。路径规划主要应用于机器人底层策略中,作为足球机器人基本动作实现的基础,其优劣将直接影响动作的实时性和准确性。中垂线法和虚力场法难以评价路径规划的好坏以及机器人是否能按规划的要求运动,它们都是在当前的控制周期内形成当前的运动目标并形成指令,无法在整体卜看到路径规划的效果,如果能事先设计好机器人运动的路径,然后让机器人严格按照路径运动,就能很容易的评价机器人运动的效果。为机器人选择的运动曲线应该能适应任何路线要求,而且保证机器人运动的连续性,在进攻路径决策中采用了B e z i e r 样条曲线,只要设定机器人必
15、须经过的点为型值点,经计算就能得到一条平滑的曲线。如图2 所示,B e z i e r 用不同的控制点产生的曲线图(交义圆圈是控制点)。在生成三次B e z i e r 曲线时应遵循进攻路径必须是机器人可走并最短。根据经验值,在仿真比赛中当射球点与机器人较远时D 的较理想取值范周是09 13 个机器人边长。当射球点与机器人较近时D 取值范围是0 5 08 个(机器人半边长与球半径之和)。把B c z i e r 曲线分成三等分。取距离机器人的2 3 分点、机器人位置和机器人位置0 度角线为切线作圆周,根据圆周设置机器人左右轮速度。由于系统每1 6 0 秒刷新一次,所以每个周期机器人只是走了虚线
16、框内的段。这样机器人所走的路径就逼近该B e,z i e r 曲线。从而实现图3 中拟合后的机器人进攻路径。相对于其他的进攻路径而言,采用B e z i e r 曲线规划路径时,算法时间复杂度较低,控制方便灵活,编码实现较为简单,可适应不同环境,并能准确地预测机器人下N 个周期位置;如果适当再增加曲线控制点则可规划出避障路径;最后,还能使机器人移动路径体现出平滑曲线的优美。3 3 基于三层模型的决策系统基于三层模型的决策了系统的决策模型属于分层递阶控制方法”。从根本上来说,这是一种集中控制方式,即用一个全局图2 沿B e z i e r 曲线的进攻路径控制器,对机器人进行统一控制。分层递进控制
17、方式的具体分层方式视不同情况而定,本文中的三层决策模型把央策的层次划分为协调层、运动规划层、基本动作层决策的结构及流程如图4 所示。决策模型中的协调层突出的是机器人之间的协调组织”,通过从整体上分析场内形势做出群体的协作意图,然后将协作意阿传到运动规划层。运动规划层将意图分解为各个机器人的目标,并将目标进一步细化,进而形成小车运动的具体方式,这些运动方式以胡数调用的方式传到基本动作层,由基本动作层完成运动指令的设定,即生 万方数据溜I 图3 拟台后的机器人进攻路径成车轮的速度指令。图4 三层决簧模型3 3 1 基本动作层基本动作层是决策的最底层,它将由运动规划层产生的阶段性目标和具体的行动指令
18、对应起来,生成一定的运动指令。快速和准确是该层设计的关键。如图5 所示,场上足球机器人的位姿可以表示成:P=x 1,y l,0 ,其中,x 1,y 1 为机器人的坐标,0 为机器人的朝向。基本动作层是由一些称之为基本动作的动作指令生成模块组成。基本动作指不可分解的动作,和机器人运动的控制紧密关联。在S i m u r o S o t5 v s 5 仿真比赛中,r e a c h(X,X D O s,Y图5 足球机器人小车位姿圈一D O s)函数、基于B e z l e r 曲线的进攻方法和守门员的守门策略均由基本动作所构成,其基本动作的表现形式为速度函数为v e l o c i t y(X,1
19、 v,竹),其中X 是机器人主体,v l 和v r 分别表示其左右轮速度。在机器人主体的底层动作控制中,即表现为对某个机器人设定其左右轮的速度。速度函数v e l o e i t y(X,v l,v r)中,速度控制v l 和v r 的变化范围是一1 2 7+1 2 7,负值表示向后运动,正值表示向前运动。该速度函数主要应用在直线运动、转角运动和弧线运动。在决策系统中,基本动作层只是充当决策与机器人的接口,由上层的路径规划层调用,基本动作层自身不做任何主动的决策。但是,基本动作层是决策的出口所在,它的性能直接影响到小车时决策的响应。3 3 2 运动规划层运动规划层是将协作意图进行分解细化的部分
20、,因此运动规划层具有主动设计的能力。它体现了群体协作与个体之间的对应,即如何通过个体的运动来反映群体协作的整体效果。因此它注重的是个体要完成什么动作。运动规划层的输入是协调层生成的意图。运动规划层没有直接的输出量,它最终调用基本动作层的函数完成对机器人的控制。由于规划层最终决定机器人运动轨迹,完善运动规划层对于提高决策的准确性是很有必要的,通过合理调用直线和转角运动控制,使机器人在任意位姿下以一条平滑的运动轨迹到达E l 标位姿“。运动规划层的控制包含的部分主要是守门员防守动作函数和基于B e z i e r 曲线的机器人进攻路径规划函数,而这两者又或多或少由基本控制函数r e a c h(x
21、,x D O S,Y p*)复合组成。R e a c h(x,x D O s Y D O s)函数表示机器人x 向目标点坐标(x D O s,Y D O s)运动,其运动速度应该尽可能高,因此,在设计r e a c h(x,x D O s,Y p o s)函数时,就已经考虑到如何进行转角,如何进行直线运动了。机器人向着B e z i e r曲线定位的四个点坐标依次运动,进而构成平滑的B e z i e x 曲线进攻路径,所以,要进行守门员防守和B e z i e r 曲线的设计就必须先设计出r e a c h(x,x D 0 6,Y D O s)函数。设计R e a c h(x,x D O s
22、,Y D O s)函数算法如下:1)初始化,即调整机器人的左右轮速均为0;2)判断机器人在球的哪个位置(四种情况之一);3)转角运动,使机器人面向目标;4)直线运动到目标点。3 3 3 协调层协调层的目的是完成场地数据的知识提取,目标的制定和机器人的角色分配协澜0 1 2,”J。正因为存在统一控制的协调层,使得整个决策控制成为一个集中控制的整体。决策子系统在逻辑上和人类比赛中的协作及个体控制有根多相似的地方,只是集中控制的协调层在对机器人的控制力度上远远超过了人类的教练。设计时使用了场地分区法来进行策略的开发。决策将场地分为若干个区,按照球所在位置进行紧急态势的判断以及相应的策略开发。如图6
23、所示,假设左半场为我方半场,右半场为对方半场,则场地被划分为六个区域,1 进攻区域;2 一攻防兼有区域;3 一大禁区防守区域;4、5大禁区两侧防守区域;6 一小禁区防守区域。对于不同的区域,有不同的决策。当球在区域1 的时候,靠近球的机器人执行射门,另一个机器人塾煤个接应点,当前一个机器人无法完成射门动作的时候,由这个机器人完成补射。如图7 中区域1 所示。该场地的基本算法如下:1)判断b a l l 的位置是否在区域1,若是,则执行第二步;否则结束;2)判断两个进攻队员p l a y e r l】3 1 万方数据+一芷乳I 蠢62+一t l,rL|_F4图6 球场分区方法示意和p l a y
24、 e r 2 距离足球远近情况,较近者马上进攻,较远者移动到里自己较近的足球反弹区域进行补射(如图中区域1 的虚线箭头方1 趣);3)进攻是否造成进球,若是则结束;否则转向第一步。其他区域的基本算法就不再详述了。4 足球机器人决策系统的仿真实验4 1 机器人足球比赛动态建模为使仿真系统能够模拟机器人和球的运动,需要建立动态模型,为r 讨沦方便,我们首先设定如下参量:(如,4。)表示第i 个机器人位置与方位角;K。表示第i 个机器人初速度;K。表示第i 个机器人碰撞后速度;(X b,y 6,A b)表示球的位置、方位角;,棚表示小球初速度、方位角;瞄,。1 表示小球碰撞后速度、方位角;M R,m
25、 表示机器人质量、球的质量;T 表示时间周期。1)机器人的动态模型机器人的直线运动模型。机器人的运动方程为:S=k+1 2 n r(1)其中a 为机器人加速度,是由机器人硬件和场地情况决定的。一个时间周期后,第i 个机器人的位置为:x7=强+$c c s A(2)Y“=h。+S c o s A m(3)机器人的旋转运动模型。以逆时针旋转为例:X“=如。+R s i n(舻)C O S(A m+2)(4)一m=k+R s i n(2)s i n(A m+卢2)(5)A m=A+B(6)式中R 为机器人旋转半径,口为机器人在一个时间周期内最大可以旋转的角度。2)球的运动模型由于球场摩擦力的存在,小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 足球 机器人 决策 系统 设计 实现

限制150内