最优控制概述精选课件.ppt
关于最优控制概述第一页,本课件共有29页最优控制概述最优控制概述(1/1)1/1)第第 1 章章 最优控制概述最优控制概述 q在20世纪50年代末开始迅速发展起来的现代控制理论中,最优控制是其一个主要内容,目前仍是非常活跃的一个分支。最优控制问题是从大量的实际问题中提炼出来的,它的发展与航空、航天和航海的制导、导航和控制技术密不可分;化工过程中有着广泛的应用;等等。下面先通过几个应用实例来引出最优控制问题,然后讨论最优控制问题的描述及数学表达。内容包括:v最优控制的问题提出最优控制的问题提出v最优控制的问题描述最优控制的问题描述v最优控制的发展简史最优控制的发展简史 第二页,本课件共有29页最优控制问题的提出(1/1)(1/1)1.1 最优控制问题的提出最优控制问题的提出q考虑下面几个实际最优控制问题的例子,飞船的月球软着陆问题飞船的月球软着陆问题拦截问题拦截问题连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题第三页,本课件共有29页飞船的月球软着陆问题飞船的月球软着陆问题(1/3)(1/3)1)飞船的月球软着陆问题飞船的月球软着陆问题q飞船靠其发动机产生一个与月球的重力方向相反的推力,以控制飞船实现软着陆,即达到降落到月球表面时的速度为零。问题要求设计发动机推力u(t)=f(t)程序,使飞船携带的燃料最少或着陆时间最短(最速升降问题)。q设飞船的质量为m,高度和垂直速度分别为 h 和 v,月球的重力加速度 g可视为常数,飞船的自身质量及所携带的燃料分别为 M 和 F。若飞船于某一初始时刻起开始进入着陆过程,由牛顿第二定理和物料(燃料)平衡关系可知,飞船的运动方程为第四页,本课件共有29页飞船的月球软着陆问题飞船的月球软着陆问题(2/3)(2/3)要求控制飞船从初始状态h(0)=h0,v(0)=v0,m(0)=M+F出发,在某一末态时刻 tf 实现软着陆,即h(tf)=0,v(tf)=0控制过程中,推力 f(t)不能超过发动机所能提供的最大推力 fmax,即-fmax f(t)fmax满足上述约束条件,使飞船实现软着陆的推力程序并非一种,其中消耗燃料最少的称为燃料最优控制问题,着陆时间最短的称为最速升降问题或时间最优控制问题。第五页,本课件共有29页飞船的月球软着陆问题飞船的月球软着陆问题(3/3)(3/3)这两个问题可归结为分别求 J1=J1(tf)-燃料消耗最少,或者 J2=J2(tf)-着陆时间最短为最小的数学问题。第六页,本课件共有29页 拦截问题拦截问题(1/2)(1/2)2)拦截问题拦截问题在某一惯性坐标系内,设质量为在某一惯性坐标系内,设质量为m(t)拦截器拦截器L质心的位置矢量和速度质心的位置矢量和速度矢量为:矢量为:目标目标M质心的位置矢量和速度矢量为:质心的位置矢量和速度矢量为:拦截器的推力为:拦截器的推力为:F(t),即控制输入。,即控制输入。拦截器与目标的相对运动拦截器与目标的相对运动方程为:方程为:其中其中a(t)是除控制加速度外的固有相对加速度,是已知的。是除控制加速度外的固有相对加速度,是已知的。拦截器和目标的相对位置和速度为:拦截器和目标的相对位置和速度为:第七页,本课件共有29页拦截问题拦截问题(2/2)(2/2)从工程实际考虑,约束条件为:从工程实际考虑,约束条件为:如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标:标:为最小为最小.综综上上所所述述,所所谓谓最最优优拦拦截截问问题题,即即选选择择满满足足约约束束条条件件的的控控制制F F(t t),驱驱使使系系统统从从初初始始状态出发的解,在某个时刻满足终端条件,且使其性能指标为极值(极小值)。状态出发的解,在某个时刻满足终端条件,且使其性能指标为极值(极小值)。初始条件为:初始条件为:终端条件为:终端条件为:为燃料燃尽后拦截器的质量为燃料燃尽后拦截器的质量.第八页,本课件共有29页连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题(1/2)1/2)3)连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题 q设有一盛液体的连续搅拌槽,如图1所示。槽内开始装有0oC 的液体,现需将其温度经1小时后升高到40oC。图图 1 连续搅拌槽示意图连续搅拌槽示意图为此在入口处以常速流入液体,温度为 u(t),经槽内不停转动的搅拌器使槽内液体温度均衡上升。设流出的液体保持槽内液面恒定,在出口处温度与槽内液体一致。试寻找 u(t)的变化规律,使槽中液体的温度经1小时后上升到40oC,并要求所散失的热量最少。第九页,本课件共有29页连续搅拌槽的温度控制问题连续搅拌槽的温度控制问题(2/2)2/2)q因假定槽内液体温度均衡,设为x(t)。由题设条件可知,x(t)的边界条件为x(0)=0oC,x(1)=40oC由热力学知识可知,槽内的液体温度的变化率与温差u(t)-x(t)成正比,即式中,k1为比例系数。我们的目标是确定流入的液体的温度u(t)如何变化,使得散失的热量最少,即归结为在上述状态方程和边界条件下,求函数 最小的数学问题。第十页,本课件共有29页最优控制问题的描述最优控制问题的描述(1/1)(1/1)1.2 最优控制问题的描述最优控制问题的描述q从前面的应用实例可以看出,最优控制问题可以抽象成共同的数学问题描述,为最优控制理论研究带来方便。所谓最优控制问题的描述,就是将通常的最优控制问题抽象成一个统一描述的数学问题,并用数学语言严格地表述出来。最优控制问题的要素包括:被控系统(对象)的数学模型被控系统(对象)的数学模型目标集目标集容许控制容许控制性能指标性能指标最优控制问题的描述最优控制问题的描述 第十一页,本课件共有29页被控系统的数学模型被控系统的数学模型(1/2)(1/2)1.被控系统的数学模型被控系统的数学模型q前面讨论的飞船控制系统和搅拌槽温度系统都是非线性系统,所建立的描述该最优控制问题的数学模型都为状态空间表达式。因此,对一般被控系统的最优控制问题,其数学模型可以用如下非线性时变系统的状态空间表达式来描述:式中 x 为 n 维状态向量;u 为 r 维输入向量;y为m维输出向量;f(x,u,t)和 g(x,u,t)分别为关于n维状态向量 x和m维输入向量 u 以及时间 t 的非线性函数向量。第十二页,本课件共有29页被控系统的数学模型被控系统的数学模型(2/2)(2/2)q对许多实际被控系统,在一定精度范围内,其最优控制问题中的数学模型多为线性定常系统 线性时变系统非线性定常系统 的状态空间表达式来描述。第十三页,本课件共有29页目标集目标集(1/3)(1/3)2.目标集目标集q动态系统在控制 u(t)的作用下从一个状态迁移另一个状态的转移,这种转移可以理解为状态空间的一个点或系统状态的运动。在最优控制问题中,系统运动的初始状态(称初态)通常已知,即 x(t0)=x0 为已知,而所要达到的最终状态(称末态)是控制所要求达到的目标。第十四页,本课件共有29页目标集目标集(2/3)(2/3)末态因不同问题,可以是状态空间的一个点,更为一般的情况是末态要落在事先给定的范围内,如要求末态满足如下约束条件g1(x(tf),tf)=0 g2(x(tf),tf)0 式中,g1(x(tf),tf)和 g2(x(tf),tf)为关于末态时刻 tf 和末态状态 x(tf)的非线性向量函数。上述末态约束条件概括了对末态的一般要求。实际上,该末态约束条件规定了状态空间中的一个时变的或时不变的集合,此种满足末态约束的状态集合称为目标集,记为M,并可表示为M=x(tf):x(tf)Rn,g1(x(tf),tf)=0,g2(x(tf),tf)0 第十五页,本课件共有29页目标集目标集(3/3)(3/3)需要指出:有些最优控制问题并没有对末态加以约束,则该问题的目标集为整个状态空间Rn,但此时并不意味着对末态没有要求,系统还可以通过下面要介绍的性能性能指标等以约束末态指标等以约束末态。至于末态时刻 tf,它可以事先规定,也可以由对末态的约束条件和性能指标等约束。第十六页,本课件共有29页容许控制容许控制(1/1)(1/1)3.容许控制容许控制q输入向量 u(t)的各个分量 ui(t)往往是具有不同的物理性质和意义的控制量,在实际系统中,大多数控制量受客观条件的限制,只能在一定范围内取值。如飞船控制系统中控制量有大小范围的限制;又如在控制量为开关量的控制系统中,输入仅能取有限的几个值,如-1,+1。由控制量约束条件所规定的点集称为控制域,并记为U。凡在闭区间t0,tf上有定义,且在控制域U内取值的每一个控制函数 u(t)称为容许控制,并记为 u(t)U。通常假定容许控制 u(t)是一个有界连续函数或者是分段连续函数。第十七页,本课件共有29页性能指标性能指标(1/3)(1/3)4.性能指标性能指标q从前面的应用实例可以看出,最优控制问题最后归结到从所有容许控制中容许控制中找出一种效果最好的控制律,这就需要一个能衡量控制效果好坏或评价控制品质优劣的性能指标函数性能指标函数。例如,飞船控制系统要求所携带的燃料最少燃料最少或到达末态的时间最短,而连续搅拌槽系统的性能指标为一个带函带函数积分的指标数积分的指标,要求其为最小;由于各种最优控制问题所要解决的主要矛盾(问题)不同,设计者的着眼点不同,因此归结出的性能指标是不同的。第十八页,本课件共有29页性能指标性能指标(2/3)(2/3)q一般形式的性能指标为式中,右边第1项称为末末态态性性能能指指标标,体现了对末态的要求;第2项称为积积分分性性能能指指标标,体现了对系统状态变化过程中对的状态 x(t)和控制u(t)的要求;在通常情况下,可将各种不同的性能指标视为一般形式的性能指标的一种特例。如飞船控制系统的性能指标可以视为当S(x(tf),tf)=m(tf),L(x,u,t)=0时上述一般形式性能指标的一个特例。第十九页,本课件共有29页性能指标性能指标(3/3)(3/3)q性能指标函数又称为指指标标泛泛函函、目目标标函函数数、成成本本函函数数和和评评价价函数等函数等。第二十页,本课件共有29页最优控制问题的描述最优控制问题的描述(1/2)1/2)5.最优控制问题的描述最优控制问题的描述 q总结上述最优控制问题的数学模型、目标集、容许控制以及性能指标,则最优控制问题的描述可叙述为:已知被控系统的状态方程及给定的初态如下:规定的末态目标集为:M=x(tf):x(tf)Rn,g1(x(tf),tf)=0,g2(x(tf),tf)0求一容许控制u(t)U,tt0,tf,使被控系统由给定的初态x0 出发,在 tf t0 时刻转移到目标集 M,并使如下性能指标为最小 第二十一页,本课件共有29页最优控制问题的描述最优控制问题的描述(2/2)2/2)q值得注意的是,所谓的“最优性”,是指被控系统相对于性能指标函数意义下的最优性。不同的性能指标函数,最优控制结果是不相同的。第二十二页,本课件共有29页最优控制发展简史最优控制发展简史(1/5)(1/5)1.3 最优控制发展简史最优控制发展简史q20世纪50年代,随着现代化生产的发展,特别是空空间间技技术术的发展,被控系统日趋复杂,对自动控制提出的要求愈来愈高。建立在传递函数、频率特性基础上的经典控制理论,存在诸多局限性。主要表现在主要表现在:首先,它只适用于集总参数的SISO线性定常系统,且只适应于以解决伺服系统稳定性为主要目标的设计问题,难以适应综合性能指标的系统控制设计综合性能指标的系统控制设计。其次,在应用经典控制理论设计时,需要凭经验试凑及大量手工计算,难以用来解决复杂问题,如PID控制。第二十三页,本课件共有29页最优控制发展简史最优控制发展简史(2/5)(2/5)现代化生产的发展使系统所要求的品质指标,如时间、成本或综合性能指标,取极值直至最优的控制方法成为控制理论与工程的关键问题。q现代控制理论能处理的问题的范围很广泛它可以用来处理时时变变系统、非非线线性性系统、MIMO系统以及分布参数系统的问题;用它来处理随机系统和离散系统问题同样是很方便的。最优控制理论是现代控制理论的重要组成部分,同样能处理的控制问题的范围也非常广泛。第二十四页,本课件共有29页最优控制发展简史最优控制发展简史(3/5)(3/5)q早在20世纪50年代初期,就发表了用工程观点研究最短时间控制问题的文章,为最优控制理论发展提供了最早的实际模型。由于最优控制问题的严格数学表述形式的建立,更因为空间技术的迫切需要,从而引起了一大批数学家数学家的注意。最优控制问题从本质上来说是一个变分学问题。经经典典变变分分学学只能解决其容许控制为开集约束的最优控制问题,而更多的实际系统的容许控制属于闭集。这就要求人们建立求解最优控制问题的新途径。在众多的新方法中,以下两种方法最有效。第二十五页,本课件共有29页最优控制发展简史最优控制发展简史(4/5)(4/5)l一种是前苏联著名数学家庞特里亚金(Pontryagin)提出的“极大值原理”;另一种是美国数学家贝尔曼(Bellman)的“动态规划”方法。u庞特里亚金等人首先把“极大值原理”作为一种猜想提出来,随后不久提供了严格证明,并于1958年在爱丁堡召开的国际数学会议上首次宣读。u“动态规划”是贝尔曼在20世纪50年代研究多阶段离散决策优化问题时逐步创立的,其核心思想为“最优性原理”。之后,他发展了变分学中的哈密顿-雅可比(Hamilton-Jacobi)理论,构成了最优控制问题的动态规划法。第二十六页,本课件共有29页最优控制发展简史最优控制发展简史(5/5)(5/5)q50多年来,最优控制理论的研究,无论在深度和广度上,都有较大的发展,诸如分布参数系统的最优控制、随机系统的最优控制、大系统的最优控制和微分对策控制等。随着人们认识世界的不断深入,又提出了一系列有待解决的新课题,例如模型未未知知系统的鲁棒最优控制;多角色非零和对策的最优控制等目前,最优控制理论仍然是现代控制理论中的一个极其活跃的研究领域。第二十七页,本课件共有29页 谢谢 谢!谢!第二十八页,本课件共有29页感感谢谢大大家家观观看看第二十九页,本课件共有29页