最优控制的基本理论及应用.pptx
《最优控制的基本理论及应用.pptx》由会员分享,可在线阅读,更多相关《最优控制的基本理论及应用.pptx(144页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.1 引言 最优控制理论是现代控制理论的核心。数学观点:最优控制研究的问题是求解一类带有约束条件的泛函极值问题,本质上是一个变分学问题。经典变分理论:容许控制属于开集实际上:容许控制为闭集的更多。第1页/共144页 针对经典变分法的局限性美国学者贝尔曼在19531957年间创立了“动态规划”,解决了控制有闭集约束的变分问题;前苏联学者庞特里亚金等则在19561958年间创立了极小值原理,也发展了经典变分原理,成为处理控制有闭集约束的变分问题的强有力工具。本章在介绍解决最优控制问题3种基本方法(变分法、极小值原理和动态规划)的基础上,阐述两类典型最优反馈系统的设计,即线性二次型最优控制和最小时
2、间控制。第2页/共144页6.2 6.2 最优控制问题的提出及数学描述 最优控制问题实例 1.最速升降问题 第3页/共144页设有一物体M,假定在M内部装有一个控制器,它可以产生一个作用力u(t),其中k是常数。设已知M在 时,离地面的高度为 ,图6-1 最速升降问题示意图 问题是寻找作用力u(t)的变化规律,使M最快到达地面,并使其到达地面时的速度为零。垂直运动的速度为 ,第4页/共144页 令物体M的质量为m,用x(t)表示M离地面的高度,其方向规定为地面上x(t)为正,令 表示物体的高度,表示物体的升降速度,则上式可写成状态方程 第5页/共144页 现需寻找一个能使物体以最短时间从初态
3、到达终态(0,0)的控制u(t)。定义系统的性能指标为 式中,为起始时刻,为终止时刻。要求时间最短,即使性能指标J最小,这样求得的控制即为最优控制 。第6页/共144页2.搅拌槽问题 设有一盛放液体的连续搅拌槽,如图6-2所示。槽内装有不停转动着的搅拌器S,使液体经常处于完全混合状态,槽中原放 的液体。现需将其温度升高,为此在入口处送进一定量的液体,其温度为u(t),出口处流出等量的液体,以保持槽内液图6-2 搅拌槽问题示意图 面恒定。试寻找u(t)的变化规律,使槽中液体温度经1小时后上升到 ,并要求散失的热量最小。第7页/共144页 因假定槽中液体处于完全混合状态,故可用x(t)表示其温度。
4、由热力学知,槽中液体温度的变化率与温差 成正比,为简便计算,令比例系数为1,于是有,在1小时内散失的热量为 式中,q和r都是正的常数,。因此该最优控制问题是:寻找u(t)的变化规律,使槽中液体经1小时后从 上升到 ,并要求散失的热量最小,即J(u)取最小值。第8页/共144页最优控制问题的数学描述最优控制问题的数学描述 构成最优控制问题必须具备以下几个基本条件:1.被控系统的数学模型,即动态系统的状态方程 状态方程在最优控制中为等式约束条件。2.控制变量的约束条件(容许控制)任何实际物理系统,控制变量总是受约束的,一般可写成 (6-3)式中,U表示一个封闭的点集合,称为控制域。此时称u(t)为
5、容许控制。第9页/共144页3.状态方程的边界条件(初始状态和终值状态)在最优控制问题中,时的初态通常是已知的,即(6-4)而终值状态可以是状态空间中一个确定的点,也可以是状态空间中某一个点集(目标集)中的任一点。到达终端的时间 和终值状态 因问题而异。就终端时间 来说,它可以是固定的,也可以是变动的或自由的。最通常的终值边界条件是 (6-5)第10页/共144页 但有时并不这样简单,如用导弹攻击运动的目标,终值是可能运动轨迹上的一个点,此时终值状态是受运动轨迹约束的,一般地约束可表示为,(6-6)4.性能指标,也称性能泛函或目标函数 性能指标是衡量系统在任一容许控制作用下性能好坏的尺度,在最
6、优控制中其代替了传统的设计指标(如超调、调节时间、幅值裕度和相角裕度等)。第11页/共144页 1)积分型性能泛函(6-7)2)终值型性能泛函 (6-8)3)复合型性能泛函(6-9)第12页/共144页 最优控制问题,就是从可供选择的容许控制集U中,寻求一个控制向量u(t),使被控系统在时间域 内,从初态 转移到终态 或目标集 时,性能泛函J取最小(大)值。第13页/共144页6.3 6.3 变分法 变分法的基本概念 用变分法求解无约束条件的泛函极值问题 有约束条件的泛函极值问题 第14页/共144页 变分法的基本概念 1.泛函 如果对于某一类函数集合 中的每一个函数x(t),因变量J都有一个
7、确定的值与之对应,则称因变量J为这个宗量函数x(t)的泛函数,简称泛函,记作 。泛函可理解为“函数的函数”,其值由宗量函数的选取而定。第15页/共144页 与多元函数的宗量(自变量)多于一个相类似,多元泛函的宗量函数则多于一个,这些宗量函数可以表示为一个向量。例如,在控制系统中,n维状态向量x(t)为时间t的函数,若取如下形式的积分型性能指标(6-11)则J的数值取决于n维向量函数x(t),故式(6-11)为(多元)泛函。第16页/共144页 2.泛函的连续与线性泛函 (1)若对任给的 ,存在 ,使得当 时,就有(6-12)则称泛函 在函数 处是连续的。第17页/共144页 (2)连续泛函 若
8、满足以下条件(6-13)(6-14)则称 是线性泛函。式中k是实数,为函数空间中的函数。第18页/共144页 3.泛函的变分 宗量函数变分的定义 设 为连续泛函,则宗量函数x(t)的变分为属于同一函数类中两个函数x(t),之差,即(6-17)泛函变分的定义 设 为n维线性赋范空间 上的连续泛函,若其增量可表示为 第19页/共144页(6-18)式中,为宗量函数x(t)的变分,是 的线性连续泛函,是关于 的高阶无穷小,则定义泛函增量的线性主部(6-19)为泛函 的变分,记作 。若泛函有变分,则称该泛函可微。第20页/共144页 与函数的微分等于函数的导数与自变量的微分之乘积相对应,泛函变分也可利
9、用求导的方法来计算,即(6-20)【例6-1】求泛函 的变分,其中,x(t)为标量函数。解 由式(6-20)得 第21页/共144页 4.泛函的极值与泛函极值的必要条件 如果泛函 在任何一条与 接近的曲线上所取的值不小于 ,即(6-21)则称泛函 在曲线 上达到极小值。反之,若(6-22)则称泛函 在曲线 上达到极大值。第22页/共144页 定理6-1(泛函极值定理)若可微泛函 在 上达到极值,则 在 上的变分等于零,即 (6-23)定理6-1表明,泛函一次变分为零,是泛函达到极值的必要条件。综上可见,变分在泛函研究中的作用,相当于微分在函数研究中的作用。事实上,求泛函极大(小)值问题称为变分
10、问题,求泛函极值的方法称为变分法 第23页/共144页用变分法求解无约束条件的泛函极值问题用变分法求解无约束条件的泛函极值问题 设积分型性能泛函为(6-24)在区间 上,被积函数 二次连续可微,轨线x(t)有连续的二阶导数,,对x(t)没有任何约束。要求确定极值轨迹 ,使泛函J为极值。第24页/共144页 1.始端时刻和终端时刻固定时的泛函极值问题 首先讨论不仅初始时刻 、终端时刻 固定,而且初始状态 、终端状态 固定这一最简单情况下无约束条件的泛函极值问题(最优控制的基本问题)。第25页/共144页 定理6-2 设初始时刻 和初始状态 固定,且终端时刻 和终端状态 固定,则使性能泛函式(6-
11、24)取极值的必要条件是:x(t)为二阶微分方程(欧拉方程)(6-25)(横截条件)(6-26)的解。其中在区间 上,二次连续可微,x(t)有连续的二阶导数,,对x(t)没有任何约束。第26页/共144页 证明 设 是使J取极小值 的最佳轨迹曲线,现在 邻近作一微小摄动 ,并令 (6-27)式中,是一个很小的参数,为任意选定的连续可微n维向量函数且满足(6-28)将 和 代入式(6-24)可得 第27页/共144页取泛函增量 将上式在 的邻域内展开成泰勒(Taylor)级数,则(6-29)式中,R表示泰勒(Taylor)级数展开式中的高阶项。第28页/共144页 如果定义x(t)和 的一阶变分
12、为 (6-30)由泛函变分的定义,泛函的一阶变分为 (6-31)对上式积分中第二项作分部积分后可得(6-32)由定理6-1,泛函取极值的必要条件为其一次变分 为零,故令 ,并考虑到式(6-32)中 是任意的,即可证得定理6-2的结论式(6-25)和式(6-26)。第29页/共144页 在 、均固定的情况横截条件式(6-26)退化为已知的两点边界值即求解欧拉方程的边界条件为 ,。(欧拉方程)(6-25)(横截条件)(6-26)第30页/共144页讨论自由端点问题 若 、均固定但有一个端点 或 或两个端点自由时,例如,若 、均固定,终端 自由,(6-35)式(6-35)和已知的始点边界值 合起来构
13、成该情况下的边界条件。第31页/共144页 【例6-2】设泛函为 边界条件为 ,求J为极值时的曲线 。解 本例泛函为二元泛函,即 ,被积函数为 则 ,第32页/共144页代入欧拉方程 得 展开并联立方程组为 其通解为 第33页/共144页 代入已知的两点边界值,求出,,故极值曲线为 第34页/共144页 2.终端时刻未给定的泛函极值问题(可变端点问题)若始端时刻 给定,始端状态 固定或沿规定的边界曲线移动,而终端时刻 自由,终端状态 自由或沿规定的边界曲线移动,则这类最优控制问题称之为未给定终端时刻的泛函极值问题。第35页/共144页 定理6-3 设轨线x(t)从固定始端 到达给定终端曲线 上
14、,使性能泛函 (6-36)取极值的必要条件是:轨迹x(t)满足下列方程 (欧拉方程)(6-37)(终端横截条件)(6-38)式中,x(t)应具有连续的二阶导数,L至少应二次连续可微,C(t)应具有连续的一阶导数。第36页/共144页 关于定理6-3的说明:(1)定理6-3适用于始端时刻 、始端状态 给定,终端时刻 自由但终态 应落在端点约束曲线C(t)上(即终端约束方程为 )的情况,这时仅已知始点 ,而终点未知,因此,求解欧拉方程所欠缺的边界条件应由终端横截条件式(6-38)补足。式(6-38)确立了在终端处 和 之间的关系,并影响着 和终端约束曲线C(t)在 时刻的交点。第37页/共144页
15、 (2)可将定理6-3对x(t)是标量函数时所得到的公式推广到x(t)、C(t)是n维向量函数的情况,即可得向量形式的泛函极值必要条件(欧拉方程)(6-39)(终端横截条件)(6-40)第38页/共144页有约束条件的泛函极值问题有约束条件的泛函极值问题 求泛函在等式约束下的极值,称为条件泛函极值问题。应用拉格朗日乘子法,可将这类条件泛函极值问题转化为无约束条件的泛函极值问题。第39页/共144页 最优控制问题中的性能泛函为(6-41)式中,泛函J所依赖的宗量函数x(t)、u(t)受被控系统的状态方程约束,即 (6-42)式中,是x(t)、u(t)和t的n维连续向量函数。最优控制问题是寻求最优
16、控制 及最优状态轨迹 ,使系统式(6-42)从初始状态 转移到终端状态 ,并使J取极值。第40页/共144页 若初始时刻 及始端状态 给定,按照终端状态边界条件,讨论以下几种情况。给定,终端 自由 给定,终端 约束 自由,终端 约束 第41页/共144页 1.给定,终端 自由 将状态方程式(6-42)写成约束方程形式 (6-43)仿照求函数条件极值的拉格朗日乘子法,将等式约束式(6-43)和原有的指标泛函结合成增广泛函(6-44)式中,,为待定拉格朗日乘子向量函数。显然,不论 取何种函数,只要x(t)、u(t)满足等式约束(6-43),即满足系统的状态方程式(6-42),则 与J总是等价的。第
17、42页/共144页 定义标量函数 (6-45)为哈密顿(Hamilton)函数,则增广泛函式(6-44)可写为(6-46)对式(4-46)右边最后一项进行分部积分,即 (6-47)故增广泛函式(6-44)可写为 第43页/共144页(6-48)设x(t),u(t)相对于最优值 ,的变分分别为 和 ,且注意到 ,则 ,故式(6-48)所示 的一阶变分为(6-49)第44页/共144页 令 ,因为 、及 任意,则得增广泛函 取极值的必要条件,再由约束方程式(6-43)及定义的哈密顿函数式(6-45),得在 及始端状态 给定、给定、终端 自由情况下,满足状态方程式(6-42)的泛函式(6-41)取极
18、值的必要条件为同时满足 (状态方程)(6-50)(协态方程)(6-51)第45页/共144页 (控制方程)(6-52)(横截条件)(6-53)(始端边界条件)(6-54)式(6-50)、式(6-51)和式(6-52)相当于前面的欧拉方程,式(6-53)为横截条件。式(6-50)为系统状态方程,其与式(6-51)的右端均为哈密顿函数的适当偏导数,故式(6-50)和 式(6-51)合称为哈密顿正则方程,简称为正则方程。式(6-51)则称为伴随方程或协态方程,相应的拉格朗日乘子向量 又称为伴随向量或协态向量。式(6-52)表明,最优控制 使哈密顿函数取驻值,故式(6-52)称为控制方程。第46页/共
19、144页 2.给定,终端 约束 设终端状态应满足如下目标集等式约束条件 (6-55)式中,,即终端状态 沿规定的边界曲线移动。现在存在状态方程约束式(6-43)和终端边界约束式(6-55)这两种类型的等式约束,为此除了引入待定的n维拉格朗日乘子向量函数 ,再引入一个待定的乘子向量 ,且 ,构造增广泛函 第47页/共144页(6-56)式中,哈密顿函数 仍由式(6-45)定义。同样,设x(t),u(t)相对于最优值 ,的变分分别为 和 ,且注意到 ,故式(6-56)所示 的一阶变分为(6-57)第48页/共144页 令 ,并由式(6-42)、式(6-55)及式(6-45),得当 及始端状态 给定
20、、给定、终端状态 受目标集等式约束式(6-55)情况下,满足状态方程式(6-42)的泛函式(6-41)取极值的必要条件为同时满足 正则方程 (6-58)控制方程 (6-59)边界条件与横截条件 (6-60)(6-61),第49页/共144页 3.自由,终端 约束 在这一类问题中,终端时刻 为待求的变量,且终端状态又受式(6-55)所示的目标集等式约束。显然,终端时刻 自由时所讨论的问题,除了 自由之外,其余与终端时刻给定时所讨论的内容相同。和 给定时终端状态受约束的最优控制问题一样,引入待定的拉格朗日乘子向量 和 ,构造增广泛函(参见式(6-56)第50页/共144页式中,哈密顿函数 仍按式(
21、6-45)定义。但与 给定情况不同的是,现在 也是需要进行最优选择的变量。设x(t)、u(t)、相对于其最优值 、的变分分别为 、,即 (6-62)且有如下近似关系式 (6-63)考虑到 ,则由 、产生的增广泛函 的一次变分为 第51页/共144页(6-64)令 ,因为 、及 任意,则得增广泛函 取极值的必要条件,并由式(6-42)、式(6-55)及式(6-45),得当 及始端状态 给定、自由、终端状态 受式(6-55)约束情况下,满足式(6-42)的泛函式(6-41)取极值的必要条件为同时满足 正则方程 (6-65)第52页/共144页控制方程 (6-66)边界条件与横截条件 ,(6-67)
22、(6-68)(6-69)式中,为哈密顿函数H在最优轨迹终端处的值。第53页/共144页 【例6-3】设被控系统的状态方程为 设初始状态为 ,终端状态约束曲线为 ,求使目标函数 取极小时的最优控制 和最优轨迹 。解 构造哈密顿函数 第54页/共144页正则方程为 (协态方程)(状态方程)控制方程 它们的通解为 第55页/共144页边界条件与横截条件,代入通解,得 ,,则最优控制 最优轨迹 ,第56页/共144页6.4 极小值原理 在用经典变分法求解最优控制问题时,假定控制变量u(t)不受任何限制,即容许控制集合可以看成整个r维控制空间开集,控制变分 是任意的,同时还要求哈密顿函数H对u连续可微,
23、在这种情况下,应用变分法求解最优控制问题是行之有效的。但是在大多数情况下,控制量的大小总是受限制的,即 (6-70)这时容许控制u(t)的集合是一个r维有界闭集。一般总可用如下不等式表示容许控制u(t)的闭集约束条件,即 第57页/共144页 (6-71)当容许控制集合u(t)属于有界闭集时,控制变分在容许控制集合边界上不能任意,最优控制的必要条件 亦不满足,则不能用经典变分法处理。第58页/共144页 针对经典变分法应用条件过严的局限性,前苏联学者庞特里亚金等发展了经典变分原理,在19561958年间创立了极小值原理。极小值原理由变分法引伸而来,它的结论与经典变分法的结论有许多相似之处,这一
24、方法当控制变量u(t)受闭集约束时是行之有效的,并且不要求哈密顿函数H对u(t)连续可微,是控制变量u(t)受限制时求解最优控制问题的有力工具,而且极小值原理也可用于解决控制不受约束的最优控制问题,因此其是解决最优控制问题的更一般的方法。第59页/共144页 定理6-4(极小值原理)设系统状态方程为 (6-73)初始条件为 固定,固定 (6-74)控制约束为 ,(6-75)终端约束为 ,自由 (6-76)式中,x(t)为n维状态向量;控制u(t)属于r维空间中的有界闭集U,受不等式(6-75)约束;g为l维连续可微向量函数,;N为q维连续可微向量函数,。性能泛函为 (6-77)第60页/共14
25、4页式中,和L为连续可微的标量函数;为待定的最优终端时刻。取哈密顿函数为 (6-78)式中,为待定的n维伴随向量函数(拉格朗日乘子向量)。则实现最优控制的必要条件为:最优控制 、最优轨迹 和最优伴随向量 必须满足下列一组方程 (1)正则方程 (6-79)第61页/共144页(6-80)式中,是与时间t无关的l维拉格朗日乘子向量(维数与g相同)。若g中不包含x,则有 (6-81)(2)横截条件及边界条件 (6-82)第62页/共144页 (6-83)(6-84)(6-85)式中,为待定的拉格朗日乘子向量。(3)在最优轨迹 上,与最优控制 相对应的哈密顿函数H取绝对极小值,即(6-86)且沿最优轨
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 基本理论 应用
限制150内