ppt第四章极小值原理及其应用.ppt
《ppt第四章极小值原理及其应用.ppt》由会员分享,可在线阅读,更多相关《ppt第四章极小值原理及其应用.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 极小值原理及其应用极小值原理及其应用4.1 经典变分法的局限性经典变分法的局限性4.2 连续系统的极小值原理连续系统的极小值原理4.3 最短时间控制问题最短时间控制问题4.4 最少燃料控制问题最少燃料控制问题4.5 离散系统的极小值原理离散系统的极小值原理4.6 小结小结4.1 经典变分法的局限性经典变分法的局限性 上面我们用经典变分法解最优控制问题时,得出了最优性的必要条件 在得出这个条件时,作了下面的假定:是任意的,即不受限制,它遍及整个向量空间,是一个开集;是存在的。在实际工程问题中,控制作用常常是有界的。如飞机舵面的偏角有限制,火箭的推力有限制,生产过程中的生产能力有限制
2、等等。一般,我们可用下面的不等式来表示iiMtu)(这时 属于一个有界的闭集,写成 ,为闭集。更一般的情况可用下面的不等式约束来表示。当 属于有界闭集,在边界上取值时,就不是任意的了,因为无法向边界外取值,这时 就不一定是最优解的必要条件。考察由图4-1所表示的几种情况,图中横轴上每一点都表示一个标量控制函数 ,其容许取值范围为 。图4-1有界闭集内函数的几种形状对于图4-1(a)仍对应最优解 。对于图4-1(b)所对应的解 不是最优解,最优解 在边界上。对于图4-1(c)常数,由这个方程解不出最优控制 来(这种情况称为奇异情况),最优解 在边界上。另外,也不一定是存在的。例如状态方程的右端
3、对U的一阶偏导数可能不连续,或由于有些指标函数,如燃料最优控制问题中,具有下面的形式这时 对U的一阶偏导数不连续。经典变分法无法处理上面的情况,必须另辟新的途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。1956年前苏联学者庞特里雅金提出这个原理时,把它称为极大值原理,目前较多地采用极小值原理这个名字。下面给出这个原理及其证明,并举例说明其应用。4.2 连续系统的极小值原理连续系统的极小值原理 由于可以利用扩充变量的方法将各类最优控制问题化为定常系统,末值型性能指标情况下的标准形式。我们这里只就定常系统、末值型性能指标、固定、末端受
4、约束情况下给出极小值原理的简单证明。设系统的状态方程为(4-1)初始条件为 (4-2)控制向量,并受下面的约束 (4-3)末值状态必须满足的约束条件为 (4-4)(4-5)其中性能指标函数为为待定列向量。在本节中,假设函数 ,存在且连续,并假定容许控制 是在控制域内取值的任何分段连续函数。这时如果选定了某一容许控制 ,则容易证明在任意的初始条件 下,方程(4-1)唯一的确定了系统状态的变化规律 ,且 是连续的和分段可微的。在这些条件下,我们就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。证明:采用扰动法,即给最优控制一个变分 ,它将引起最优轨线的变分 ,并使性能指标
5、有一增量 ,当 为极小时,必有 ,由此即可导出最优控制所应满足的必要条件。在变分法中,是微量,即将最优控制和邻近的容许控制相比较,因而最多只能建立哈密顿函数 的相对极小值性质。庞特里亚金极大值原理却将最优控制与控制域内所有可能的值进行比较,因而得出结论,在整个控制域内最优控制使哈密顿函数 成为绝对极小值。正是这个性质使得庞特里亚金极大值原理成为寻找最优控制的有力工具。但是这样,的改变量 必须看成有限量,而不再是微量。如果让改变的时间很短,则由此引起的最优轨线的改变 仍是微量,性能指标的增量 也是微量,因而对各关系式的数学处理仍是比较容易的。设 为最优控制,任选一时刻 及一微量 ,在时间间隔中
6、给 一有限大小的改变量 ,且使得 。现在研究由 引起的最优轨线 的变化。分为三段考虑:1在这一段中,因而 。2系统的状态方程(4-1)可在初始条件下直接积分。当 时,当 时,两式相减可得这一段的 (4-6)可以对 的大小作估计由于 是微量,所以 也是微量,因而在精确到一阶微量的情况下,下式成立 (4-7)将式(4-7)代入(4-6),并注意到微量 在微小时间间隔上的积分是高阶微量,即得在第二段时间间隔得终点 ,则有或 (4-8)其中 表示二阶以上的微量。3这时又有 ,系统的状态方程为而状态变量 的变分满足方程 (4-9)引入变量 及哈密顿函数 (4-10)(4-11)(4-12)显然,方程(4
7、-9)和(4-11)为共轭方程,立即求得积分或 (4-13)即最终求得了由于 的有限改变而引起的最优轨线的变化 ,特别是末值状态的变化 。下面研究由 引起的最优性能指标的改变量 。由于 故有 (4-14)综合(4-8)、(4-12)、(4-13)和(4-14)等式,可以建立 与有限改变量 之间的关系已知 中的任意时刻,并以 表示 ,当 时,上式变为 ,或用哈密顿函数 的表达式(4-10)表示可得 (4-15)或 于是定常系统、末值型性能指标、固定、末端受约束情况下极小值原理得以证明。总结上述讨论,可将庞特里雅金极小值原理写为如下形式:定理(极小值原理):系统状态方程(4-1)初始条件 (4-2
8、)控制向量 ,并受下面的约束 (4-3)终端约束 (4-4)指标函数 (4-5)要求选择最优控制 ,使 取极小值。取极小值的必要条件是 、和 满足下面的一组方程1 正则方程 (协态方程)(4-16)(状态方程)(4-17)2 边界条件 (4-18)3 横截条件 (4-19)4 最优终端时刻条件 (4-20)5在最优轨线 和最优控制 上哈密 顿函数取极小值 (4-21)将上面的结果与用古典变分法所得的结果(3-34)(3-38)式)对比可见,只是将 这个条件用(4-21)代替,其它无变化。应该指出,当 存在,且 得出的 绝对极小,如图4-1(a)所示时,即为条件(4-21)式。所以极小值原理可以
9、解决变分法所能解决的问题,还能解决变分法不能解决的问题。如何应用条件(4-21)式,这是一个关键,我们将用具体例子来说明。4.3 最短时间控制问题最短时间控制问题 节省时间意味着提高生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控制的研究,这方面的研究结果很多,这里先就简单的重积分系统的最短时间控制展开讨论。在前面的绪论中列举了火车快速行驶问题。设火车质量m=1,把运动方程写成状态方程形式,令 可化为下面的最短时间控制问题。例4-1 重积分系统的最短时间控制状态方程 (4-22)初始条件为 (4-23)终端条件为 (4-24)控制约束为 (4-25)求出使性能指标 (4-2
10、6)取极小的最优控制。解 ;因为控制作用有限制(属于有界闭集),故要用极小值原理求解。取哈密顿函数 (4-27)协态方程为 (4-28)(4-29)积分上面两个方程可得 (4-30)(4-31)其中,、是积分常数。由的表达式(4-27)可见,若要选择 使 取极小,只要使 越负越好,而 ,故当 ,且 与 反号时,取极小,即最优控制为由此可见,最优解 取边界值+1或-1,是开关函数的形式。什么时候发生开关转换,将取决于 的符号。而由(4-31)式可见,是 的线性函数,它有四种可能的形状(见图4-2),也相应有四种序列 由图4-2可见,当 为 的线性函数时 最多改变一次符号。图4-2 与 的四种形状
11、从上面两式消去t,即可得相轨迹方程 (4-33)当时 ,状态方程的解为 (4-32)下面来求出 取不同值时的状态轨迹(也称为相轨迹)。在图4-3中用实线表示,不同的C值可给出一簇曲线。由(4-32)第一式知 增大时 增大,故相轨迹进行方向是自下而上,如图中曲线上箭头所示。当 时,状态方程的解为 (4-34)消去 ,可得相轨迹方程图4-3 相轨迹图在图4-3中用虚线表示。因 增大时,减少,故相轨迹进行方向是自上而下。两簇曲线中,每一簇中有一条曲线的半支进入原点。在 的曲线簇中,通过原点的曲线方程为 (4-36)这半支用 表示。在 的曲线簇中,通过原点的曲线方程为 (4-37)这半支用 表示。和
12、这两个半支通过原点的抛物线称为开关线,其方程为 (4-38)图4-4 最优相轨迹与开关线当初始状态 在开关线左侧,如图4-4中D点,从D点转移到原点,并在转移过程中只允许 改变一次符号的唯一途径如图所示,即从D点沿 的抛物线移到与 相遇,在相遇点改变 的符号为 ,再沿 到达原点。因此,只要初始状态在开关线左侧,都沿 的抛物线转移到 ,然后 改变符号为 ,并沿 到达原点。同样,当初始状态在开关线右侧,如图4-4中的M点,则先沿 的抛物线转移到 ,然后 改变符号为 ,并沿 到达原点。在图4-4中开关曲线(由 和 组成)把 -平面划成两个区域。开关线左侧(图中划阴影线部分)区域用 表示,中的点满足
13、则 (4-39)开关线右侧区域用 表示,中的点满足 则 (4-40)于是最优控制规律可表示为状态 的函数,即 (4-41)(4-42)根据上面的关系,可以通过非线性的状态反馈来构成。图4-5 重积分系统时间最优控制的框图图4-5表示了重积分系统时间最优控制的工程实现。由图可见 时,即满足(4-39)式,时,即满足(4-40)式。图中的继电函数早期是用继电器实现的,由于继电器在动作时有砰砰声,故这种最优控制又称为“砰砰”控制。当然,现在可以用无接触的电子开关或微处理机来实现这种控制规律,既方便、可靠,又无砰砰声了。例42 积分环节和惯性环节串联系统的最短时间控制其传递函数为 (4-43)其中 为
14、大于零的实数。由(4-43)式可得运动方程为(4-44)令 和 为状态变量,并有(4-45)控制约束为 ,最优控制只能取 。(1)对于 情形,状态方程为其状态轨线相迹为 (4-46)如图4-6(a)所示,箭头为状态运动方向。它有一条渐近线 ,如图中虚线所示。在这簇曲线中,只有 到达平衡位置0。,(4-47)(2)对于 的情形,状态方程为其状态轨线相迹为 (4-48)如图4-6(b)所示,箭头为状态运动方向。它有一条渐近线 ,如图中虚线所示。在这簇曲线中,只有 到达平衡位置0。(4-49)(a)u=1(b)u=-1图4-6 系统的相轨迹将 和 合并成一条曲线,其方程为 (4-50)令 (4-51
15、)(4-52)于是曲线 方程可写为 (4-53)曲线 将相平面分成两部分,如图4-7所示。的上半平面包括 记为 ,的下半平面包括记为 ,那么 (4-54)图4-7 系统的时间最优相轨迹和开关线由于最优控制只取 ,它们的切换最多一次,根据状态初始位置不同,它们最优控制是不同的,如图中初始状态在A点时,它属于 ,所以开始 。当运动到达时 ,与交于a点,马上切换为 ,以后沿 运动直到平衡位置0,再除去控制量 。当初始状态在B点时,它属于 ,最优控制应先取 ,到达 交于b点时,马上切换为 ,以后沿 继续运动,直到平衡位置0,切除控制量。综上所述,最优控制的状态反馈规律为 (4-55)最短时间最优控制的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ppt 第四 极小 原理 及其 应用
限制150内