cha最大值原理PPT课件.ppt
《cha最大值原理PPT课件.ppt》由会员分享,可在线阅读,更多相关《cha最大值原理PPT课件.ppt(98页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/4/91一、古典变分法存在的问题 (1)在一般情况下,可以将控制函数U(t)所受到的约束条件利用如下形式的不等式来表示.即 当控制函数U(t)受到上述不等式约束,并且最优控制取决于闭集性约束的边界时,古典变分法便不再适用了。(2)在应用古典变分法来求解最优控制问题时,要求函数 X(tf),tf,LX(t),U(t),t,f X(t),U(t),t 对它们的自变量具有“充分”的可微性,特别要求H/U(t)有定义,于是,类似 这样的性能泛函数就被排除在外了。但是在燃料最优控制问题中,这类性能泛函却是无法避免的。2023/4/92二.最大值原理和动态规划 为了解决古典变分法在求解最优控制问
2、题中所暴露出来的上述问题,许多学者进行了各种探索。其中以苏联学者庞特里雅金(.C.oHTpH)的最大值原理(或最小值原理)与美国学者贝尔曼(R.E.Bellman)的动态规划较为成功,应用也较广泛,现已成为求解最优控制问题的强有力的工具。在这一章里,首先通过积分型最优控制问题提出最大值原理,然后再推广到复合型最优控制问题中,然后利用增量法对最大值原理进行证明。2023/4/932.1 最大值原理的提出 2.1.12.1.1 积分型最优控制问题 问题2.1.1(积分型最优控制问题)给定系统的状态方程:(2.1.1)其中,f是n维连续可微的向量函数;X(t)是n维状态变量,其初态X(t0)=X0,
3、而终态应满足的条件是:终端时刻tf固定,终端状态X(tf)自由,U(t)是m维控制变量,其所受约束条件是 (2.1.2)其中,是以U(t)为元素的m维实函数空间中的一个闭子集。式(2.1.2)表明,控制变量是这个闭子集中的元素。满足式(2.1.2)约束条件的控制变量称为容许控制变量,简称容许控制。要求在满足式(2.1.2)的容许控制中,确定一控制变量U(t),使系统(2.1.1)从给定的初态X(t0)转移到某个终态 2023/4/94X(tf)的过程中,性能泛函 达到极小值。其中L是连续可微的标量函数。这个积分型最优控制问题所确定的控制U(t)称为最优控制,记为U*(t)。如果不考虑式(2.1
4、.2)的约束条件,那么该最优控制问题的解的必要条件可由第一章的定理1.6.1给出,现引述如下:定理1.6.11.6.1 设系统的状态方程为 则为将系统从给定的初态X(t0)=X0 转移到终端时刻tf固定,终端状态X(tf)自由的某个终态,并使性能泛函(2.1.3)2023/4/95 达到极小值的最优控制应满足的必要条件是 (1)设U*(t)是最优控制,X*(t)是对应与U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X(t)与(t)满足规范方程 (2.1.4)(2.1.5)其中,(2.1.6)2023/4/96 (2)边界条件为 (3)哈密顿函数H对控制
5、变量U(t)(t0t tf)取极小值,即 定理1.6.1是在控制变量u(t)不受约束的情况下,求最优控制函数U*(t),使哈密顿函数(2.1.6)达到极小值。这也是在控制函数U(t)不受约束或只受开集性的约束的情况下的最小值原理。显然,控制方程(2.1.9)也可以写成如下形式(2.1.7)(2.1.8)(2.1.9)(2.1.10)2023/4/97 说明:(1)当控制函数U(t)不受约束或只受开集性约束条件下,控制方程(2.1.9)和(2.1.10)是等价的。(2)在控制函数U(t)受到式(2.1.2)所表示的闭集性约束的条件下,控制方程(2.1.9)未必是最优控制问题的解的必要条件之一。a
6、.因为 b.作为控制变量U(t)的函数的Hamilton函数H X(t),(t),U(t),t在闭子集内可能不存在极值点,而企图以H/U 来求极小值点也是难以奏效的。因此,在控制函数U(t)受到式(2.1.2)那样闭集性约束的条件下,控制方程(2.1.9)不再是由式(2.1.1)式(2.1.3)所给定的最优控制问题解的必要条件了。2023/4/98但是,控制方程(2.1.10)总是成立的,它仍然是由式(2.1.1)式(2.1.3)所给定的最优控制问题解的必要条件 。定理2.1.1 2.1.1(积分型最优控制问题的最小值原理)(积分型最优控制问题的最小值原理)给定系统的状态方程 和初态X(t0)
7、=X0,而终端时刻tf固定,终端状态X(tf)自由以及控制变量U(t)所受约束条件是 则为将系统从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函 达到极小值的最优控制应满足的必要条件是:2023/4/99 (1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X*(t)和(t)满足规范方程 式中H是哈密顿函数,且为 (2)边界条件为2023/4/910 (3)哈密顿函数在最优控制U*(t)和最优轨线X*(t)上达到最小值,即 说明:(1)由于定理2.1.1的中心内容是,使性能泛函(2.1.3)达到最小
8、值的最优控制的必要条件是哈密顿函数H达到最小值,所以,该定理称为最小值原理。(2)一个函数的最小值点与该函数反号后的最大值是一致的。所以,若令哈密顿函数为 则下列二式2023/4/911和的结果是一致的,只是二式中的协态变量(t)是互为反号的。定理2.1.2 2.1.2(积分型最优控制问题的最大值原理)(积分型最优控制问题的最大值原理)给定系统的状态方程和初态X(t0)=X0,而终端时刻tf固定,终端状态X(tf)自由以及控 制变量U(t)所受约束条件是则为将系统从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函2023/4/912达到极小值的最优控制应满足的必要条件是:(1)设U*
9、(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X*(t)和(t)满足规范方程其中,2023/4/913(2)边界条件为(3)在最优控制U*(t)和最优轨线X*(t)上哈密顿函数达到最大值,即说明:由于定理2.1.2的中心内容是,使性能泛函达到极小值的最优控制的必要条件是哈密顿函数H达到最大值,所以,该定理称为最大值原理。2023/4/914例 2.1.12.1.1 给定一阶线性系统和初始条件 (2.1.11)其中控制作用u(t)的约束条件为 (2.1.12)要求确定控制函数u(t),使性能泛函 (2.1.13)达到极
10、小值。解:这是一个积分型最优控制问题,其终端时刻tf=1固定,终端状态X(tf)是自由的。控制函数受到闭集性的约束条件。可以利用上面介绍过的最大值原理(定理2.1.2)或最小值原理(定理2.1.1)来求解。在这里,为了进行比较,将分别利用这两个定理来求解。(1)应用最大值原理求解,为此构造哈密顿函数 (2.1.14)2023/4/915 按照最大值原理,为使泛函(2.1.13)达到极小值必须选择控制函数u(t),使哈密顿函数(2.1.14)达到最大值。由式(2.1.14)可见,当u(t)与(t)+1/2)同号,且取其约束条件的边界值,即|u(t)|=1时,使哈密顿函数H达到最大值。所以,控制函
11、数应选择为 (2.1.15)或 (2.1.16)2023/4/916 由上式可见,若要确定u(t),必须通过协态方程解出(t)。根据哈密顿函数(2.1.14)可以写出协态方程 因为tf=1固定,x(1)自由,所以(1)=0,则协态方程的解为 而 其曲线如图21(a)所示。由此可得最优控制为或 (2.1.17)2023/4/9172023/4/918 式中=ln(e/2),控制函数的曲线如图21(b)所示。将最优控制u*(t)代入状态方程(2.1.11)得到 (2.1.18)(2.1.19)利用初始条件x(0)=1,可得式(2.1.18)的解 当t=ln(e/2)时,有 将它作为式(2.1.19
12、)的初始条件。解得 2023/4/919 于是有 将u*(t)和x*(t)代入式(2.1.13),得 由于只有一个u(t)满足最大值原理。根据实际情况,可判定它是最优控制u*(t)。(2)应用最小值原理求解,为此构造哈密顿函数 (2.1.20)2023/4/920 按照最小值原理,为使泛函(2.1.13)达到极小值,必须选择控制函数u(t)使哈密顿函数(2.1.20)达到最小值。由式(2.1.20)可知,当u(t)与(t)1/2)异号,且取其约束条件的边界值(即|u(t)|=1)时,哈密顿函数H达到最小值,所以控制函数应取为 由上式可见,若要确定u(t),必须由协态方程解出(t),根据哈密顿函
13、数(2.1.20),可写出协态方程 其解为 2023/4/921由此可得最优控制函数为 可见,这一结果与应用最大值原理所得到的结果是一致的。将它代入状态方程(2.1.11),当然也会得到相同的结果。以下的计算可以仿照(1)进行,这里就不重复了。说明:由例2.1.1可以看出,分别应用最大值原理和最小值原理求解同一个最优控制问题,所得到的最优控制和最优轨线是一致的,但是,协态变量却是互为反号的。2023/4/9222.1.22.1.2 复合型最优控制问题 问题2.1.2(复合型最优控制问题)给定系统的状态方程:(2.1.21)其中f是n维连续可微的向量函数。X(t)是n维状态变量,已知其初态为 X
14、(t0)=X0,终端的约束条件为:(2.1.22)其中是r 维连续可微的向量函数,且rn,U(t)是m维控制变量,且其约束条件为 (2.1.23)其中是以U(t)为元素的m维实函数空间中的闭子集。要求我们在满足式(2.1.23)的容许控制中,确定一控制变量U(t),使系统(2.2.21)从给定的初态X(t0)转移到满足式(2.1.22)条件下的某个终态X(tf),并使性能泛函2023/4/923 (2.1.24)达到极小值。其中和L都是连续可微的标量函数,而终端时刻tf是可变的。定理2.1.3 2.1.3(复合型最优控制问题的最小值原理)(复合型最优控制问题的最小值原理)给定系统的状态方程 和
15、控制函数U(t)的闭集约束条件则为将系统从给定的初态X(t0)=X0,转移到满足终端约束条件 的某个终态X(tf),其中tf是可变的,并使性能泛函 2023/4/924达到极小值的最优控制应满足的必要条件是 (1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则存在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X*(t)和(t)满足规范方程 其中 (2)状态变量和协态变量的边界条件为 2023/4/925在上述各式中的是待定的r维乘子向量,即(3)哈密顿函数H在最优控制与最优轨线上达到最小值。即 终端受限tf自由2023/4/926定理2.1.4 2.1.4(复合
16、型最优控制问题的最大值原理)给定系统的状态方程 和控制函数U(t)的闭集约束条件则为将系统从给定的初态X(t0)=X0,转移到满足终端约束条件 的某个终态X(tf),其中tf是可变的,并使性能泛函达到极小值的最优控制应满足的必要条件是:(1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的(t),使得X*(t)和(t)满足规范方程 2023/4/927其中(2)状态变量和协态变量的边界条件为 2023/4/928(3)哈密顿函数H在最优控制与最优轨线上达到最大值。即 2.1.32.1.3 有关最大值原理(或最小值原理)的几点说明 最大值
17、原理(当然包括最小值原理,以下同)是对古典变分法的发展。它不仅可以用来求解函数U(t)不受约束或只受开集性约束的最优控制问题,而且也可以用来求解控制函数U(t)受到闭集性约束条件的最优控制问题。这就意味着最大值原理放宽了对控制函数U(t)的要求。最大值原理没有提出哈密顿函数H对控制函数U(t)的可微性的要求,因此,其应用条件进一步放宽了。并且,由最大值原理所求得的最优控制U(t)使哈密顿函数H达到全局、绝对最大值,而由古典变分法的极值条件H/U=0所得到的解是H的局部、相对最大值或驻值。因此,最大值原理将古典变分法求解最优控制问题的极值条件作为一个特例概括在自己之中。2023/4/929最大值
18、原理是最优控制问题的必要条件,并非充分条件。也就是说,由最大值原理所求得的解能否使性能泛函J达到极小值,还需要进一步分析与判定。但是,如果根据物理意义已经能够断定所讨论的最优控制问题的解是存在的,而由最大值原理所得到的解只有一个,那么,该解就是最优解。实际上,我们遇到的问题往往属于这种情况。利用最大值原理和古典变分法求解最优控制问题时,除了控制方程的形式不同外,其余条件是相同的。一般来说,根据最大值原理确定最优控制U*(t)和最优轨线X*(t)仍然需要求解两点边界值问题。这是一件复杂的工作。由最大值原理和最小值原理所得到的最优控制U*(t)和最优轨线X*(t)是一致的,只是协态变量(t)是互为
19、反号的。若所讨论问题是确定最优控制U*(t),使性能泛函 2023/4/930 达到极大值,最大值原理仍然成立,这时只要将上述性能泛函变为 就可以了。2023/4/9312.2 最大值原理的证明2.2.12.2.1 一般型最优控制问题 问题2.2.1(一般型最优控制问题)给定系统的状态方程:(2.2.1)的初态X(t0)=X0和 控制函数的约束条件 (2.2.2)从满足约束条件(2.2.2)的容许控制函数中,确定一个控制函数U(t),使性能泛函 (2.2.3)达到极小值,其中 tf是终端时刻,X(tf)是终端状态。庞特里雅金函数庞特里雅金函数2023/4/932 说明:最优控制问题的上述提法具
20、有一般性,它将许多常见的最优控制问题概括成为自己的特殊情况,故称为一般型最优控制问题,许多最优控制问题都可以转化为一般型最优控制问题。最速控制问题给定n阶系统的状态方程的初始状态X(t0)=X0和 控制函数的约束条件需要从容许控制U(t)中,确定一个控制函数U(t),能在最短的时间内,将系统从给定的初态X(t0)转移到给定的终态X(tf)。这是最速控制问题,其性能泛函 2023/4/933 其中,t0是固定的初始时刻,tf是可变的终端时刻。下面将其化为一般型最优控制问题。为此,引入一个新的状态变量xn+1(t),令 其中,于是一个n阶系统的最速控制问题就转化为一个n+1阶系统的一般型最优控制问
21、题。2023/4/934积分型最优控制问题给定n阶系统的状态方程的初始状态X(t0)=X0和 控制函数的约束条件要求从容许控制U(t)中,确定一个控制函数U(t),将系统从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函达到极小值。这是个积分型最优控制问题,引入一个新的状态变量xn+1(t),满足 2023/4/935 其中,于是一个n阶系统的积分型最优控制问题便转化成一个n+1阶系统的一般型最优控制问题。终端型指标的最优控制问题 给定n阶系统的状态方程的初始状态X(t0)=X0和 控制函数的约束条件2023/4/936要求从容许控制U(t)中,确定一个控制函数U(t),使性能泛函
22、达到极小值。这是个终端型指标的最优控制问题,引入一个新的状态变量xn+1(t),满足 2023/4/937 于是,一个n阶系统的终端型指标的最优控制问题也可转化为一个n+1阶系统的一般型最优控制问题。说明:类似地,一个复合型指标的最优控制问题,也能够转化为一般型最优控制问题。这里只要结合应用积分型指标和终端型指标最优控制问题转化为一般型指标最优控制问题的思想和方法,就可以完成这种转化工作。2023/4/9382.2.22.2.2 一般型最优控制问题 的最大值原理及证明定理2.2.1(一般型最优控制问题的最大值原理终端时刻固定,终端状态自由)给定系统的状态方程 和控制函数U(t)的约束条件 则为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- cha 最大值 原理 PPT 课件
限制150内