最优控制_第五章_用变分法求解连续最优控制问题—有约束条件的泛函极值课件.ppt
《最优控制_第五章_用变分法求解连续最优控制问题—有约束条件的泛函极值课件.ppt》由会员分享,可在线阅读,更多相关《最优控制_第五章_用变分法求解连续最优控制问题—有约束条件的泛函极值课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 用变分法求解连续用变分法求解连续最优控制问题最优控制问题有约束条件的泛函极值有约束条件的泛函极值 上节讨论没有约束条件的泛函极值问题。但在上节讨论没有约束条件的泛函极值问题。但在最优控制问题中,泛函最优控制问题中,泛函J所依赖的函数总要受到受控所依赖的函数总要受到受控系统状态方程的约束。解决这类问题的思路是应用系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法,将这种有约束条件的泛函极值问拉格朗日乘子法,将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。题转化为无约束条件的泛函极值问题。一、拉格朗日问题一、拉格朗日问题 考虑系统考虑系统 n维连续可微的矢量函数
2、。维连续可微的矢量函数。(5-1)式中式中;设给定设给定 ,初始状态为,初始状态为x(t0)=x0,终端状态终端状态x(tf)自由。性能泛函为自由。性能泛函为 寻求最优控制寻求最优控制u(t),将系统从初始状态,将系统从初始状态x(t0)=x0转移到终端状态转移到终端状态x(tf),并使性能泛函,并使性能泛函J取极值。取极值。(5-2)将状态方程式将状态方程式(5-1)写成约束方程形式写成约束方程形式应用拉格朗日乘子法,构造增广泛函应用拉格朗日乘子法,构造增广泛函式中式中(t)待定的待定的n维拉格朗日乘子矢量。维拉格朗日乘子矢量。(5-3)定义纯量函数定义纯量函数称称Hx,u,t为哈密尔顿函数
3、。则为哈密尔顿函数。则或或(5-4)(5-5)(5-6)式中式中(5-7)对式对式(5-5)右边第二项作分部积分,得右边第二项作分部积分,得将上式代入式将上式代入式(5-5),得,得(5-8)使使J取极小的必要条件是,对任意的取极小的必要条件是,对任意的u和和x,都有都有J=0成立。成立。设设u(t)和和x(t)相对于最优控制相对于最优控制u*(t)及最优轨线及最优轨线u*(t)的变分为的变分为u和和x,计算由,计算由u和和x引起的引起的J的变分为:的变分为:因此得因此得(5-9)(5-10)(5-11)(5-12)式式(5-9)称为动态系统的伴随方程或协态方程,称为动态系统的伴随方程或协态方
4、程,又称为伴随矢量或协态矢量。又称为伴随矢量或协态矢量。式式(5-10)即系统的状态方程。即系统的状态方程。式式(5-9)与式与式(5-10)联立称为哈密尔顿正则方程。联立称为哈密尔顿正则方程。式式(5-11)称为控制方程,称为控制方程,这个方程是在假设这个方程是在假设u为任意,控制为任意,控制u(t)取值取值不受约束条件下得到的。如果不受约束条件下得到的。如果u(t)为容许控制,为容许控制,受到受到 的约束,的约束,u变分不能任意取值,变分不能任意取值,那么,关系式那么,关系式 不成立,这种情况留待极不成立,这种情况留待极小值原理中讨论。小值原理中讨论。(5-13)(5-14)式式(5-12
5、)称为横截条件。常用于补充边界条件。称为横截条件。常用于补充边界条件。例如,若始端固定,终态自由时,由于例如,若始端固定,终态自由时,由于x(t0)=0,x(tf)任意,则有任意,则有若始端和终端都固定时,若始端和终端都固定时,x(t0)=0,x(tf)=0则以则以作为两个边界条件。作为两个边界条件。(5-16)(5-15)实际上,上述泛函极值的必要条件,亦可实际上,上述泛函极值的必要条件,亦可由式由式(5-6)写出欧拉方程直接导出。写出欧拉方程直接导出。即即 (5-17)应用上述条件求解最优控制的步骤如下:应用上述条件求解最优控制的步骤如下:1)由控制方程由控制方程解出解出2)将将u*代入正
6、则方程解两边边值问题,求代入正则方程解两边边值问题,求x*、*。3)再将再将x*、*代入得代入得为所求。为所求。例例1:有系统如图:有系统如图1所示。欲使系统在所示。欲使系统在2s内从状态内从状态转移到转移到,使性能泛函,使性能泛函,试求,试求u(t)。解:系统状态方程及边界条件为解:系统状态方程及边界条件为由式由式(5-7),得,得由欧拉方程,得由欧拉方程,得5个未知数个未知数x1,x2,1,2,u,由,由5个方程联立求得通解个方程联立求得通解4个积分常数个积分常数C1,C2,C3,C4由由4个边界条件个边界条件解得解得因此,最优解为因此,最优解为最优控制最优控制u*(t)及最优轨线及最优轨
7、线x*(t)如图如图2所示。所示。例例2:设问题同例:设问题同例1。但将终端状态改为。但将终端状态改为(2)=0,(2)自由,即终端条件改成部分约束、部分自自由,即终端条件改成部分约束、部分自由。重求由。重求u*(t)、x*(t)。解解 正则方程及控制方程与例正则方程及控制方程与例1完全相同,只是完全相同,只是边界条件改成边界条件改成 时时 ,时时 ,代入例,代入例1的通解中可确定积分的通解中可确定积分常数:常数:于是得于是得u*(t)和和x*(t)的图像见图的图像见图3。比较上述结果可见,即使是同一个问题,比较上述结果可见,即使是同一个问题,如果终端条件不同,其最优解也不同。如果终端条件不同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 第五 变分法 求解 连续 问题 约束条件 极值 课件
限制150内