变分法在最优控制中的应用课件.ppt
《变分法在最优控制中的应用课件.ppt》由会员分享,可在线阅读,更多相关《变分法在最优控制中的应用课件.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于变分法在最优控制中的应用现在学习的是第1页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(1/10)1/10)3.1 具有等式约束条件下的变分问题具有等式约束条件下的变分问题 q具有等式约束条件下,多个宗量函数的泛函极值问题可表示如下。等等式式约约束束变变分分问问题题 寻找一条连续可微的极值曲线,使性能泛函达到极值,极值曲线 x(t)满足微分方程形式的等式约束 式中,为m维(mn)关于t,x 和的非线性向量函数。现在学习的是第2页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(2/10)2/10)q这里,极值曲线x(t)除满足边界条件和古典变分学中规
2、定的连续可微条件外,还须满足该等式约束条件。由于动态系统的状态方程可归为等式约束,因此该等式约束变分问题是研究最优控制的基础。下面就给出并证明处理等式约束变分问题的等等式式约约束束变变分定理。分定理。现在学习的是第3页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(3/10)3/10)定理定理 4 4q定定理理 4(等式约束变分定理)如果n维向量函数x(t)能使等式约束变分问题取极值,那么,必存在待定的m维拉格朗日乘子向量函数 (t),使泛函达到无条件极值,即极值曲线x(t)是上述泛函所满足的欧拉方程和等式约束条件(47)的解,其中现在学习的是第4页,共47页具有等式约束条
3、件下的变分问题具有等式约束条件下的变分问题(4/10)4/10)q引进拉格朗日乘子可以将泛函的条件极值问题化为一个无条件的极值问题。引入该定理的作用,仅仅是表明泛函J在等式约束条件下的极值曲线x(t),同时使得泛函J和J1达到无条件极值。在后面还要详细讲解具有约束条件下求解极值问题的泛函变分问题。现在学习的是第5页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(5/10)5/10)例例 7 7q上述欧拉方程和约束条件共有n+m个方程,恰好可以解出n+m个未知函数 x(t)和 (t)。通过边界条件确定 x(t)和 (t)中的积分常数。随着终端条件的不同,边界条件也不同。在 2
4、.4节和 2.5节所讨论横截条件就能解决这个问题。q例例 6 火箭在自由空间里的运动作用可用下列微分方程描述式中,u(t)为推力;(t)为角位移。现在学习的是第6页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(6/10)6/10)令x1(t)=(t),x2(t)=(t),可建立状态方程如下试求控制函数 u(t),使系统从初始状态经过 t=2s 转移到状态空间原点,即且使如下性能指标取极小。现在学习的是第7页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(7/10)7/10)q解解 该问题属于终端固定的极值问题。选择向量拉格朗日乘子函数(t)=1(t),
5、2(t),由定理4,利用拉格朗日乘子法可得如下辅助泛函指标式中,式中状态变量x(t)、控制函数u(t)和向量拉格朗日乘子函数(t)都为该泛函的宗量。在一般形式中没有宗量u(t),实际上,我们可以把u(t)和x(t)一样来处理,比如,在本例中可以定义u(t)=x3(t)。现在学习的是第8页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(8/10)8/10)那么,这些泛函的宗量必须满足如下欧拉方程现在学习的是第9页,共47页具有等式约束条件下的变分问题具有等式约束条件下的变分问题(9/10)9/10)联立求解上述欧拉方程,可得现在学习的是第10页,共47页具有等式约束条件下的变
6、分问题具有等式约束条件下的变分问题(10/10)10/10)利用边界条件可解得因此,最优控制函数和状态的最优轨线现在学习的是第11页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(1/12)1/12)3.2 末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题q这一节着重讨论末态不受约束的最优控制问题。所谓末态不受约束,是指末态x(tf)可在Rn空间中取任何值,即目标集为整个状态空间。因此,该问题可描述如下。末态无约束最优控制问题 求一容许控制u(t)U,tt0,tf,在末态时刻tf固定,状态x(tf)无约束,初始状态x(t0)=
7、x0以及被控系统等约束条件下,使如下复合型性能泛函指标达到最小值。现在学习的是第12页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(2/12)2/12)q对该最优控制问题,若将动态系统的状态方程改写成等式约束条件则可根据等等式式约约束束变变分分定定理理(定理4)求解该泛函极值问题,两问题只是边界条件不同而已。引入拉格朗日乘子向量函数(t),将等式约束条件和原有的性能指标泛函结合成一个新的泛函泛函J1的极值问题与原泛函J的极值问题等价。现在学习的是第13页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(3/12)3
8、/12)为方便起见,定义一标量函数如下 该标量函数H称为哈密顿(Hamilton)函数。因此,泛函J1可记为。现在学习的是第14页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(4/12)4/12)q求泛函J1的极值问题,可以直接用欧拉方程(49)来求得极值条件,并且通过边界条件确定由极值条件得到方程解的积分常数,如例 6中,边界条件为系统起点和终点状态。后面将会给出不同情况下的边界条件。当然在确定泛函J1的极值条件时,不是一定要利用欧拉方程(49)来求解,可以根据实际情况进行必要的简化。就泛函J1而言,其宗量有 以及u(t)和(t);前面已经指出,不必
9、对宗量(t)变分,因为对(t)的变分结果就是约束条件(系统状态方程)。现在学习的是第15页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(5/12)5/12)考虑到初始状态(t0,x(t0),末态时刻tf固定以及x(tf)自由,泛函J1对其所有的可变宗量的一阶变分为当选择(t)满足时,可惟一确定拉格朗日乘子函数(t)。于是,泛函J1的一阶变分可变为现在学习的是第16页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(6/12)6/12)根据泛函极值的必要条件 J1=0,考虑到变分u(t)的任意性,由变分学的基本预备定
10、理可得q联立上述方程以及动态系统的状态方程和初始状态条件x(t0)=x0,可解得最优控制函数u*(t)、最优状态轨线x*(t)和适当的拉格朗日乘子函数(t)。上述结果可归纳成如下定理。现在学习的是第17页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(7/12)7/12)定理定理 5 5q定理定理 5(末态无约束最优控制定理)末态无约束最优控制问题的最优控制函数u*(t),最优状态轨线x*(t)和适当选择的拉格朗日乘子函数(t)须满足如下条件:1)规范方程2)边界条件3)极值条件现在学习的是第18页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻
11、固定、末态无约束的最优控制问题(8/12)8/12)q在末态无约束最优控制定理的结论中,由上述微分方程以及边界条件可惟一确定出最优状态轨线x*(t)和适当选择的拉格朗日乘子函数(t)。上述关于x(t)和(t)的微分方程通常被称为规范方程,其中(t)的微分方程又称为协态方程(或共轭方程,伴随方程),相应地,拉格朗日乘子函数(t)又称为协态变量或共轭变量。极值条件H/u=0是一代数方程,由它联立规范方程的解可求得具体的最优控制函数u*(t)和最优状态轨线x*(t)。现在学习的是第19页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(9/12)9/12)q下面
12、讨论哈密顿函数的一个重要性质。哈密顿函数对时间t的全导数为 考虑到规范方程,则有再考虑到极值条件H/u=0,于是哈密顿函数对时间t的全导数可表示为现在学习的是第20页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(10/12)10/12)例例 7 7上式表明,沿最优轨线哈密顿函数H对时间的全导数等于对时间的偏导数。因此,当哈密顿函数H不显含时间变量t时,则有H(t)=常数 tt0,tfq例例 7 已知被控系统为求最优控制u*(t)使如下性能指标泛函取极小。现在学习的是第21页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控
13、制问题(11/12)11/12)q解解 这是一个具有tf 固定,x(tf)自由的终端约束的极值问题。构造哈密顿函数如下,由极值条件H/u=0可解得u=-。将其代入规范方程,可得并满足如下边界条件x(t0)=x0 (tf)=Cx(tf)从而解得现在学习的是第22页,共47页末态时刻固定、末态无约束的最优控制问题末态时刻固定、末态无约束的最优控制问题(12/12)12/12)式中,tf为某一确定的常数。将u*(t)代入哈密顿函数H得其中(t)为常数。现在学习的是第23页,共47页末态时刻和末态固定的问题末态时刻和末态固定的问题(1/5)1/5)3.3 末态时刻和末态固定的问题末态时刻和末态固定的问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变分法 最优 控制 中的 应用 课件
限制150内