2022年最优控制总结归纳 .pdf





《2022年最优控制总结归纳 .pdf》由会员分享,可在线阅读,更多相关《2022年最优控制总结归纳 .pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、C1 1.最优控制问题三个 基本要素 :被控对象 /系统的数学模型 ,物理约束条件及性能指标。数学描述 :设被控对象的状态方程及初始条件为( ) ( ),( ), ,( 0)0 x tf x tu ttx tx;其中 ,( )x tXRn为状态向量,X为状态向量的可容许集;( )u tRm为控制向量,为控制向量的可容许集。试确定容许的最优控制*( )ut和最优状态轨迹*( )xt,使得系统实现从初始状态( 0)x t到目标集 (),0 x tftf的转移 ,同时使得性能指标0 (), ( ), ( ), tftJx tftfL x tu tt dt达到极值。2.分类 :(1) 系统状态方程形式
2、(连续 ,离散 )(2) 最优控制形式 (开环 ,闭环 ) (3)实际应用 (时间 ,燃料 ,能量,终端 ) (4)终端条件 (固定 ,自由) (5)被控对象形式(精确 ,随机 )。3.静态最优化问题由优化变量、目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,使目标函数达到最优值(极大值或极小值 )。数学描述:min( ),:nnx Sf xxRfRR,.( )0,:; ( )0,:nmnlstg xgRRh xh RR静态、动态最优化区别:静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数求
3、极值的问题。动态最优化问题,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解决泛函求极值的问题。C2(静态)1.最优梯度法 (1)多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快 ,又称最速下降法 ;(2)多变量无约束。2.惩罚函数法 (1)根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适的无约束优化方法继续完成求解;(2)多变量有约束 (外点法 :等式约 ,不等式约束 ;内点法 :不等式约束 )。3.拉格朗日乘子法(1)通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一
4、个多变量无约束最优化问题,从而采用合适的无约束方法继续完成求解 ;(2)多变量有约束 (等式约束 ,不等式约束 )。4.最优梯度法计算梯度定义12( )( )( )( )f xxf xf xf xxx, Hessian矩阵22221212222212( )( )ffx xxf xH xxffxxx,最优梯度法 (无约束 ): 迭代(1)()()()()kkkkxxf x,( )()( )()( )( )()()()()()kTkkkTkkf xf xf xH xf x,终止误差( )( )()kp kf x例:( ),( 0),( )f xf xH x;(0)( 0)( 0)f xTf x/(
5、 0)( 0)Tf xHf x;(1)(0)(0)( 0)xxf x;()f xk,( )x k是极小值点。5.拉格朗日乘子法计算有约束最优化:约束为:( )0, ( )0 xxgh(1) 等式约束:( ,)( )( )TH xf xxg,利用1210,0,0,0,0nmHHHHHxxx解出极大值点或极小值点。(2) 不等式约束:( )0 xh,引入附加变量2iv使得不等式约束变为等式约束:2( )0iihxv,再有等式拉格朗日乘子法. 6.惩罚函数法计算(1)外部: 1)等式约束211122( , )( )( )( )( ) ( )mTiiP xf xgxf xgx g x,用/0Px求解出
6、*()x,令求出*x; 2)不等式约束( )0 xh:2112( ,)( )min( ),0 liiP xf xh x3) 复合形式:21122( ,)( )( ) ( )min( ),0TiP xf xxxh xgg(2)内部:只适用于不等式约束,惩罚函数11( ,)( )( )liiP xf xhx,21( , )( )( )liiP xf xhx,1( ,)( )ln( )liiP xf xh x利用0Px求解出*()x,令0求出*xC3(变分法)1.一次变分求解0( ,)() |J xxJ xx,变分规则:1100ttttJdtJdt,dxxdt2.泛函取极值必要条件欧拉方程*(, )
7、(, )0g xx tdg xx tdtxx,横截条件方程*(, )(, )|(, )|0ffTTtftfg xxtg xxtxg xxttxxx问题描述边界条件横截条件ft固定,()fx t固定00*(),*()ffxtxxtx无ft固定,()fx t自由00*()xtx*(, ) |0ftg xx txft自由,()fx t固定00*(),*()ffxtxxtx*(, )(, )|0ffTttg xx tg xx txxft自由,()fx t自由且互相独立00*()xtx*(, )(, )|0,|0ffttg xx tg xx txft自由 ,()fx t自由 ,且通过()()ffx tx
8、00*()xtx,()()ffx tt*(, )(, )| () |0ffTttg xx tg xx txx名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 7 页 - - - - - - - - - 3.欧拉方程特殊结果(1)被积函数只依赖于( )x t:*12()0( )dg xxtctcdtx直线(2)被积函数只依赖于t 和( )x t:*(, )0(, )dg x tg x tcdtxx,先求*x,再积分求*x(3)被积函数只依赖于( )x t和( )x t:*(,
9、)( )(,)Tg xxx tg x xcx(4)常用积分: 1)原点到直线0axbyc的距离为22cab;到平面( 1, 2, 3)1230g xxxaxbxcxd的距离为222dabc;2)曲线长度21x4.角点条件(1) 1t,1( )x t不相关 :1111*(, )(, )(, )(, )| , (, )| (, )|TTttttg xxtg xx tg xxtg xxtg xx tg xx txxxxxx(2) 1t,1( )x t相关11( )( )x tt:1111*(, )(, )(, ) | () |(, ) | () |TTttttg xx tg xxtg xx tg x
10、x txxxx5.有约束泛函极值(1)微分方程约束 :存在( , , )0f x x t约束,引入拉 乘子( )t,拉格朗日函数 :( , , )( , , )( )( , , )TL x x tg x x tt f x x t,变为无约束。(2)等周约束 :存在0( , , )ftiite x x tc约束,引入0( )( , , )titz te x x t,拉格朗日函数为( , , , , )( , , )( ) ( , , )( )TL x xt zg x x tte x x tz t,必要条件为: a)对 L 的欧拉方程b) *( )( , , )iiz te x x tc) *0。
11、6.离散欧拉方程10( )min ( ) ( ),(1), Nkx kJ x kL x kx kk,离散欧拉方程*( ),(1), (1),( ),1)0( )( )L xkxkkL xkxkkx kx k,()x N自由时横截条件为:*(1),(),1)0()L xNxNNx N7.变分法求解最优控制问题目标:0 (),( , , )ftfftJx ttL x u t dt,约束00( , , )( )0, (), (),0fff x u tx tx txx tt,构造哈密顿函数( , , )( , , )( , , )TH x utL x u tf x u t,正则方程:*( , , ),
12、 *Hxf x u tx,控制方程:( , , , )0H x utu(哈密顿函数性质:dHHdtt, 当H中不显含 t,H恒为常数)末端时刻固定时的最优解通式:横截条件()|0fTTfttxtxx末端时刻自由时的最优解通式:横截条件()|0fTTfttxtxx,()0TfffH ttt问题描述边界条件横截条件H 在终端时刻处满足ft固定()fx t固定00*(), *()ffxtxxtx无无()fx t自由00*()xtx*( )*()|fftx ttx()fx t受约束00*(),*()0fxtxxt* *()( )*()|ffTftxtx ttxxft自由()fx t固定00*(), *
13、()ffxtxxtx无()ffH tt()fx t自由00*()xtx*( )*()|fftx ttx()ffH tt()fx t受约束00*(),*()0fxtxxt* *()( )*()|ffTftxtx ttxx()TfffH tttC4(极小值原理)1.极小值原理提出的意义及核心结论意义:变分法求解最优控制问题基于假设(1)容许控制量( )u t和容许状态量( )x t都是没有任何约束的;(2)哈密顿函数H对( )u t是连续可微的 .这在实际系统中往往不能满足。极小值原理有效地克服了经典变分法的局限性,除了可以很好地处理控制向量受约束的情况,还不要求哈密顿函数对控制向量的连续可微性。
14、核心结论 :使泛函J取得极小值的最优控制*( )ut满足的必要条件 :*( ),( ),( ), ( ), ( ),( ), H x t u tt tH x t u tt t,0,fttt,即在区间0,ftt内,对于任意的可容许控制变量( )u t,都有最优控制*( )ut使得哈密顿函数H取得极小值。2.极小值原理问题描述及求解问题描述 :状态方程:00( )( , , ),()x tf x u tx tx,要求在容许控制域中,确定一个分段连续的容许控制*( )ut,使得系统产生满足目标约束集 (),0ffx tt的容许状态轨迹*( )x t,同时使得性能指标0 (),( , , )ftfft
15、Jx ttL x u t dt取得极小值。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 7 页 - - - - - - - - - (1)状态无约束相比变分法的求解,只有控制方程 发生变化。即求解*( )ut使得H取得极小值。(2)状态有约束有l 个约束 ( ), 0g x tt, 定义新的状态变量221111( ) ( ), (). ( ), () ( ), nllnxtgx t tggx t tgfx tt, 其中,()ig是单位海威赛德阶跃函数,定义如下:0, (
16、 ), 0()1, ( ), 0iiigx ttggx tt,则有1( )0nxt,并且当所有的约束条件都满足时1( )0nxt。构造哈密顿函数11TnnHLff, 必要条件: a) b)原正则方程, c) 11nnxf, d) 10n, e) 控制方程,f)边界条件增加101()()0nnfxtxt,其余横截条件由上表决定。3.离散系统极小值原理状态方程0(1) ( ),( ), ,(0)x kf x ku kkxx,终端时刻和终端状态满足约束方程 (),0 x NN,性能指标为10 (), ( ), ( ), NkJx NNL x k u kk。必要条件:哈密顿函数: ( ), ( ),
17、(1), ( ), ( ), (1) ( ), ( ), TH x ku kkkL x k u kkkf x k u kk,正则方程:*( ), (1) ( ), ( ), ( )Hkx kf x ku kkx k,控制有约束:*( ),( ),(1), H xkukkk取极小值,控制无约束:*()|0( )uukHu k;边界条件:*0(0),(),0,*()()()TxxxNNNx Nx N终端状态自由或固定:*0(0),(),0,*()()xxxNNNx N;终端状态受约束增加*()()()TNx Nx N4.连续系统和离散系统极小值原理比较连续系统极小值原理离散系统极小值原理系统( )
18、( ( ),( ), )x tf x tu tt(1) ( ),( ),(0,1,.,1)x kf x ku kkkN初始条件00()x tx0(0)xx性能指标0 (),( , , )ftfftJx ttL x u t dt10 (), ( ), ( ), NkJx NNL x k u k k极值问题求*( )ut,使min J求*( )uk,使min J方法特点引入协态向量( )t引入协态向量序列(1)k哈密顿函数( , , )( , , )THL x u tf x u t ( ), ( ), (1) ( ), ( ), THL x ku kkkf x ku k k正则方程*,xHHx*(
19、1)(1),( )( )x kHkkHx k终端固定边界条件()ffx tx()Nx Nx终端自由横截条件() (),()fffftx ttx t() (),()Nx NNx N终端受约束横截条件 (),0ffx tt,()()()Tffftx tx t (),0 x NN,()()()TNx Nx N极值条件 (控制无约束)0Hu( )0Hu k极值条件 (控制有约束)*( )( ),( ),( ), min( ), ( ),( ), u tH x t u tt tH x tu tt t*( )( ),( ),(1), min( ), ( ),(1), u kH x ku kkkH x ku
20、 kkk5.时间最优控制:性能指标:0fttJdt。定理:如果系统是正常的:*( )sgn( ), ( )TutBxttt。线性定常系统正常的充要条件:1, (1,2)niiiiGbAbAbim都是满秩的。双积分系统:解题步骤。解: 判断正常,1L,12211TTHfBuxu,推出2221,0*sgn1,0u,协态方程:11112122120HxcctcHx当*1u,其相轨迹为:221220101122xxxx,当*1u,其相轨迹为:221220101122xxxx,根据 终端状态 ,可以通过上述的两个相轨迹得出切换曲线:,。根据 初始状态 可以得到初始相轨迹,两个方程联立,即可得到切换时间。
21、6.燃料最优:性能指标:01,(0)ftmiiiitJc udtc。*T*1,( )0,( )( )1,( )0,1,( ) 1,0,( )iiTiiiTiiTiiTiit bcct bcu tt bct bct bc,当*( )( )iiiit bcort bc为奇异状态。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 7 页 - - - - - - - - - 7 时间 -燃料最优,性能指标:01ftmiitJudt,0为时间加权系数。8.能量最优 : 性能指标:02
22、1,(0)ftmiiiitJrudtr。*T*1,( )2( )0, 2( )21,( )2iiTiiiTiit brutrt brt br。C5(动态规划)1.最优性原理一个多级决策过程的最优决策具有这样的性质:当把其中任何一级及其状态作为初始级和初始状态时,不管初始状态是什么,以及达到这个初始状态的决策是什么,余下的决策对此初始状态必定依然构成最优决策。2.动态规划基本思想动态规划是一种始于末端,终于始端、逆向递推的方法。3.离散动态规划递推方程*( )1 ( )min ( ), ( ) (1)(0,11)Nku kN kJx kL x k u kJx kkN4.动态规划求解线性离散二次型
23、最优控制问题动态规划证明充分性离散线性二次型最优控制问题,就是针对线性离散系统,设计容许的最优控制序列,使得某一离散二次型性能指标达到最优。问题描述:(1)( ) ( )( ) ( )x kk x kk u k,(0,11)kN,10()()( )( ) ( )( )( ) ( )NTTTNkJxN Q x Nxk Q k x kuk R k u k达到极小值结论:迭代: (1) ()NS NQ(2)0( )00min, (), ( ),( ), ftu tfftJ xtx ttL x tu tt dt,00.( ) ( ),( ), ,()stx tf x tu ttx tx(3) ()(
24、)( )( )( )( )( )( )(1)( )( )( )TTS kQ kk R kkkkkS kkkk(4)*( )( ) ( ), ( )( )( ) ( )TNkukk x kJx kxk S k x k证明:首先给出动态规划的基本递推方程边界条件为 当 k=N-1 时,有 则在第Nk级基础上逆向递推一级可得:*1(1)(1) (1)min(1) (1) (1)(1) (1) (1) ( )min(1) (1) (1)(1) (1) (1)( ) ( ) ( )TTNku kNkTTTu kJx kxkQ kx kukR ku kJx kxkQ kx kukR ku kxk S k
25、x k。将离散方程带入可得:*1(1) (1)min(1)(1)(1) ( )(1) (1)(1)(1)(1) ( ) (1) (1)2(1)(1) ( )(1) (1)TTTNku kTTTJx kxkQ kkS kkx kukR kkS kku kxkkS kku k。由于对(1)u k无约束可得:*1 (1)0(1)NkJx ku k,进而可得:*1(1)(1)(1) ( ) (1)(1) ( )(1) (1)(1) (1)TTukR kkS kkkS kkx kkx k其中:1(1)(1)(1) ( ) (1)(1) ( )(1)TTkR kkS kkkS kk,将其带入*1 (1)N
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年最优控制总结归纳 2022 最优 控制 总结 归纳

限制150内