书签分享收藏举报版权申诉 / 7

立即下载

当前位置：首页 > 技术资料 > 技术总结 > 2022年最优控制总结归纳 .pdf

2022年最优控制总结归纳 .pdf

上传人：H****o

文档编号：33377733

上传时间：2022-08-10

格式：PDF

页数：7

大小：363.11KB

( 4.5 )

《2022年最优控制总结归纳 .pdf》由会员分享，可在线阅读，更多相关《2022年最优控制总结归纳 .pdf（7页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、C1 1.最优控制问题三个基本要素：被控对象 /系统的数学模型 ,物理约束条件及性能指标。数学描述 :设被控对象的状态方程及初始条件为( ) ( ),( ), ,( 0)0 x tf x tu ttx tx；其中 ,( )x tXRn为状态向量，X为状态向量的可容许集；( )u tRm为控制向量，为控制向量的可容许集。试确定容许的最优控制*( )ut和最优状态轨迹*( )xt，使得系统实现从初始状态( 0)x t到目标集 (),0 x tftf的转移 ,同时使得性能指标0 (), ( ), ( ), tftJx tftfL x tu tt dt达到极值。2.分类 :(1) 系统状态方程形式

2、(连续 ,离散 )(2) 最优控制形式 (开环 ,闭环 ) (3)实际应用 (时间 ,燃料 ,能量,终端 ) (4)终端条件 (固定 ,自由) (5)被控对象形式(精确 ,随机 )。3.静态最优化问题由优化变量、目标函数及约束条件组成的静态优化问题可以描述为：在满足一系列约束条件的可行域中，确定一组优化变量，使目标函数达到最优值(极大值或极小值 )。数学描述：min( ),:nnx Sf xxRfRR，.( )0,:; ( )0,:nmnlstg xgRRh xh RR静态、动态最优化区别：静态最优化问题，也称为参数最优化问题，它的三个基本要素是优化变量、目标函数和约束条件，其本质是解决函数求

3、极值的问题。动态最优化问题，也称为最优控制问题，它的三个基本要素是被控对象数学模型、物理约束条件和性能指标，其本质是解决泛函求极值的问题。C2（静态）1.最优梯度法 (1)多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快 ,又称最速下降法 ;(2)多变量无约束。2.惩罚函数法 (1)根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适的无约束优化方法继续完成求解;(2)多变量有约束 (外点法 :等式约 ,不等式约束 ;内点法 :不等式约束 )。3.拉格朗日乘子法(1)通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一

4、个多变量无约束最优化问题,从而采用合适的无约束方法继续完成求解 ;(2)多变量有约束 (等式约束 ,不等式约束 )。4.最优梯度法计算梯度定义12( )( )( )( )f xxf xf xf xxx， Hessian矩阵22221212222212( )( )ffx xxf xH xxffxxx,最优梯度法 (无约束 )：迭代(1)()()()()kkkkxxf x，( )()( )()( )( )()()()()()kTkkkTkkf xf xf xH xf x，终止误差( )( )()kp kf x例：( ),( 0),( )f xf xH x；(0)( 0)( 0)f xTf x/(

5、 0)( 0)Tf xHf x；(1)(0)(0)( 0)xxf x；()f xk，( )x k是极小值点。5.拉格朗日乘子法计算有约束最优化：约束为：( )0, ( )0 xxgh(1) 等式约束：( ,)( )( )TH xf xxg，利用1210,0,0,0,0nmHHHHHxxx解出极大值点或极小值点。(2) 不等式约束：( )0 xh，引入附加变量2iv使得不等式约束变为等式约束：2( )0iihxv，再有等式拉格朗日乘子法. 6.惩罚函数法计算(1)外部： 1)等式约束211122( , )( )( )( )( ) ( )mTiiP xf xgxf xgx g x,用/0Px求解出

6、*()x,令求出*x; 2)不等式约束( )0 xh：2112( ,)( )min( ),0 liiP xf xh x3) 复合形式：21122( ,)( )( ) ( )min( ),0TiP xf xxxh xgg(2)内部：只适用于不等式约束，惩罚函数11( ,)( )( )liiP xf xhx，21( , )( )( )liiP xf xhx，1( ,)( )ln( )liiP xf xh x利用0Px求解出*()x，令0求出*xC3（变分法）1.一次变分求解0( ,)() |J xxJ xx，变分规则：1100ttttJdtJdt，dxxdt2.泛函取极值必要条件欧拉方程*(, )

7、(, )0g xx tdg xx tdtxx,横截条件方程*(, )(, )|(, )|0ffTTtftfg xxtg xxtxg xxttxxx问题描述边界条件横截条件ft固定，()fx t固定00*(),*()ffxtxxtx无ft固定，()fx t自由00*()xtx*(, ) |0ftg xx txft自由，()fx t固定00*(),*()ffxtxxtx*(, )(, )|0ffTttg xx tg xx txxft自由，()fx t自由且互相独立00*()xtx*(, )(, )|0,|0ffttg xx tg xx txft自由 ,()fx t自由 ,且通过()()ffx tx

8、00*()xtx，()()ffx tt*(, )(, )| () |0ffTttg xx tg xx txx名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页，共 7 页 - - - - - - - - - 3.欧拉方程特殊结果(1)被积函数只依赖于( )x t：*12()0( )dg xxtctcdtx直线(2)被积函数只依赖于t 和( )x t：*(, )0(, )dg x tg x tcdtxx，先求*x，再积分求*x(3)被积函数只依赖于( )x t和( )x t：*(,

9、)( )(,)Tg xxx tg x xcx(4)常用积分： 1)原点到直线0axbyc的距离为22cab；到平面( 1, 2, 3)1230g xxxaxbxcxd的距离为222dabc；2)曲线长度21x4.角点条件(1) 1t,1( )x t不相关 :1111*(, )(, )(, )(, )| , (, )| (, )|TTttttg xxtg xx tg xxtg xxtg xx tg xx txxxxxx(2) 1t,1( )x t相关11( )( )x tt:1111*(, )(, )(, ) | () |(, ) | () |TTttttg xx tg xxtg xx tg x

10、x txxxx5.有约束泛函极值(1)微分方程约束 :存在( , , )0f x x t约束，引入拉乘子( )t,拉格朗日函数 :( , , )( , , )( )( , , )TL x x tg x x tt f x x t，变为无约束。(2)等周约束 :存在0( , , )ftiite x x tc约束，引入0( )( , , )titz te x x t，拉格朗日函数为( , , , , )( , , )( ) ( , , )( )TL x xt zg x x tte x x tz t，必要条件为： a)对 L 的欧拉方程b) *( )( , , )iiz te x x tc) *0。

11、6.离散欧拉方程10( )min ( ) ( ),(1), Nkx kJ x kL x kx kk，离散欧拉方程*( ),(1), (1),( ),1)0( )( )L xkxkkL xkxkkx kx k，()x N自由时横截条件为：*(1),(),1)0()L xNxNNx N7.变分法求解最优控制问题目标：0 (),( , , )ftfftJx ttL x u t dt，约束00( , , )( )0, (), (),0fff x u tx tx txx tt，构造哈密顿函数( , , )( , , )( , , )TH x utL x u tf x u t，正则方程：*( , , ),

12、 *Hxf x u tx，控制方程：( , , , )0H x utu（哈密顿函数性质:dHHdtt, 当H中不显含 t，H恒为常数）末端时刻固定时的最优解通式：横截条件()|0fTTfttxtxx末端时刻自由时的最优解通式：横截条件()|0fTTfttxtxx，()0TfffH ttt问题描述边界条件横截条件H 在终端时刻处满足ft固定()fx t固定00*(), *()ffxtxxtx无无()fx t自由00*()xtx*( )*()|fftx ttx()fx t受约束00*(),*()0fxtxxt* *()( )*()|ffTftxtx ttxxft自由()fx t固定00*(), *

13、()ffxtxxtx无()ffH tt()fx t自由00*()xtx*( )*()|fftx ttx()ffH tt()fx t受约束00*(),*()0fxtxxt* *()( )*()|ffTftxtx ttxx()TfffH tttC4（极小值原理）1.极小值原理提出的意义及核心结论意义：变分法求解最优控制问题基于假设(1)容许控制量( )u t和容许状态量( )x t都是没有任何约束的;(2)哈密顿函数H对( )u t是连续可微的 .这在实际系统中往往不能满足。极小值原理有效地克服了经典变分法的局限性，除了可以很好地处理控制向量受约束的情况,还不要求哈密顿函数对控制向量的连续可微性。

14、核心结论 :使泛函J取得极小值的最优控制*( )ut满足的必要条件 :*( ),( ),( ), ( ), ( ),( ), H x t u tt tH x t u tt t，0,fttt，即在区间0,ftt内，对于任意的可容许控制变量( )u t，都有最优控制*( )ut使得哈密顿函数H取得极小值。2.极小值原理问题描述及求解问题描述 :状态方程：00( )( , , ),()x tf x u tx tx，要求在容许控制域中，确定一个分段连续的容许控制*( )ut，使得系统产生满足目标约束集 (),0ffx tt的容许状态轨迹*( )x t，同时使得性能指标0 (),( , , )ftfft

15、Jx ttL x u t dt取得极小值。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页，共 7 页 - - - - - - - - - (1)状态无约束相比变分法的求解，只有控制方程发生变化。即求解*( )ut使得H取得极小值。(2)状态有约束有l 个约束 ( ), 0g x tt，定义新的状态变量221111( ) ( ), (). ( ), () ( ), nllnxtgx t tggx t tgfx tt，其中，()ig是单位海威赛德阶跃函数，定义如下：0, (

16、 ), 0()1, ( ), 0iiigx ttggx tt，则有1( )0nxt，并且当所有的约束条件都满足时1( )0nxt。构造哈密顿函数11TnnHLff，必要条件： a) b)原正则方程， c) 11nnxf， d) 10n， e) 控制方程，f)边界条件增加101()()0nnfxtxt，其余横截条件由上表决定。3.离散系统极小值原理状态方程0(1) ( ),( ), ,(0)x kf x ku kkxx，终端时刻和终端状态满足约束方程 (),0 x NN，性能指标为10 (), ( ), ( ), NkJx NNL x k u kk。必要条件：哈密顿函数： ( ), ( ),

17、(1), ( ), ( ), (1) ( ), ( ), TH x ku kkkL x k u kkkf x k u kk，正则方程：*( ), (1) ( ), ( ), ( )Hkx kf x ku kkx k，控制有约束：*( ),( ),(1), H xkukkk取极小值，控制无约束：*()|0( )uukHu k；边界条件：*0(0),(),0,*()()()TxxxNNNx Nx N终端状态自由或固定：*0(0),(),0,*()()xxxNNNx N；终端状态受约束增加*()()()TNx Nx N4.连续系统和离散系统极小值原理比较连续系统极小值原理离散系统极小值原理系统( )

18、( ( ),( ), )x tf x tu tt(1) ( ),( ),(0,1,.,1)x kf x ku kkkN初始条件00()x tx0(0)xx性能指标0 (),( , , )ftfftJx ttL x u t dt10 (), ( ), ( ), NkJx NNL x k u k k极值问题求*( )ut，使min J求*( )uk，使min J方法特点引入协态向量( )t引入协态向量序列(1)k哈密顿函数( , , )( , , )THL x u tf x u t ( ), ( ), (1) ( ), ( ), THL x ku kkkf x ku k k正则方程*,xHHx*(

19、1)(1),( )( )x kHkkHx k终端固定边界条件()ffx tx()Nx Nx终端自由横截条件() (),()fffftx ttx t() (),()Nx NNx N终端受约束横截条件 (),0ffx tt,()()()Tffftx tx t (),0 x NN,()()()TNx Nx N极值条件 (控制无约束）0Hu( )0Hu k极值条件 (控制有约束）*( )( ),( ),( ), min( ), ( ),( ), u tH x t u tt tH x tu tt t*( )( ),( ),(1), min( ), ( ),(1), u kH x ku kkkH x ku

20、 kkk5.时间最优控制：性能指标：0fttJdt。定理：如果系统是正常的：*( )sgn( ), ( )TutBxttt。线性定常系统正常的充要条件：1, (1,2)niiiiGbAbAbim都是满秩的。双积分系统：解题步骤。解：判断正常，1L，12211TTHfBuxu，推出2221,0*sgn1,0u，协态方程：11112122120HxcctcHx当*1u，其相轨迹为：221220101122xxxx，当*1u，其相轨迹为：221220101122xxxx，根据终端状态，可以通过上述的两个相轨迹得出切换曲线：,。根据初始状态可以得到初始相轨迹，两个方程联立，即可得到切换时间。

21、6.燃料最优：性能指标：01,(0)ftmiiiitJc udtc。*T*1,( )0,( )( )1,( )0,1,( ) 1,0,( )iiTiiiTiiTiiTiit bcct bcu tt bct bct bc，当*( )( )iiiit bcort bc为奇异状态。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页，共 7 页 - - - - - - - - - 7 时间 -燃料最优，性能指标：01ftmiitJudt，0为时间加权系数。8.能量最优 : 性能指标：02

22、1,(0)ftmiiiitJrudtr。*T*1,( )2( )0, 2( )21,( )2iiTiiiTiit brutrt brt br。C5（动态规划）1.最优性原理一个多级决策过程的最优决策具有这样的性质：当把其中任何一级及其状态作为初始级和初始状态时，不管初始状态是什么，以及达到这个初始状态的决策是什么，余下的决策对此初始状态必定依然构成最优决策。2.动态规划基本思想动态规划是一种始于末端，终于始端、逆向递推的方法。3.离散动态规划递推方程*( )1 ( )min ( ), ( ) (1)(0,11)Nku kN kJx kL x k u kJx kkN4.动态规划求解线性离散二次型

23、最优控制问题动态规划证明充分性离散线性二次型最优控制问题，就是针对线性离散系统，设计容许的最优控制序列，使得某一离散二次型性能指标达到最优。问题描述：(1)( ) ( )( ) ( )x kk x kk u k,(0,11)kN，10()()( )( ) ( )( )( ) ( )NTTTNkJxN Q x Nxk Q k x kuk R k u k达到极小值结论：迭代： (1) ()NS NQ(2)0( )00min, (), ( ),( ), ftu tfftJ xtx ttL x tu tt dt，00.( ) ( ),( ), ,()stx tf x tu ttx tx(3) ()(

24、)( )( )( )( )( )( )(1)( )( )( )TTS kQ kk R kkkkkS kkkk(4)*( )( ) ( ), ( )( )( ) ( )TNkukk x kJx kxk S k x k证明：首先给出动态规划的基本递推方程边界条件为当 k=N-1 时，有则在第Nk级基础上逆向递推一级可得：*1(1)(1) (1)min(1) (1) (1)(1) (1) (1) ( )min(1) (1) (1)(1) (1) (1)( ) ( ) ( )TTNku kNkTTTu kJx kxkQ kx kukR ku kJx kxkQ kx kukR ku kxk S k

25、x k。将离散方程带入可得：*1(1) (1)min(1)(1)(1) ( )(1) (1)(1)(1)(1) ( ) (1) (1)2(1)(1) ( )(1) (1)TTTNku kTTTJx kxkQ kkS kkx kukR kkS kku kxkkS kku k。由于对(1)u k无约束可得：*1 (1)0(1)NkJx ku k，进而可得：*1(1)(1)(1) ( ) (1)(1) ( )(1) (1)(1) (1)TTukR kkS kkkS kkx kkx k其中：1(1)(1)(1) ( ) (1)(1) ( )(1)TTkR kkS kkkS kk，将其带入*1 (1)N

26、kJx k中可得*1 (1)(1)(1)(1) (1)(1)(1)(1) (1)( )(1)(1)(1) (1)TTTNkJx kxkQ kkR kkkkkS kkkkx k(1) (1) (1)TxkS kx k其中：(1)(1)(1) (1)(1)(1)(1) (1)( )(1)(1)(1)TTS kQ kkR kkkkkS kkkk由(1)k定义可进一步化简(1)S k为：(1)(1)(1) ( )(1)(1)(1)TS kQ kkS kkkk同时由边界条件知：*0 ()()()() () ()TTNJx NxN Q x NxN S N x N，可知方程的边界条件为()NS NQ说明：

27、(1)当系统定常时，即( ),( ),( ),( )kkQ kR k为定常矩阵时，若矩阵对, 可稳，则当N时， S 满足方程1TTTSQSSRSS且0S，该方程为离散形式的代数Riccati 方程。(2)对标量情况的迭代，有( )(1)( )( )( )( )(1) ( )k S kkkR kk S kk，当对末端状态()x N的加权足够大时，即()NS NQ足够大时，或对控制的加权足够小，即R 很小时，有(1) ()(1)(1)(1)(1) ()(1)(1)NS NNNNNS NNN，进而有()(1)(1)(1) (1)0 x NNNNx N5.连续系统动态规划（充分条件）问题描述：0( )

28、00min, (), ( ), ( ), ftu tfftJ x tx ttL x tu tt dt，00.( ) ( ), ( ), ,()stx tf x tu ttx txHJB 方程：*( ) ( ), min ( ), ( ), u tJx ttJH x t u tttx，边界条件：* (), (),ffffJx ttx tt。哈密顿函数定义：* ( ), ( ), () ( ), ( ), TJHL x t u ttf x t u ttx，如果( )u t无约束 :*|0uuHu说明：对于线性二次型问题是充要条件，可假设* ( ), 0.5( )( ) ( )TJx ttxt P

29、t x t，代入HJB。特别的，对于无限时间线性二次型问题，*J不显含时间 t，故*/0Jt。6.利用 HJB 推导 Riccati 问题描述：0( )11min()()( )( ) ( )( ) ( ) ( )22ftTTTu tfftJxtSx txt Q t x tut R t u t dt，00.( )( ) ( )( ) ( ),()stx tA t x tB t u tx tx。证明：取该问题的哈密顿函数如下*1( ( ), ( ), )( )( ) ( )( ) ( ) ( )() ( ) ( )( ) ( )2TTTJJH x t u ttxt Q t x tut R t u

30、tA t x tB t u txx，则有 HJB 方程如下：*( ( ),*( ), )JJH x tutttx，根据*( ) ( ), *( ), min( ( ), ( ), )u tJJH x tuttH x tu ttxx，以及控制u 无约束可得* ( ), ( ), ( ) ( )( )0TJJH x t u ttR t u tBtuxx，名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页，共 7 页 - - - - - - - - - 故最优控制为*1*( ), (

31、)( )TJJux ttRt Btxx。另外，由2*2 ( ), ( ), ( )0JH x tu ttR txu，不难断定，该最优控制使二次型性能指标取极小值。假设*J满足如下二次型形式：* ( ), 0.5( )( ) ( )TJx ttxt P t x t，其中( )P t为待定的正定对称矩阵。则有*1( ) ( ),( )( ) ( )( )2TJJP t x txt P t x tx tt，以及最优控制1*( ), ( )( )( ) ( )Tux ttRt Bt P t x t。代入 HJB 方程，整理可得11110( )( ) ( )( )( ) ( )( )( ) ( ) (

32、)( )( ) ( )( ) ( )( ) ( )222TTTTTxt P t x txt P t B t Rt Bt P t x txt Q t x txt P t A t x t11( )( )( )( )( )( )( )( )( )( )( )( )2TTTxP tQ tP t A tAt P tP t B t Rt Bt P tx t上式对于任意( )x t均成立，故必有矩阵( )P t满足方程1( )( )( ) ( )( ) ( )( ) ( )( )( ) ( )0TTP tQ tP t A tAt P tP t B t Rt Bt P t另外，由性能指标可知*11 (),()

33、 () ()()()22TTfffffffJx ttxtP tx txtSx t，故矩阵( )P t满足的边界条件为()fP tSC6（线性二次型状态最优）1.二次型最优控制问题统一描述、性能指标组成考虑线性时变连续系统00( )( ) ( )( ) ( ),( )( ) ( ), ()x tA t x tB t u ty tC t x tx tx，其中，状态向量( )nx tR，控制向量( )mu tR且无约束，输出向量( )ly tR，( ),( ),( )A tB tC t为维数适当的时变矩阵，在特殊情况下可以使常数矩阵，0lmn。同时考虑下式定义的二次型性能指标011()( ) ()(

34、 )( ) ( )( ) ( ) ( )22ftTTTfffeutJetF t e te t Q t e tut R t u t dtJJJ，0TFF，( )( )0TQ tQ t，( )( )0TR tR t，0,ftt固定。000.5()( ) (),0.5( )( ) ( ),0.5( )( ) ( )ffttTTTfffeuttJetF t e tJet Q t e tdt Jut R t u tdt，( )( )( )de tyty t。控制目标：确定最优控制*()ut，使 J达到极小。2.二次型状态最优调节器问题描述二次型最优控制问题：0( )11min()( ) ()( )( )

35、 ( )( ) ( ) ( )22ftTTTu tfftJxtF t x txt Q t x tut R t u t dt，00.( )( ) ( )( ) ( ), ()s tx tA t x tB t u tx tx。3.微分、代数、逆Riccati 方程微分 Riccati：1( )( )( ) ( )( )( )( )( )( )( )( ),()TTfP tQ tP t A tAt P tP t B t Rt Bt P tP tF，适用于终端状态自由的有限时间连续时变状态调节器，和无限时间时变状态调节器。微分逆 Riccati ：1111111( )( )( )( )( )( )(

36、)( )( )( )( ),()0TTfPtPt Q t PtA t PtPt AtB t Rt BtPt，适用于终端状态固定的有限时间连续时变状态调节器。代数 Riccati：10TTQPAA PPBRB P，适用于无限时间定常状态调节器。差分 Riccati：1()TTTTPQA PAA PB RB PBB PA，适用于离散状态调节器4.微分 Riccati 方程解 P(t)的性质(1) ( )P t是唯一的。 (2) ( )P t是对称的，即( )( )TP tPt。(3) ( )P t是非负的，即0( )0,fP tttt。5.存在唯一最优控制的两个条件(1) ,A B完全可控或至少是

37、可稳的。为了保证最优控制的存在性。即保证性能指标的积分为有限值，要求( )0,( )0 x tu t,若系统完全可控，则可通过状态反馈实现任意的极点配置，使得系统渐进稳定；若系统可稳，其不可控状态也是渐进稳定的。(2) 0,0QR或0,0QR，,A D完全可观或至少是可检的，其中D 为满足TDDQ的任意矩阵。为了保证最优反馈闭环调节系统的渐近稳定性。6.有限时间，终端状态自由，连续，时变，状态调节器最优控制为：1*( )( )( )( ) ( )TutRt Bt P t x t，其中( )P t满足 Riccati 微分方程：1( )( )( )( )( ) ( )( ) ( )( )( )

38、 ( ),()TTfP tQ tP t A tAt P tP t B t Rt Bt P tP tF，最优性能指标：*0000.5()TJxP tx。7.有限时间状态调节器一般形式0( )( )( )( )11()()( )( )( )( )22fTtTffTtx tQ tS tx tJxtFx tdtu tStR tu t，00.( )( ) ( )( ) ( ), ()stx tA t x tB t u tx tx过程：对被积函数的二次型进行配方得到：( )( )( )( )( )( )( )( )TTx tQ tS tx tu tStR tu t11( )( )( )( )( )( )(

39、 )( )( )( )( )( )TTTTTTTTTTTx Q t xu R t ux S t uu St xx S t Rt St xx S t Rt St xx Q t xu R t u其中：11( )( )( )( )( ),( )( )TTQ tQ tS t Rt St uuRt St x，这样系统化为：1( )( )( )( )( ) ( )( ) ( )( ) ( )( ) ( )Tx tA tB t Rt St x tB t u tA t x xB t u t性能指标为011()( ) ()( )( ) ( )( )( ) ( )22ftTTTfftJxtF t x txt Q

40、t x tut R t u t dt，进而得到最优控制为：*1( )( )( )( ) ( )TutRt Bt P t x t结论：进而得到原系统的最优控制为：*1( )( )( )( )( ) ( )TTutRtBt P tStx t，其中( )P t满足新的黎卡提方程：11111( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )TTTTTTTP tQ tP t A tAt P tP t B t Rt Bt P tQ tP t A tAt P tP t

41、 B t Rt Bt P tS t Rt Bt P tP t B t Rt StS t Rt St边界条件依然为：名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页，共 7 页 - - - - - - - - - ()fP tF。8.有限时间，终端状态固定，连续，时变，状态调节器（以()0fx t为例）( )P t满足微分逆 Riccati 方程：1111111( )( )( )( )( )( )( )( )( )( )( ),()0TTfPtPt Q t PtA t PtPt

42、 AtB t Rt BtPt。9.无限时间，连续，时变，状态调节器0( )1min( )( ) ( )( )( ) ( )2TTu ttJxt Q t x tut R t u t dt，00.( )( ) ( )( ) ( ), ()stx tA t x tB t u tx tx若,A B完全可控。( )P t满足微分 R方程1( )( )( ) ( )( ) ( )( )( )( )( )( ),()0TTfP tQ tP t A tAt P tP t B t Rt Bt P tP t，( )lim( )tfP tP t，则1*( )( )( )( ) ( )TutRt Bt P t x t

43、，最优指标：*000.5( 0)TJxP tx10.无限时间，连续，定常，状态调节器0( )1min( )( )( )( )2TTu ttJxt Qx tut Ru t dt，00.( )( )( ),()s tx tAx tBu tx tx，条件： (1), A B完全可控或至少可稳，(2),A D完全可观或至少可检，TDDQ。则存在唯一的最优控制：1*( )( )TutRB Px t，满足代数 Riccati 方程：10TTQPAA PPBRB P，最优指标：*000.5TJxPx。11.具有给定稳定裕度a，无限时间状态调节器闭环调节系统的特征值实部小于-a02( )1min( )( )

44、( )( )2tTTu ttJext Qx tut Ru t dt，00.( )( )( ), ()stx tAx tBu tx tx，条件： (1),A B完全可控(2),A D完全可观，满足代数黎卡提方程：1()()0TTQP AIAI PPBRB P，最优控制1*()( )TutRB Px t，性能指标：*000.5TJxPx。12.无限时间，离散，定常，状态调节器()01min( )( )( )( )2TTu kkJxk Qx kuk Ru k，0.(1)( )( ),(0)stx kAx kBu kxx，满足条件：(1) ,A B完全可控或至少可稳， (2),A D完全可观或至少可

45、检。最优控制序列为：1*()()( )TTukRB PBB PAx k，满足差分黎卡提方程：1()TTTTPQA PAA PB RB PBB PA，最优性能指标：*000.5TJxPx13.定理 6.1 证明 -有限时间连续时变系统状态调节器定理1( )( )( )( )( )( )( )( )( )( )( ),()TTfP tQ tP t A tAt P tP t B t Rt Bt P tP tF，1*( )( )( )( ) ( )TutRt Bt P t x t证明：充分性：1*( )( )( )( ) ( )TutRt Bt P t x t，*11() ()22TTTJHx Q

46、xu QuAxBux。则：*10TTHJJRuBuR BuxxHJB 方程：*()JH ut。令1*( )2TJx P t x，*1( ) ,( )2TJJP t xx P t xxt，代入 HJB 方程：111111( )222TTTTTTTx P t xx Qxx PBR RR B Pxx PAxx PBR B Px整理得：11( )02TTTxP tQPBR B PPAA P x。推出：1( )0TTP tQPBR B PPAA P，是黎卡提方程。*1( )TuR B P t x通过动态规划求得最优控制。边界条件：11*(),()() ()()()()22TTffffffffJx ttx

47、tP tx txtFx tP tF。充分性得证。必要性：构造哈密顿函数，11()22TTTHx Qxu QuAxBu，*10TTHRuBuR Bu，正则方程：,THxAxBuQxAx，边界条件：()()()ffftFx tx t，假设( )( ) ( )tP t x t，则有：1( )()()TTTtP xPAxPBuPPAPBR B P xQxAQA P x，推出：1TTPPAPBR B PQA P推出黎卡提方程，并且边界条件：()fP tF。必要性得证。14.定理 6.4 渐近稳定性证明无限时间定常系统状态调节器-大范围渐进稳定性证明选取 Lyapunov 函数：1( )2TV xx P

48、x，则11111111()()(2)()02222TTTTTTTTTTVxAPBR BPxx P ABR B P xxA PPAPBR B P xxQPBR B P x，是 Lyapunov 稳定。假设( )0,0V xx，则必有：10,0TTTx Qxx PBRB Px，进而有：*0TuRu，由于0R，故*0u，因此系统的零输入响应为：0( )Atx tex，将其代入到式0Tx Qx中得到：000000,0TTA tTAtTAtx eDD e xD e xx，而这与,A D可观的假设是矛盾的。故假设( )0,0V xx不成立，即有：( )0,0V xx，因此系统是大范围渐进稳定的。15.给定

49、稳定度证明证明：定义新的状态变量和控制变量，令?,ttxex ue u。则01?()2TTJx Qxu Rudt。?()()tttttttxe xexe xeAxBuIA e xe Beu，利用二次型相应的定理可得：1?*TuR B Px，这里P满足：1()()0TTIAPPIAQPBRB P，解得 P，可得1?*( )*tTuteuR B Px。得证。16.对有限时间离散二次型状态调节器证明用极小值原理证明必要性名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页，共 7 页

50、- - - - - - - - - 问题描述：1()011min()()( )( ) ( )( ) ( ) ( )22NTTTu kNkJxN Q x Nxk Q k x kuk R k u k0.(1)( ) ( )( ) ( ), (0)s tx kA k x kB k u kxx必要性证明：构造哈密顿函数1 ( ), ( ), (1), ( )( ) ( )( ) ( ) ( )(1) ( ) ( )(1) ( ) ( )2TTTTH x lu kkkxk Q k x kuk R k u kkA k x kkB k u k由于( )u k无约束，最优控制方程可写为：0( ) ( )( )

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

4.3 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 2022年最优控制总结归纳 2022 最优控制总结归纳

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：2022年最优控制总结归纳 .pdf
链接地址：https://www.taowenge.com/p-33377733.html