最优控制与状态估计精.ppt
最优控制与状态估计第1页,本讲稿共19页二、二、有限时间状态调节器有限时间状态调节器(tf 有限)线性时变系统的状态方程为线性时变系统的状态方程为(87)(88)(89)寻找一个最优控制寻找一个最优控制 ,使使为极小。为极小。其中,其中,x 为为n 维状态向量;维状态向量;u 为为r 维控制向量,且维控制向量,且u 不受限制。不受限制。其中,其中,F为为 对称半正定常数阵;对称半正定常数阵;为为 对称对称半正定时变阵。半正定时变阵。为为 对称正定时变阵。对称正定时变阵。第2页,本讲稿共19页求解这个最优控制问题,可以用极小值原理,也可以用动态规划法。这里用求解这个最优控制问题,可以用极小值原理,也可以用动态规划法。这里用极小值原理来求解。极小值原理来求解。1)哈密顿函数为)哈密顿函数为(90)2)伴随方程为)伴随方程为(91)(92)3)控制方程为)控制方程为(93)故故J 取极小值取极小值第3页,本讲稿共19页4)将)将 代入状态方程得代入状态方程得(94)初始状态为初始状态为(95)设设(96)其中,其中,为待定的为待定的 时变阵时变阵 (97)(96)式对)式对t 求导,并且将(求导,并且将(94)式代入)式代入第4页,本讲稿共19页(91)式可改写成)式可改写成(98)比较(比较(97)和()和(98),可以得到),可以得到(99)(100)(99)式称为)式称为Riccati微分方程。其边界条件为微分方程。其边界条件为得到得到(101)第5页,本讲稿共19页状态反馈的闭环方程为状态反馈的闭环方程为(102)其中其中(103)两点说明:两点说明:1)由于矩阵黎卡提微分方程的解为对称)由于矩阵黎卡提微分方程的解为对称因此有因此有 个独立的非线性标量微分方程。个独立的非线性标量微分方程。2)最优性能指标为)最优性能指标为(104)第6页,本讲稿共19页例例 6 系统状态方程为系统状态方程为求最优控制求最优控制 ,使性能指标,使性能指标取极小值。取极小值。解解 矩阵的黎卡提方程为矩阵的黎卡提方程为求解上面的微分方程,有求解上面的微分方程,有第7页,本讲稿共19页其中其中即即最优控制为最优控制为由由最优轨线为最优轨线为第8页,本讲稿共19页三、三、无限时间状态调节器无限时间状态调节器(tf )线性时变系统线性时变系统寻找一个最优控制寻找一个最优控制 ,使,使J 取极小值取极小值(105)这里产生一个问题:这里产生一个问题:时,性能指标是否收敛?时,性能指标是否收敛?例如例如寻找最优控制寻找最优控制 ,使,使J 取极小值取极小值(106)第9页,本讲稿共19页根据分析,显然当根据分析,显然当 时,时,J 取极小值。取极小值。但是但是是不能控的状态分量,而且是不稳定的。导致是不能控的状态分量,而且是不稳定的。导致结论:该问题不存在有意义的解。结论:该问题不存在有意义的解。如果线性时变系统(如果线性时变系统(105)是能控的,无限时间状态调节器问题一)是能控的,无限时间状态调节器问题一定有解,并且可以通过有限时间状态调节器的解,取定有解,并且可以通过有限时间状态调节器的解,取 来获得。来获得。其结果为其结果为最优控制最优控制(107)(108)(109)最优性能指标最优性能指标(110)第10页,本讲稿共19页 可见,无限时间状态调节器与有限时间最优调节器类似,均可以可见,无限时间状态调节器与有限时间最优调节器类似,均可以用状态负反馈构成状态闭环控制。但是反馈增益矩阵是时变的,给工用状态负反馈构成状态闭环控制。但是反馈增益矩阵是时变的,给工程实践带来不便。程实践带来不便。卡尔曼研究了矩阵黎卡提微分方程解的各种性质,得出以下结果:卡尔曼研究了矩阵黎卡提微分方程解的各种性质,得出以下结果:线性定常系统线性定常系统(111)(112)(113)最优控制为最优控制为(114)(115)常数阵常数阵 满足如下黎卡提矩阵代数方程满足如下黎卡提矩阵代数方程第11页,本讲稿共19页(114)式代入()式代入(111)式,得)式,得(116)最优轨线可以由(最优轨线可以由(116)式和()式和(114)式求出。)式求出。最优性能指标最优性能指标(117)当这个无限时间状态调节器满足以下条件时,状态反馈增益矩阵当这个无限时间状态调节器满足以下条件时,状态反馈增益矩阵才为常数矩阵:才为常数矩阵:1)系统为线性定常系统;)系统为线性定常系统;2)系统为能控;)系统为能控;3)末值时刻)末值时刻 ;4)J 中不含末值项,即中不含末值项,即 F=0 ;5)Q,R 为正定阵。为正定阵。第12页,本讲稿共19页例例 7 线性定常系统的状态方程为线性定常系统的状态方程为0求最优控制求最优控制 ,使,使 J 取极小值。取极小值。解解 检验系统能控性检验系统能控性 能控。能控。设设代入(代入(115)式黎卡提方程,解得)式黎卡提方程,解得第13页,本讲稿共19页当当 时,时,;当;当 时,时,。第14页,本讲稿共19页四、四、定常情况下状态调节器的稳定性定常情况下状态调节器的稳定性 用李亚普诺夫第二法来用李亚普诺夫第二法来研究其稳定性研究其稳定性假设假设 正定,所以正定,所以 正正定。定。取取Lyapunov函数函数(118)这里不加证明,给出结论:这里不加证明,给出结论:使使 为正定对称阵的充要条件是:为正定对称阵的充要条件是:能观测。其中能观测。其中D 是任意一个使是任意一个使 成立的矩阵。成立的矩阵。第15页,本讲稿共19页将(将(116)式代入()式代入(119)式,并且考虑()式,并且考虑(115)式,有)式,有(120)由于由于 Q 和和 R 为正定阵,而为正定阵,而 阵也为正定阵也为正定,则,则 为负定为负定因此,定常情况下状态调节器平衡状态因此,定常情况下状态调节器平衡状态 是渐近稳定的。是渐近稳定的。即使开环系统即使开环系统 是不稳定的,也不管是不稳定的,也不管 Q、R 阵如何选阵如何选取,只要取,只要Q、R 阵为正定的,则状态调节器总是渐近稳定的。阵为正定的,则状态调节器总是渐近稳定的。(119)第16页,本讲稿共19页sys:A,B五、应用五、应用Matlab 解解LQ问题问题2 K,P,L=lqr(A,B,Q,R)K:K:状态反馈增益阵状态反馈增益阵P:P:黎卡提黎卡提(Riccati)(Riccati)矩阵代数方程的解矩阵代数方程的解L:L:闭环系统的特征值闭环系统的特征值1 K,P,L=lqr(sys,Q,R)第17页,本讲稿共19页例题A=0 1;0 0B=0;1Q=1 0;0 1R=1;K,P,L=lqr(A,B,Q,R)K=1.0000 1.7321用用Matlab 求解求解第18页,本讲稿共19页例题A=0 1;0 0B=0;1Q=5 0;0 1R=1;K,P,L=lqr(A,B,Q,R)K=2.2361 2.3393用用Matlab 求解求解第19页,本讲稿共19页