书签分享收藏举报版权申诉 / 130

立即下载

当前位置：首页 > 应用文书 > PPT文档 > 线性二次型最优控制问题.pptx

线性二次型最优控制问题.pptx

上传人：莉***

文档编号：77430033

上传时间：2023-03-14

格式：PPTX

页数：130

大小：2MB

( 4.5 )

《线性二次型最优控制问题.pptx》由会员分享，可在线阅读，更多相关《线性二次型最优控制问题.pptx（130页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、12023/3/13线性二次型最优控制问题线性二次型最优控制问题是指线性系统具有二次型性能指标二次型性能指标的最优控制问题，它呈现如下重要特性：性能指标具有鲜明的物理意义性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律最优控制规律是状态变量的反馈形式状态变量的反馈形式，便于计算和工程实现。可以兼顾系统性能指标的多方面因素可以兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。在理论上，线性二次型最优控制问题是其它许多控制问题的基础，有许多控制问题都可作为线性二次型最优控制问题来处理。线性二次型最优控制问题，在实践上得到了广泛而成功的

2、应用。可以说，线性二次型最优控制问题是现代控制理论及其应用领域中最富有成果最富有成果的一部分。第1页/共130页22023/3/136.1 线性二次型最优控制问题的提法问题6.1.1 给定线性时变系统的状态方程和输出方程其中，X(t)是n维状态变量，U(t)是m维控制变量，Y(t)是l维输出变量，A(t)是nn时变矩阵，B(t)是nm时变矩阵。假设1lmn，U(t)不受约束。若Yr(t)表示预期输出变量，它是l维向量，则有 e(t)=Yr(t)Y(t)称为误差向量。现在的问题是，选择最优控制U*(t)使下列二次型性能指标 (6.1.2)（6.1.1）第2页/共130页32023/3/13

3、为最小，这就是线性二次型最优控制问题。其中S是ll半正定对称常数矩阵，Q(t)是ll半正定对称时变矩阵，R(t)是mm正定对称时变矩阵，终端时间tf是固定的，终端状态X(tf)自由。性能指标（6.1.2）的物理意义式（6.1.2）中的第一部分称作终端代价，用它来限制终端误差e(tf)，以保证终端状态X(tf)具有适当的准确性。式（6.1.2）中的第二部分称作过程代价，用它来限制控制过程的误差e(t)，以保证系第3页/共130页42023/3/13统响应具有适当的快速性。式（6.1.2）中的第三部分称作控制代价，用它来限制控制U(t)的幅值及平滑性，以保证系统安全运行。同时，它对限制控制

4、过程的能源消耗也能起到重要的作用，从而保证系统具有适当的节能性。说明：（1）二次型性能指标是一种综合型性能指标。它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。线性二次型最优控制问题（6.1.1）、（6.1.2）的实质是：用不大的控制能量，来保持较小的输出误差，以达到控制能量和误差综合最优的目的。第4页/共130页52023/3/13 （2 2）在这些不同目标之间，往往存在着一定矛盾）在这些不同目标之间，往往存在着一定矛盾。例如，为能尽快消除误差并提高终端准确性，就需较强的控制作用及较大的能量消耗；而抑制控制作用的幅值和降低能耗，必然会影响系统的快速性和终端准

5、确性。如何对这些相互冲突的因素进行合理折衷，是系统设计者必须认真对待的课题。（3 3）性能指标由三项组成，若各项出现不同符号，将发）性能指标由三项组成，若各项出现不同符号，将发生相互抵消的现象生相互抵消的现象。这样，尽管各项单独的数值较大，但J的数值可能很小，性能指标就无法反映各项指标的优劣。为防止出现这种情况，应保证在各种实际运行情况下，无无论容许控制如何选择，性能指标中各项的数值始终具有相论容许控制如何选择，性能指标中各项的数值始终具有相同的符号同的符号。又因是以极小值作为最优标准，结合问题的物理性质，各项符号均取正值。（4）控制时间的起点控制时间的起点t t0 0及终点及终点t tf f

6、，可能是由实际问题决定可能是由实际问题决定的客观参数，也可能是由设计者决定的主观参数的客观参数，也可能是由设计者决定的主观参数。对后者而言，设计者必须把希望达到的目标和t0、tf的选择联系起来。第5页/共130页62023/3/13课前预习和讨论1、已经学过的最优控制问题的求解方法有哪些？它们之间有何联系和区别？2、什么样的最优控制问题称为线性二次型最优控制线性二次型最优控制？3、线性二次型最优控制问题有何特点有何特点？4、你认为问题6.1.1所描述的线性二次型最优控制问题应该用什么方法求用什么方法求解解?为什么？5、目标泛函中的各项目标泛函中的各项反映了什么样的控制要求和性能反映了什么样的控

7、制要求和性能？请具体说明！6、目标泛函中的目标泛函中的加权矩阵S，Q(t)和R(t)意味着什么？7、你认为二次型最优控制问题的难点在哪儿难点在哪儿？第6页/共130页72023/3/13上式所示的性能指标中加权矩阵S，Q(t)和R(t)（1 1）加权矩阵中的各个元素之间的数值比例关系，将）加权矩阵中的各个元素之间的数值比例关系，将直接影响系统的工作品质。直接影响系统的工作品质。例如，提高S阵中某一元素的比重，说明更加重视与该元素对应的状态分量的终端准确性；提高Q(t)阵中某一元素的比重，说明希望与之对应的状态分量具有较好的快速响应特性；而提高R R(t t)阵阵中某一中某一元素的比重元素的比重

8、，意味着需要更有效地意味着需要更有效地抑制抑制与之与之相应的控制分相应的控制分量的幅值量的幅值及由它引起的及由它引起的能量消耗。能量消耗。这只是大致趋势，实际情况十分复杂。因此，如何安排各加权阵的各个元素之间的关系，乃是一件十分重要而又十分困难的工作。（2 2）将）将S S阵取为半正定，以便保证终端代价的非负性，阵取为半正定，以便保证终端代价的非负性，但容许在但容许在e e(t tf f)不为零时的终端代价为零，这相当于不考虑与不为零时的终端代价为零，这相当于不考虑与之相应的终端误差之相应的终端误差。出于同样理由，Q(t)亦取半正定。但R(t)必须取正定，这是因为控制代价实际上可以反映控制过程

9、的能量第7页/共130页82023/3/13 消耗，而UT(t)R(t)U(t)则反映各瞬间的控制功率各瞬间的控制功率，只要U(t)不为零，控制功率当然就不应等于零控制功率当然就不应等于零。（3 3）由于终端代价只表示终端时刻）由于终端代价只表示终端时刻t tf f时的性能，因时的性能，因此，此，S S应为常数阵。应为常数阵。至于Q(t)及R(t)，可能取为常数阵，也可能取为时变阵。后者是为了适应控制过程的特殊需适应控制过程的特殊需要要。例如，在控制过程的初期出现的较大误差，并非系统品质不佳所致，而是由系统的初始条件引起的，因此，不必过分重视这种误差，以免引起控制作用U(t)不必要的过大冲击，

10、但控制过程的后期的误差直接与控制效果相关，必须给予足够的重视。只有把Q(t)和R(t)取为时变阵，才能适应控制过程的这类时变需求。有时，为了防止模型的失调，也需要Q(t)及R(t)具有时变性质。第8页/共130页92023/3/13 对容许控制对容许控制U U(t t)和终态和终态X X(t tf f)的说明的说明（1 1）在线性二次型问题的定义中，并没有直接提出对在线性二次型问题的定义中，并没有直接提出对控制作用控制作用U U(t t)的不等式约束，但这并不等于在物理上不的不等式约束，但这并不等于在物理上不需要对需要对U U(t t)进行必要的限制。进行必要的限制。实际上，用适当选择Q(t

11、)和R(t)数值比例的方法，同样可以把U(t)的幅值限制在适当的范围之内。这样，就可以在保持闭环系统线性性线性性质质的前提下，实现对实现对U U(t t)的限制。的限制。（2 2）在定义问题时，也没有直接提出对终态）在定义问题时，也没有直接提出对终态X X(t tf f)的要的要求。求。实际上，对终态的要求，是利用性能指标的终端代价来反映的，性能指标中的终端代价用于限制终端误差，它表明期望终态期望终态X X(t tf f)尽量靠近误差信号尽量靠近误差信号e e(t t)=0)=0所对应的所对应的状态状态。第9页/共130页102023/3/13若C(t)=I（单位矩阵），Yr(t)=0，则于

12、是性能指标（6.1.2）变为这时问题归结为：用不大的控制能量，使系统状态X(t)保持在零值附近，因而称为状态调节器问题。线性二次型最优控制问题的几种特殊情况线性二次型最优控制问题的几种特殊情况状态调节器问题第10页/共130页112023/3/13若Yr=0，则于是性能指标（6.1.2）变为这时问题归结为：用不大的控制能量，使系统输出Y(t)保持在零值附近，故称为输出调节器问题。输出调节器问题第11页/共130页122023/3/13 若Yr(t)0，则于是性能指标（6.1.2）可写为这时问题转化为：用不大的控制量，使系统输出Y(t)紧紧跟随Yr(t)的变化，故称为跟踪问题。跟踪问题第1

13、2页/共130页132023/3/136.2 有限时间的状态调节器问题问题6.2.1 给定线性定常系统的状态方程和初始条件其中X(t)是n维状态变量，U(t)是m维控制变量，A是nn常数矩阵，B是nm常数矩阵。性能指标是其中Q是nn非负定、对称的常数矩阵，R是mm正定、对称的常数矩阵，t tf f是给定是给定的终端时刻的终端时刻，X X(t tf f)是自由的终端状态是自由的终端状态，控制函数控制函数U U(t t)不受约束不受约束。（6.2.1）（6.2.2）第13页/共130页142023/3/13 现在的问题是，要求确定最优控制函数最优控制函数U U*(t t)，使性能指标（性能指标

14、（6.2.26.2.2）达到最小值达到最小值。这样的最优控制问题是以较小的控制能量为代价，使状态变量X(t)保持在零值附近，故称为状态调节器问题。状态调节器问题。又考虑到终端时间tf是有限的，故称为有限时间的状态调节器问题有限时间的状态调节器问题。相应的最优控制U*(t)称为最优调节作用或最优调节器。第14页/共130页152023/3/13下面应用最小值原理最小值原理来求解这个问题。解：构造Hamilton函数因为控制函数U(t)本身不受约束，所以有（6.2.3）第15页/共130页162023/3/13 式（6.2.3）表明，最优调节作用是协态变量优调节作用是协态变量(t t)的线性的线

15、性函数函数。但是，由于协态变量在实际系统中是不存在的，自然也无法检测到。因此式（6.2.3）的最优调节作用在工程上是难以实现的。为了便于在工程上实现，需将调节作用U(t)表示成系统状态变量X(t)的函数。令：其中P(t)是nn待定的时变矩阵。对上式两边求导数，得规范方程为：第16页/共130页172023/3/13 由于X(t)是任意的，所以有由于终端状态X(tf)是自由的，故相应的协态变量的终端值为所以，矩阵黎卡提矩阵黎卡提(Riccati)Riccati)微分方程微分方程矩阵黎卡提矩阵黎卡提(Riccati)Riccati)微分方程微分方程的边界条件的边界条件（6.2.4）第1

16、7页/共130页182023/3/13 P P(t t)的的3 3个重要性质个重要性质由微分方程理论的存在与唯一性定理，可以证明P(t)存在而且唯一。对于任意的tt0，tf，P(t)均为对称阵，即 P(t)PT(t)若R是正定矩阵，Q是半正定矩阵，则P(t)（t0ttf）是半正定矩阵；若R是正定矩阵，Q是正定矩阵，则P(t)（t0ttf）是正定矩阵。证明略。第18页/共130页192023/3/13命题6.2.1 问题6.2.1的最优调节作用必为如下形式的状态反馈其中P(t)是矩阵黎卡提微分方程满足边界条件的对称解。并且状态最优轨线X*(t)是状态方程第19页/共130页202023/

17、3/13 满足初始条件的解。若令，则有其中K(t)称为反馈增益矩阵。这样就构成了一个状态反馈最优调节系统，如图61所示。图6-1第20页/共130页212023/3/13 说明：设U(t)是任意的控制作用，X(t)是相应于U(t)的状态轨线，性能指标（6.2.2）除了依赖于U(t)之外，还依赖于状态初值X(t0)。因此，性能指标可记为特别是当控制作用为最优值U*(t)时，性能指标记为第21页/共130页222023/3/13 命题命题6.2.2 6.2.2 有限时间状态调节器问题的最优控制有限时间状态调节器问题的最优控制U U*(t t)的充的充要条件是：要条件是：且性能指标的最小值

18、为：证明：命题6.2.2的前半部分，即关于最优调节作用的充分性，在第三章最大值原理的推论中已经证明了。在那里，我们曾经指出，对于线性系统（6.2.1）来说，最大（小）值原理是使性能指标（6.2.2）达到最小值的必要和充分条件。因此，下面只证明命题6.2.2的后半部分因为第22页/共130页232023/3/13 将系统状态方程（6.2.1）和黎卡提微分方程（6.2.4）代入上式，经整理得分别对上式两边进行积分0第23页/共130页242023/3/13 上式进一步整理得所以，性能指标的最小值为第24页/共130页252023/3/13 由于R是正定矩阵，上式最后一个等号的右端第二项是

19、非负的，故当第25页/共130页262023/3/13 时，性能指标JX(t0)，U(t)达到最小值，且为 QED 说明：由命题6.2.2可知，若初始时刻为t，初始状态为X(t)，则性能指标的最小值为第26页/共130页272023/3/13 命题命题6.2.3 6.2.3 有限时间状态调节器问题的最优控制有限时间状态调节器问题的最优控制U U*(t t)存在存在且唯一。且唯一。证明：1关于存在性关于存在性由于U*(t)=R1BTP(t)X(t)，而P(t)是存在的，故U*(t)亦存在。2关于唯一性关于唯一性应用反证法。设U*(t)不是唯一的，并设U*(t)和均为最优控制，则由P(t)

20、的唯一性，得将上述两个式子分别代入系统状态方程（6.2.1），得第27页/共130页282023/3/13 由此可知，X(t)及乃是同一微分方程在同一边界条件下的解。根据微分方程在给定边界条件下解的唯一性，有从而有 QED 综合命题6.2.1、命题6.2.2和命题6.2.3，可得如下定理：*定理定理6.2.16.2.1 *给定线性定常系统的状态方程其中U(t)不受约束。初始条件X(t0)=X0和性能指标则最优控制存在且唯一，最优控制的充要条件充要条件是第28页/共130页292023/3/13 其中P(t)是矩阵黎卡提微分方程矩阵黎卡提微分方程满足边界条件边界条件的唯一对称解唯

21、一对称解。并且，当Q为半正定对称矩阵时，P(t)(t0ttf)是半正定对称矩阵；而当Q为正定对称矩阵时，P(t)是正定对称矩阵。性能指标的最小值为状态最优轨线是下列状态方程满足初始条件X(t0)=X0的解。第29页/共130页302023/3/13 例6.2.1 设调节对象的状态方程为：性能指标为其中q0，r0，要求确定最优调节作用和状态最优轨线。解：这是有限时间状态调节器问题，所以其中p(t)满足方程第30页/共130页312023/3/13 利用分离变量法分离变量法解此方程，得由此得其中状态最优轨线是下列状态方程（6.2.6）第31页/共130页322023/3/13 的解

22、。解此方程得最优调节的闭环系统之方程图如图62所示。图中表示信号相乘。虚线部分表示p(t)的求解装置，p(0)可由式（6.2.6）求得。特别当tf=1，x(0)=1，q=1，a=1，而r分别为1，0.1和0.02时，其最优调节作用u*(t)，最优轨线x*(t)和黎卡提方程的解p(t)如图63所示。第32页/共130页332023/3/13图6-2第33页/共130页342023/3/13图图6-36-3第34页/共130页352023/3/13 对图63的说明：由图63（a）可见，当r很小时，意即控制作用的价值并不重要，控制轨线x(t)将迅速回到零；当r很大时，意即控制作用的价值十分重要，状

23、态轨线x(t)将衰减得很慢。如图63（b）可见，随着r的减小，在控制区间0，1起始部分的控制变量的幅值变得很大；当r趋于零时，控制变量逐渐演变成为t=0时的脉冲。由图63（c）可见，随着r的减小，p(t)在控制区间0，1的起始部分几乎是一常数；当r减小时，p(t)仅仅在控制区间的最后部分才表现出时变的性质；随着r的增大，p(t)就成为真正的时变了。第35页/共130页362023/3/13本节几点说明若性能指标为其中S为半正定对称矩阵，QQ、R R假设同前假设同前，则定理6.2.1仍然成立，但是，边边界条件应改为界条件应改为这是由于在这种情况下又考虑所以第36页/共130页3720

24、23/3/13 如果给定的是时变系统是时变系统且性能指标为假设A(t)，B(t)，Q(t)和R(t)的诸元素都是t t（t t0 0 t t t tf f）的连续函数的连续函数，并且A(t)，B(t)，Q(t)，R(t)和R-1(t)都是有界的，则定理6.2.1仍然成立，只要将A，B，Q和R分别改为A(t)，B(t)，Q(t)和R(t)，边界条件由P(tf)=0改为P(tf)=S即可。第37页/共130页382023/3/136.3 无限时间的状态调节器问题在6.2节讨论的状态调节器问题中，所得到最优调节作用是状态变量的线性函数，可以实现状态反馈的闭环控制。但是，其反馈增益矩阵反馈增益矩

25、阵却是时变时变的。这在工程实现上是极不方便的。如果我们能够得到定常的反馈增益矩阵，那将给工程实现带来极大的方便。从下面的讨论中将会看到，当线性定常系统是完全可控的，并且终端时刻tf趋于无限时，就可得到非时变的状态调节器，即这时的反馈增益矩阵是一个定常矩阵。第38页/共130页392023/3/13 问题6.3.1 给定完全可控完全可控线性定常系统的状态方程和初始条件以及性能指标其中Q和R都是定常对称正定矩阵定常对称正定矩阵。假定U(t)不受约束，要求确定最优调节作用U*(t)，使性能指标（6.3.2）达到最小值。该问题与上一节所讨论的问题相类似，也是一种状态调节器问题，但是，由于终端时刻

26、 t tf f 为无限值为无限值，故称为无限时间的状态调节器问题无限时间的状态调节器问题，有时也称为非时变非时变的状态调节器问题的状态调节器问题。（6.3.1）（6.3.2）第39页/共130页402023/3/13 对于无限时间的状态调节器问题无限时间的状态调节器问题，可以将它看成是在上一节所讨论的有限时间的状态调节器问题中，令tf时的极限情况来处理。即由上节定理6.2.1可知，对于给定的系统（6.3.1），使性能指标达到最小值的最优调节作用为第40页/共130页412023/3/13 其中P(t)是下列矩阵黎卡提微分方程满足边界条件的正定对称解。可以证明，正定对称矩阵P(t)的每

27、个元素pij(t)(i，j=1,2,3,n)随时间变化的情况如图64所示。由图可见，当tf很大时，随着t的减小pij(t)将达到稳定值，并且随着tf的增加，此稳态值的时间区间将加宽。当tf时，此稳态值的时间区间也将趋于无穷大。所以当给定的系统（6.4.1）完全可控时而图6-4第41页/共130页422023/3/13 于是，当tf时，矩阵黎卡提微分方程就转化为如下矩阵黎卡提（RiccatiRiccati）代数方程：由于性能指标（6.3.2）可表示为所以系统（6.3.1）在性能指标为（6.3.2）时的最优调节作用为第42页/共130页432023/3/13*定理定理6.3.1*6.3.

28、1*给定线性定常系统的状态方程和初始条件其中A，B为定常矩阵，系统（A，B）是完全可控的，控制函数U(t)不受约束。性能指标为其中Q，R是定常对称正定矩阵，则使性能指标J达到最小值的最优调节作用为其中是矩阵黎卡提代数方程的唯一正定对称解。而状态最优轨线X*(t)是状态方程第43页/共130页442023/3/13 满足初始条件的解。性能指标的最小值为最优调节系统的方框图如图65所示。图6-5第44页/共130页452023/3/13说明：对于无限时间状态调节器无限时间状态调节器，终端状态必须为零终端状态必须为零，即X()=0。不然，性能指标值将为无穷大，问题将无解。由于X()=

29、0，所以在性能指标中设置终端代价是多余的。定理定理6.3.26.3.2 定理6.3.1中的闭环最优调节系统是渐进稳定的。证明：利用反证法来证明该定理。为此令假设系统（6.3.3）不是渐进稳定的，则A1必具有非负实部的特征根。于是，当tf时，状态变量X(t)不会趋于零，即（6.3.3）第45页/共130页462023/3/13 由于Q和R都是正定矩阵，故当tf时，性能指标的最优值J*X(t0)，t0将趋于无穷大，即这与性能指标的最优值为有限值相矛盾，所以系统（6.3.3）是渐进稳定的。第46页/共130页472023/3/13定常矩阵的计算方法v直接求解黎卡提代数方程求解黎卡提代数方程v

30、首先求解黎卡提微分方程求解黎卡提微分方程得到其解为然后令tf，t=0或者tf=0，t=，则可得到。第47页/共130页482023/3/13 例例6.3.16.3.1 二阶可控系统的状态方程：最优控制u*(t)应使性能指标取极小值。试求出最优控制u*(t)，并绘出最优反馈系统的结构图。解：已知第48页/共130页492023/3/13 故最优控制为其中，P满足代数Riccati方程经整理，并注意到p12=p21，得第49页/共130页502023/3/13 由此得所以，最优控制为：系统的最优反馈结构图如图66所示。第50页/共130页512023/3/13图6-6第51页/共13

31、0页522023/3/136.4 输出调节器问题问题6.4.1 给定完全可观测的线性定常系统的状态方程和输出方程以及性能指标其中，Q是定常半正定对称矩阵，R是定常正定对称矩阵，tf是有限的终端时刻，控制函数控制函数U U(t t)不受约束不受约束。要求确定最优调节作用U*(t),使性能指标（6.4.3）达到最小值。这类最优控制问题，称为输出调节器问题。其实质是用不大的控制能量，使输出变量Y(t)保持在零值附近。（6.4.1）（6.4.2）（6.4.3）第52页/共130页532023/3/13 考虑到输出方程（6.4.2），式（6.4.3）可写为于是，加权矩阵为加权矩阵为QQ的有限时间

32、的输出调节器问题就转化为加权矩阵为的有限时间的输出调节器问题就转化为加权矩阵为QQ 的有的有限时间的状态调节器问题限时间的状态调节器问题。因此可以利用关于有限时间的状态调节器的定理6.2.1来求解这个问题。但是，这时要求系统（要求系统（A A,C C）必须是必须是完全可观测完全可观测的，即要求第53页/共130页542023/3/13第54页/共130页552023/3/13 无限时间的输出调节器问题无限时间的输出调节器问题问题6.4.1 所讨论的是终端时刻tf为有限值的情况。当tf时，性能指标为这时，输出调节器问题称为无限时间的输出调节器问题。经过与上述相同的变换，即第55页/共13

33、0页562023/3/13 于是，无限时间的输出调节器问题就转化为无限时间的状态调节器问题。自然可以利用关于无限时间状态调节器问题的定理6.3.1来求解这个问题。但是，同时同时要要求系统求系统(A,B,CA,B,C)是是完全可控和完全可观测完全可控和完全可观测的的。即第56页/共130页572023/3/13 例6.4.1 受控系统的传递函数为：性能指标为：(r0),试求解并绘出最优反馈结构。解：由式（6.4.4）得令（6.4.4）第57页/共130页582023/3/13 则得系统的状态方程和输出方程为所以由于第58页/共130页592023/3/13 所以故该系统（A,B,C）

34、是完全可控和完全可观测的。又由于R=r0是正定的，所以根据定理6.3.1可知，最优调节作用为第59页/共130页602023/3/13 其中P是下列黎卡提代数方程的正定对称解考虑到P为对称的，所以。根据上面矩阵方程，可得下面代数方程组第60页/共130页612023/3/13 因为P是正定的，所以解上面代数方程组，得到故最优调节作用为正定，各阶主子正定，各阶主子式大于零式大于零第61页/共130页622023/3/13 系统的最优反馈结构如图67所示，图6-7第62页/共130页632023/3/136.5 6.5 跟踪问题跟踪问题又称为伺服机问题跟踪问题又称为伺服机问题

35、问题6.5.1 给定完全可观测的线性定常系统的状态方程和输出方程以及性能指标其中Yr(t)是被跟踪的变量，U(t)不受约束。要求确定最优控制U*(t)，使性能指标（6.5.3）达到最小值。这个问题的实质是，用不大的控制能量，使系统输出变量Y(t)跟踪Yr(t)的变化，故称为跟踪问题。(6.5.1)(6.5.2)(6.5.3)第63页/共130页642023/3/13 解：应用最小值原理来求解这个问题，首先构造Hamilton函数：说明式（6.5.4）是使哈密顿函数H达到最小值的最优控制，当然也是使性能指标（6.5.3）达到最小值的最优控制。(6.5.4)第64页/共130页652023/

36、3/13 规范方程为：上述式子描述的两点边界值问题和调节器问题中的两点边界值问题相比，上式多了一项CTQYr(t)而成为非齐次微分方程。因此，设其解为其中P(t)是待定的nn矩阵，(t)是待定的n维向量。对式（6.5.7）两边求导数，得(6.5.5)(6.5.6)(6.5.7)第65页/共130页662023/3/13 将式（6.5.5）式（6.5.7）代入式（6.5.8），消去其中的(t)、和，经整理得上式左端是一个时间函数与状态变量的乘积，而右端单纯是一个时间函数，与状态状态X X(t t)无关无关，若使上式对所有的所有的状态变量都成立状态变量都成立则应满足或者(6.5.8)(6.

37、5.9)(6.5.10)第66页/共130页672023/3/13 由于所以由上述两个微分方程以及边界条件，可以解出P(t)和(t)，则最优控制为：说明：跟踪问题的最优控制，实际上包括两项，一项是状态X(t)的线性函数，这与调节器问题的解相同，代表着负反馈的状态调节作用；另一项是(t)的线性函数，(t)受控于Yr(t)，所以它代表着由被跟踪变量Yr(t)所引起的驱动作用。第67页/共130页682023/3/13 无限时间的跟踪问题无限时间的跟踪问题以上讨论的是终端时刻tf为有限值的情况。若tf为无穷大，则性能指标为这时与无限时间的状态调节问题完全类似，有这样，方程（6.5.9）和（

38、6.5.10）就变成为若系统（A，B，C）是完全可控和可观测的，即(6.5.11)(6.5.12)第68页/共130页692023/3/13 则最优控制为其中和分别是代数方程（6.5.11）和（6.5.12）的解。第69页/共130页702023/3/13 例6.5.1 给定二阶系统的状态方程和输出方程以及性能指标要求确定最优控制u*(t)，使性能指标达到最小值。解：由给定条件知第70页/共130页712023/3/13 由于所以，系统（A，B，C）是完全可控和完全可观测的，故系统存在最优控制，且为其中，P和(t)是下列代数方程的解第71页/共130页722023/3/13

39、所以，根据P的正定性，得第72页/共130页732023/3/13 于是闭环系统的方框图如图68所示。第73页/共130页742023/3/13图6-8第74页/共130页752023/3/136.6 具有指定稳定度的最优调节器问题 *在6.3节中的定理6.3.2表明闭环最优调节系统是渐进稳定的，即但没有讨论X(t)0的衰减速度问题。*若衰减速度愈快，则它的稳定性愈好。在这一节里，针对调节对象（6.3.1），设计一个调节器，使得闭环系统具有指定的稳定度0，也就是说，X(t)0的衰减速度不低于的数量级。第75页/共130页762023/3/13问题6.6.1 设调节对象的状态方程为并假

40、定（A，B）是完全可控的。性能指标为其中Q和R都是对称正定矩阵，0。试确定最优调节作用U*(t)，使性能指标（6.6.2）达到最小值。这个问题称为改进的最优调节器问题。解：若令(6.6.1)(6.6.2)第76页/共130页772023/3/13 则有于是将式（6.6.3）和（6.6.4）代入式（6.6.1）中，并化简整理得再将式（6.6.3）代入式（6.6.2）中，经化简整理得这样，我们就将系统（6.6.1），性能指标为（6.6.2）的改进的最优调节器问题，转化为系统为（6.6.5），性能指标为（6.6.6）的规范型的最优调节器问题。并要求（A+I,B）是完全可控的。关于（A+I,

41、B）的可控性问题，存于如下命题。(6.6.3)(6.6.4)(6.6.5)(6.6.6)第77页/共130页782023/3/13 命题6.6.1 系统（A+I,B）完全可控的充要条件是系统（A,B）完全可控。证明：由于其中fk(A)是次数低于K的A的多项式，所以由于系统（A,B）是完全可控的，所以上面最后一个等式成立，因而系统（A+I,B）是完全可控的，命题6.6.1得证。第78页/共130页792023/3/13新系统(6.6.5)的最优控制问题由于系统（A+I,B）是完全可控的，并且Q和R都是正定的，故对于系统（6.6.5）来说，使性能指标（6.6.6）达到最小值的最优调节作用为

42、其中满足下列黎卡提代数方程对于系统（6.6.1），性能指标为（6.6.2）的最优调节作用为其中是式（6.6.7）的对称正定解。最优轨线为由于(6.6.7)(6.6.8)第79页/共130页802023/3/13 而所以X*(t)比衰减得更快。也就是说，系统（6.6.1）在调节器（6.6.8）的作用下，其闭环系统具有指定的稳定度 0。第80页/共130页812023/3/13定理6.6.1 对于系统使性能指标达到最小值的最优调节作用为其中是黎卡提代数方程的对称正定解。并且，在此最优调节作用下的闭环系统具有指定的稳定度0。第81页/共130页822023/3/13 例6.6.

43、1 给定单输入单输出调节对象的微分方程要求确定最优调节作用u*(t)，使性能指标达到最小值。解：这是一个改进的无限时间的输出调节器问题。令则对象的状态方程和输出方程为第82页/共130页832023/3/13 或者由对象的状态方程、输出方程和性能指标可知：由于第83页/共130页842023/3/13 所以，给定调节对象是完全可控和完全可观测的。将给定的性能指标进行变换于是，我们便将改进的无限时间的输出调节器问题变成为改进的无限时间的状态调节器问题，并且第84页/共130页852023/3/13 根据本节定理6.6.1，可知其最优调节作用为其中 P 为黎卡提代数方程的正定对

44、称解。解上面矩阵方程得第85页/共130页862023/3/13 解此方程组，得因此，最优调节作用为第86页/共130页872023/3/13 亦即下面来验证其闭环系统确有指定的稳定度1。闭环系统的状态方程为：即第87页/共130页882023/3/13 其特征方程为特征根的实数部分故它具有指定的稳定度1。第88页/共130页892023/3/136.7 在阶跃干扰作用下的状态调节器问题*前面所讨论的调节器问题，都是假定系统的初始状态不在平衡位置上或者系统受到的外界干扰作用是脉冲式的。在这种情况下所设计的最优调节系统，一般来说，在外界阶跃干扰作用下，闭环系统是有静差的。本节将讨论

45、如何选择性能指标的形式，使得所设计的最优调节系统能够克服阶跃干扰作用的影响，消除静态偏差。第89页/共130页902023/3/13 问题6.7.1 给定对象的状态方程（6.7.1）其中X(t)是n维状态变量，U(t)是m维控制变量，W(t)是m维阶跃干扰变量，A是nn常数阵，B是n m常数阵，对象（A,B）是完全可控的，B的秩为m。性能指标为（6.7.2）其中Q、S和R分别是nn，m m，m m对称正定常数阵。现在的问题是需要确定最优调节作用U*(t)使性能指标（6.7.2）达到最小值。在性能指标（6.7.2）中，包含这一项意味着对控制作用的变化速度也有所要求，即要求控制作用的变化速度

46、也不宜过大。第90页/共130页912023/3/13 解：令，则构成新的状态变量是n+m维列向量，称为增广向量。令作为新的控制向量，于是式（6.7.1），（6.7.3）和（6.7.4）可得一新的增广系统，其状态方程为其中 (6.7.3)(6.7.4)(6.7.5)第91页/共130页922023/3/13 分别为（n+m)(n+m)和（n+m）m矩阵，而I为m m单位阵。相应地，性能指标也变成为其中，为（n+m)(n+m)对称正定矩阵。这样，本节开始所提出的最优调节器问题便转化为对于增广系统（6.7.5）、性能指标为（6.7.6）的最优调节器问题。求解该最优调节器问题，要求系统

47、是完全可控的，关于的可控性问题存在下述命题。(6.7.6)第92页/共130页932023/3/13 命题6.7.1 完全可控的充要条件是（A,B）完全可控。证明：由于第93页/共130页942023/3/13 所以因此，完全可控的充要条件是（A,B）完全可控。命题6.7.1得证。第94页/共130页952023/3/13增广系统(6.7.5)的最优控制问题由于系统（6.7.1）是完全可控的，所以增广系统（6.7.5）也是完全可控的。又考虑到Q、S和R都是对称正定阵，所以和R也是对称正定阵，根据定理6.3.1可知，对于增广系统（6.7.5）来说，使性能指标（6.7.6）达到最小值的最

48、优调节作用是第95页/共130页962023/3/13 其中是黎卡提代数方程的对称正定解。上式的分块形式为第96页/共130页972023/3/13 考虑到为对称矩阵，则由上式可得：由上式可得。若令则最优调节作用为：(6.7.7)第97页/共130页982023/3/13 其方框图如图69所示。图6-9第98页/共130页992023/3/13在最优调节（6.7.7）的作用下，闭环系统是渐进稳定的，即利用式（6.7.1），可得将上式代入式（6.7.7）中，得(6.7.8)第99页/共130页1002023/3/13 若令则有将上式两边积分，得上式即为调节对象(6.7.1

49、)对于性能指标(6.7.2)的最优调节作用。在此最优调节作用下，由式（6.7.8）可知，其闭环系统是稳定的，且无静态偏差。调节作用U*(t)稳定在一W(t)上，可以完全克服阶跃干扰的影响，其方框图如图610所示。(6.7.9)第100页/共130页1012023/3/13 由式（6.7.9）可见，最优调节作用是状态X(t)的比例积分的反馈形式，这一点与在经典自动调节理论中，常常采用比例积分反馈来克服外界阶跃干扰作用是一致的。图6-10第101页/共130页1022023/3/13例6.7.1 已知调节对象的状态方程和输出方程为其中u(t)为控制变量，w(t)为外界阶跃干扰。性能指标为要求确

50、定u*(t)，使性能指标J达到最小值。第102页/共130页1032023/3/13 解：这是一个具有阶跃干扰的输出调节器问题。由题设知：容易验证调节对象（A,B,C）是完全可控和完全可观测的。即令第103页/共130页1042023/3/13 则有增广系统的状态变量为增广系统的状态方程和输出方程为其中第104页/共130页1052023/3/13 由于系统（A,B）是完全可控的，所以增广系统也是完全可控的。这使性能指标可转化为其中由于第105页/共130页1062023/3/13 而所以也是完全可观测的，于是系统的最优调节作用为第106页/共130页1072023/

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 线性二次最优控制问题

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：线性二次型最优控制问题.pptx
链接地址：https://www.taowenge.com/p-77430033.html