线性二次型最优控制问题.pptx
《线性二次型最优控制问题.pptx》由会员分享,可在线阅读,更多相关《线性二次型最优控制问题.pptx(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、12023/3/13线性二次型最优控制问题线性二次型最优控制问题是指线性系统具有二次型性能指标二次型性能指标的最优控制问题,它呈现如下重要特性:性能指标具有鲜明的物理意义性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律最优控制规律是状态变量的反馈形式状态变量的反馈形式,便于计算和工程实现。可以兼顾系统性能指标的多方面因素可以兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。在理论上,线性二次型最优控制问题是其它许多控制问题的基础,有许多控制问题都可作为线性二次型最优控制问题来处理。线性二次型最优控制问题,在实践上得到了广泛而成功的
2、应用。可以说,线性二次型最优控制问题是现代控制理论及其应用领域中最富有成果最富有成果的一部分。第1页/共130页22023/3/136.1 线性二次型最优控制问题的提法 问题6.1.1 给定线性时变系统的状态方程和输出方程 其中,X(t)是n维状态变量,U(t)是m维控制变量,Y(t)是l维输出变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。假设1lmn,U(t)不受约束。若Yr(t)表示预期输出变量,它是l维向量,则有 e(t)=Yr(t)Y(t)称为误差向量。现在的问题是,选择最优控制U*(t)使下列二次型性能指标 (6.1.2)(6.1.1)第2页/共130页32023/3/13
3、为最小,这就是线性二次型最优控制问题。其中S是ll半正定对称常数矩阵,Q(t)是ll半正定对称时变矩阵,R(t)是mm正定对称时变矩阵,终端时间tf是固定的,终端状态X(tf)自由。性能指标(6.1.2)的物理意义 式(6.1.2)中的第一部分 称作终端代价,用它来限制终端误差e(tf),以保证终端状态X(tf)具有适当的准确性。式(6.1.2)中的第二部分 称作过程代价,用它来限制控制过程的误差e(t),以保证系第3页/共130页42023/3/13统响应具有适当的快速性。式(6.1.2)中的第三部分 称作控制代价,用它来限制控制U(t)的幅值及平滑性,以保证系统安全运行。同时,它对限制控制
4、过程的能源消耗也能起到重要的作用,从而保证系统具有适当的节能性。说明:(1)二次型性能指标是一种综合型性能指标。它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。线性二次型最优控制问题(6.1.1)、(6.1.2)的实质是:用不大的控制能量,来保持较小的输出误差,以达到控制能量和误差综合最优的目的。第4页/共130页52023/3/13 (2 2)在这些不同目标之间,往往存在着一定矛盾)在这些不同目标之间,往往存在着一定矛盾。例如,为能尽快消除误差并提高终端准确性,就需较强的控制作用及较大的能量消耗;而抑制控制作用的幅值和降低能耗,必然会影响系统的快速性和终端准
5、确性。如何对这些相互冲突的因素进行合理折衷,是系统设计者必须认真对待的课题。(3 3)性能指标由三项组成,若各项出现不同符号,将发)性能指标由三项组成,若各项出现不同符号,将发生相互抵消的现象生相互抵消的现象。这样,尽管各项单独的数值较大,但J的数值可能很小,性能指标就无法反映各项指标的优劣。为防止出现这种情况,应保证在各种实际运行情况下,无无论容许控制如何选择,性能指标中各项的数值始终具有相论容许控制如何选择,性能指标中各项的数值始终具有相同的符号同的符号。又因是以极小值作为最优标准,结合问题的物理性质,各项符号均取正值。(4)控制时间的起点控制时间的起点t t0 0及终点及终点t tf f
6、,可能是由实际问题决定可能是由实际问题决定的客观参数,也可能是由设计者决定的主观参数的客观参数,也可能是由设计者决定的主观参数。对后者而言,设计者必须把希望达到的目标和t0、tf的选择联系起来。第5页/共130页62023/3/13课前预习和讨论1、已经学过的最优控制问题的求解方法有哪些?它们之间有何联系和区别?2、什么样的最优控制问题称为线性二次型最优控制线性二次型最优控制?3、线性二次型最优控制问题有何特点有何特点?4、你认为问题6.1.1所描述的线性二次型最优控制问题应该用什么方法求用什么方法求解解?为什么?5、目标泛函中的各项目标泛函中的各项反映了什么样的控制要求和性能反映了什么样的控
7、制要求和性能?请具体说明!6、目标泛函中的目标泛函中的加权矩阵S,Q(t)和R(t)意味着什么?7、你认为二次型最优控制问题的难点在哪儿难点在哪儿?第6页/共130页72023/3/13上式所示的性能指标中加权矩阵S,Q(t)和R(t)(1 1)加权矩阵中的各个元素之间的数值比例关系,将)加权矩阵中的各个元素之间的数值比例关系,将直接影响系统的工作品质。直接影响系统的工作品质。例如,提高S阵中某一元素的比重,说明更加重视与该元素对应的状态分量的终端准确性;提高Q(t)阵中某一元素的比重,说明希望与之对应的状态分量具有较好的快速响应特性;而提高R R(t t)阵阵中某一中某一元素的比重元素的比重
8、,意味着需要更有效地意味着需要更有效地抑制抑制与之与之相应的控制分相应的控制分量的幅值量的幅值及由它引起的及由它引起的能量消耗。能量消耗。这只是大致趋势,实际情况十分复杂。因此,如何安排各加权阵的各个元素之间的关系,乃是一件十分重要而又十分困难的工作。(2 2)将)将S S阵取为半正定,以便保证终端代价的非负性,阵取为半正定,以便保证终端代价的非负性,但容许在但容许在e e(t tf f)不为零时的终端代价为零,这相当于不考虑与不为零时的终端代价为零,这相当于不考虑与之相应的终端误差之相应的终端误差。出于同样理由,Q(t)亦取半正定。但R(t)必须取正定,这是因为控制代价实际上可以反映控制过程
9、的能量第7页/共130页82023/3/13 消耗,而UT(t)R(t)U(t)则反映各瞬间的控制功率各瞬间的控制功率,只要U(t)不为零,控制功率当然就不应等于零控制功率当然就不应等于零。(3 3)由于终端代价只表示终端时刻)由于终端代价只表示终端时刻t tf f时的性能,因时的性能,因此,此,S S应为常数阵。应为常数阵。至于Q(t)及R(t),可能取为常数阵,也可能取为时变阵。后者是为了适应控制过程的特殊需适应控制过程的特殊需要要。例如,在控制过程的初期出现的较大误差,并非系统品质不佳所致,而是由系统的初始条件引起的,因此,不必过分重视这种误差,以免引起控制作用U(t)不必要的过大冲击,
10、但控制过程的后期的误差直接与控制效果相关,必须给予足够的重视。只有把Q(t)和R(t)取为时变阵,才能适应控制过程的这类时变需求。有时,为了防止模型的失调,也需要Q(t)及R(t)具有时变性质。第8页/共130页92023/3/13 对容许控制对容许控制U U(t t)和终态和终态X X(t tf f)的说明的说明 (1 1)在线性二次型问题的定义中,并没有直接提出对在线性二次型问题的定义中,并没有直接提出对控制作用控制作用U U(t t)的不等式约束,但这并不等于在物理上不的不等式约束,但这并不等于在物理上不需要对需要对U U(t t)进行必要的限制。进行必要的限制。实际上,用适当选择Q(t
11、)和R(t)数值比例的方法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就可以在保持闭环系统线性性线性性质质的前提下,实现对实现对U U(t t)的限制。的限制。(2 2)在定义问题时,也没有直接提出对终态)在定义问题时,也没有直接提出对终态X X(t tf f)的要的要求。求。实际上,对终态的要求,是利用性能指标的终端代价来反映的,性能指标中的终端代价用于限制终端误差,它表明期望终态期望终态X X(t tf f)尽量靠近误差信号尽量靠近误差信号e e(t t)=0)=0所对应的所对应的状态状态。第9页/共130页102023/3/13若C(t)=I(单位矩阵),Yr(t)=0,则 于
12、是性能指标(6.1.2)变为 这时问题归结为:用不大的控制能量,使系统状态X(t)保持在零值附近,因而称为状态调节器问题。线性二次型最优控制问题的几种特殊情况线性二次型最优控制问题的几种特殊情况状态调节器问题第10页/共130页112023/3/13若Yr=0,则于是性能指标(6.1.2)变为这时问题归结为:用不大的控制能量,使系统输出Y(t)保持在零值附近,故称为输出调节器问题。输出调节器问题第11页/共130页122023/3/13 若Yr(t)0,则 于是性能指标(6.1.2)可写为 这时问题转化为:用不大的控制量,使系统输出Y(t)紧紧跟随Yr(t)的变化,故称为跟踪问题。跟踪问题第1
13、2页/共130页132023/3/136.2 有限时间的状态调节器问题问题6.2.1 给定线性定常系统的状态方程和初始条件 其中X(t)是n维状态变量,U(t)是m维控制变量,A是nn常数矩阵,B是nm常数矩阵。性能指标是 其中Q是nn非负定、对称的常数矩阵,R是mm正定、对称的常数矩阵,t tf f是给定是给定的终端时刻的终端时刻,X X(t tf f)是自由的终端状态是自由的终端状态,控制函数控制函数U U(t t)不受约束不受约束。(6.2.1)(6.2.2)第13页/共130页142023/3/13 现在的问题是,要求确定最优控制函数最优控制函数U U*(t t),使性能指标(性能指标
14、(6.2.26.2.2)达到最小值达到最小值。这样的最优控制问题是以较小的控制能量为代价,使状态变量X(t)保持在零值附近,故称为状态调节器问题。状态调节器问题。又考虑到终端时间tf是有限的,故称为有限时间的状态调节器问题有限时间的状态调节器问题。相应的最优控制U*(t)称为最优调节作用或最优调节器。第14页/共130页152023/3/13下面应用最小值原理最小值原理来求解这个问题。解:构造Hamilton函数 因为控制函数U(t)本身不受约束,所以有(6.2.3)第15页/共130页162023/3/13 式(6.2.3)表明,最优调节作用是协态变量优调节作用是协态变量(t t)的线性的线
15、性函数函数。但是,由于协态变量在实际系统中是不存在的,自然也无法检测到。因此式(6.2.3)的最优调节作用在工程上是难以实现的。为了便于在工程上实现,需将调节作用U(t)表示成系统状态变量X(t)的函数。令:其中P(t)是nn待定的时变矩阵。对上式两边求导数,得 规范方程 为:第16页/共130页172023/3/13 由于X(t)是任意的,所以有 由于终端状态X(tf)是自由 的,故相应的协态变量的 终端值为 所以,矩阵黎卡提矩阵黎卡提(Riccati)Riccati)微分方程微分方程矩阵黎卡提矩阵黎卡提(Riccati)Riccati)微分方程微分方程的边界条件的边界条件(6.2.4)第1
16、7页/共130页182023/3/13 P P(t t)的的3 3个重要性质个重要性质由微分方程理论的存在与唯一性定理,可以证明P(t)存在而且唯一。对于任意的tt0,tf,P(t)均为对称阵,即 P(t)PT(t)若R是正定矩阵,Q是半正定矩阵,则P(t)(t0ttf)是半正定矩阵;若R是正定矩阵,Q是正定矩阵,则P(t)(t0ttf)是正定矩阵。证明略。第18页/共130页192023/3/13命题6.2.1 问题6.2.1的最优调节作用必为如下形式的状态反馈 其中P(t)是矩阵黎卡提微分方程 满足边界条件 的对称解。并且状态最优轨线X*(t)是状态方程 第19页/共130页202023/
17、3/13 满足初始条件 的解。若令 ,则有 其中K(t)称为反馈增益矩阵。这样就构成了一个状态反馈最优调节系统,如图61所示。图6-1第20页/共130页212023/3/13 说明:设U(t)是任意的控制作用,X(t)是相应于U(t)的状态轨线,性能指标(6.2.2)除了依赖于U(t)之外,还依赖于状态初值X(t0)。因此,性能指标可记为 特别是当控制作用为最优值U*(t)时,性能指标记为 第21页/共130页222023/3/13 命题命题6.2.2 6.2.2 有限时间状态调节器问题的最优控制有限时间状态调节器问题的最优控制U U*(t t)的充的充要条件是:要条件是:且性能指标的最小值
18、为:证明:命题6.2.2的前半部分,即关于最优调节作用的充分性,在第三章最大值原理的推论中已经证明了。在那里,我们曾经指出,对于线性系统(6.2.1)来说,最大(小)值原理是使性能指标(6.2.2)达到最小值的必要和充分条件。因此,下面只证明命题6.2.2的后半部分 因为 第22页/共130页232023/3/13 将系统状态方程(6.2.1)和黎卡提微分方程(6.2.4)代入上式,经整理得 分别对上式两边进行积分0第23页/共130页242023/3/13 上式进一步整理得 所以,性能指标的最小值为 第24页/共130页252023/3/13 由于R是正定矩阵,上式最后一个等号的右端第二项是
19、非负的,故当 第25页/共130页262023/3/13 时,性能指标JX(t0),U(t)达到最小值,且为 QED 说明:由命题6.2.2可知,若初始时刻为t,初始状态为X(t),则性能指标的最小值为 第26页/共130页272023/3/13 命题命题6.2.3 6.2.3 有限时间状态调节器问题的最优控制有限时间状态调节器问题的最优控制U U*(t t)存在存在且唯一。且唯一。证明:1关于存在性关于存在性由于U*(t)=R1BTP(t)X(t),而P(t)是存在的,故U*(t)亦存在。2关于唯一性关于唯一性 应用反证法。设U*(t)不是唯一的,并设U*(t)和 均为最优控制,则由P(t)
20、的唯一性,得 将上述两个式子分别代入系统状态方程(6.2.1),得第27页/共130页282023/3/13 由此可知,X(t)及 乃是同一微分方程在同一边界条件下的解。根据微分方程在给定边界条件下解的唯一性,有 从而有 QED 综合命题6.2.1、命题6.2.2和命题6.2.3,可得如下定理:*定理定理6.2.16.2.1 *给定线性定常系统的状态方程 其中U(t)不受约束。初始条件X(t0)=X0和性能指标 则最优控制存在且唯一,最优控制的充要条件充要条件是 第28页/共130页292023/3/13 其中P(t)是矩阵黎卡提微分方程矩阵黎卡提微分方程 满足边界条件边界条件 的唯一对称解唯
21、一对称解。并且,当Q为半正定对称矩阵时,P(t)(t0ttf)是半正定对称矩阵;而当Q为正定对称矩阵时,P(t)是正定对称矩阵。性能指标的最小值为 状态最优轨线是下列状态方程 满足初始条件X(t0)=X0的解。第29页/共130页302023/3/13 例6.2.1 设调节对象的状态方程为:性能指标为 其中q0,r0,要求确定最优调节作用和状态最优轨线。解:这是有限时间状态调节器问题,所以 其中p(t)满足方程 第30页/共130页312023/3/13 利用分离变量法分离变量法解此方程,得 由此得 其中 状态最优轨线是下列状态方程(6.2.6)第31页/共130页322023/3/13 的解
22、。解此方程得 最优调节的闭环系统之方程图如图62所示。图中表示信号相乘。虚线部分表示p(t)的求解装置,p(0)可由式(6.2.6)求得。特别当tf=1,x(0)=1,q=1,a=1,而r分别为1,0.1和0.02时,其最优调节作用u*(t),最优轨线x*(t)和黎卡提方程的解p(t)如图63所示。第32页/共130页332023/3/13图6-2第33页/共130页342023/3/13图图6-36-3第34页/共130页352023/3/13 对图63的说明:由图63(a)可见,当r很小时,意即控制作用的价值并不重要,控制轨线x(t)将迅速回到零;当r很大时,意即控制作用的价值十分重要,状
23、态轨线x(t)将衰减得很慢。如图63(b)可见,随着r的减小,在控制区间0,1起始部分的控制变量的幅值变得很大;当r趋于零时,控制变量逐渐演变成为t=0时的脉冲。由图63(c)可见,随着r的减小,p(t)在控制区间0,1的起始部分几乎是一常数;当r减小时,p(t)仅仅在控制区间的最后部分才表现出时变的性质;随着r的增大,p(t)就成为真正的时变了。第35页/共130页362023/3/13本节几点说明 若性能指标为 其中S为半正定对称矩阵,QQ、R R假设同前假设同前,则定理6.2.1仍然成立,但是,边边界条件应改为界条件应改为 这是由于在这种情况下 又考虑 所以 第36页/共130页3720
24、23/3/13 如果给定的是时变系统是时变系统 且性能指标为 假设A(t),B(t),Q(t)和R(t)的诸元素都是t t(t t0 0 t t t tf f)的连续函数的连续函数,并且A(t),B(t),Q(t),R(t)和R-1(t)都是有界的,则定理6.2.1仍然成立,只要将A,B,Q和R分别改为A(t),B(t),Q(t)和R(t),边界条件由P(tf)=0改为P(tf)=S即可。第37页/共130页382023/3/136.3 无限时间的状态调节器问题 在6.2节讨论的状态调节器问题中,所得到最优调节作用是状态变量的线性函数,可以实现状态反馈的闭环控制。但是,其反馈增益矩阵反馈增益矩
25、阵 却是时变时变的。这在工程实现上是极不方便的。如果我们能够得到定常的反馈增益矩阵,那将给工程实现带来极大的方便。从下面的讨论中将会看到,当线性定常系统是完全可控的,并且终端时刻tf趋于无限时,就可得到非时变的状态调节器,即这时的反馈增益矩阵是一个定常矩阵。第38页/共130页392023/3/13 问题6.3.1 给定完全可控完全可控线性定常系统的状态方程和初始条件 以及性能指标 其中Q和R都是定常对称正定矩阵定常对称正定矩阵。假定U(t)不受约束,要求确定最优调节作用U*(t),使性能指标(6.3.2)达到最小值。该问题与上一节所讨论的问题相类似,也是一种状态调节器问题,但是,由于终端时刻
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 二次 最优 控制 问题
限制150内