线性二次型最优控制问题幻灯片.ppt
线性二次型最优控制问题第1页,共94页,编辑于2022年,星期一1主主 要要 内内 容容5.1 5.1 线性二次型性能指标线性二次型性能指标5.2 5.2 状态调节器问题状态调节器问题有限时间状态调节器问题有限时间状态调节器问题无限时间状态调节器问题无限时间状态调节器问题5.3 5.3 输出调节器问题输出调节器问题5.4 5.4 跟踪问题跟踪问题第2页,共94页,编辑于2022年,星期一25.1 5.1 线性二次型性能指标线性二次型性能指标性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。可以兼顾系统性能指标的多方面因素:快速性、能量消耗、终端准确性、灵敏度和稳定性等。许多控制问题都可作为线性二次型最优控制问题来处理。线性二次型最优控制问题:线性系统具有二次型性能指标的最优控制问题,具有以下特性:线性二次型最优控制问题在实践上得到了广泛而成功的应用!第3页,共94页,编辑于2022年,星期一3问题问题5.1.1 给定线性时变系统的状态方程和输出方程 Yr(t)表示预期输出变量,则有 e(t)=Yr(t)Y(t)称为误差向量。其中,X(t)是n维状态变量,U(t)是m维控制变量,Y(t)是r维输出变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。假设1rmn,U(t)不受约束。(5.1.1)第4页,共94页,编辑于2022年,星期一4 选择最优控制U*(t)使下列二次型性能指标为最小线性二次型最优控制问题。其中,S:r r半正定对称常数矩阵,Q(t):r r半正定对称时变矩阵,R(t):m m正定对称时变矩阵.终端时间tf是固定的,终端状态X(tf)自由。(5.1.2)第5页,共94页,编辑于2022年,星期一5若C(t)=I(单位矩阵),Yr(t)=0,则 于是性能指标变为线性二次型最优控制问题的几种特殊情况问题归结为:用不大的控制能量,使系统状态X(t)保持在零值附近状态调节器问题状态调节器问题。第6页,共94页,编辑于2022年,星期一6线性二次型最优控制问题的几种特殊情况 若Yr=0,则 于是性能指标变为 这时问题归结为:用不大的控制能量,使系统输出Y(t)保持在零值附近输出调节器问题输出调节器问题。第7页,共94页,编辑于2022年,星期一7若Yr(t)0,则 于是性能指标可写为 这时问题转化为:用不大的控制量,使系统输出Y(t)紧紧跟随Yr(t)的变化跟踪问题跟踪问题。第8页,共94页,编辑于2022年,星期一8 性能指标的物理意义 性能指标中的第一部分 称作终端代价,用它来限制终端误差e(tf),以保证终端状态X(tf)具有适当的准确性。性能指标中的第二部分 称作过程代价,用它来限制控制过程的误差e(t),以保证系统响应具有适当的快速性。第9页,共94页,编辑于2022年,星期一9性能指标中的第三部分 称作控制代价,用它来限制控制U(t)的幅值及平滑性,以保证系统安全运行。同时,它对限制控制过程的能源消耗也能起到重要的作用,从而保证系统具有适当的节能性。整个性能指标物理意义:整个性能指标物理意义:使系统在控制过程中的动态误差与能量消耗,以及控制结束时的系统稳态误差综合最优.第10页,共94页,编辑于2022年,星期一10(1)二次型性能指标是一种综合型性能指标,它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。说明:(2)线性二次型最优控制问题的实质是:用不大的控制能量,来保持较小的输出误差,以达到控制能量和误差综合最优的目的。(3)控制时间的起点t0及终点tf,可能是由实际问题决定的客观参数,也可能是由设计者决定的主观参数设计者必须把希望达到的目标和t0、tf的选择联系起来。第11页,共94页,编辑于2022年,星期一11 (3)不同目标之间,往往存在着一定矛盾。为能尽快消除误差并提高终端准确性,就需较强的控制作用及较大的能量消耗;而抑制控制作用的幅值和降低能耗,必然会影响系统的快速性和终端准确性合理折衷。(4)无论容许控制如何选择,性能指标中各项的数值始终具有相同的符号。以极小值作为最优标准,结合问题的物理性质,各项符号均取正值。第12页,共94页,编辑于2022年,星期一12性能指标中加权矩阵S,Q(t)和R(t)(1)加权矩阵中的各个元素之间的数值比例关系,将直接影响系统的工作品质。l提高S阵中某一元素的比重,说明更加重视与该元素对应的状态分量的终端准确性;l提高Q(t)阵中某一元素的比重,说明希望与之对应的状态分量具有较好的快速响应特性(较小的暂态误差);l提高R(t)阵中某一元素的比重,意味着需要更有效地抑制与之相应的控制分量的幅值及由它引起的能量消耗。安排各加权阵的各个元素之间的关系,十分重要且十分困难!第13页,共94页,编辑于2022年,星期一13(2)S取半正定,Q(t)取半正定,R(t)必须取正定。l将S阵取为半正定,以便保证终端代价的非负性,但容许不考虑与之相应的终端误差。lQ(t)取半正定,以便保证暂态误差总和的非负性,但容许不考虑与之相应的暂态误差。lR(t)必须取正定,因为控制代价实际上反映控制过程的能量消耗。只要U(t)不为零,控制过程中能量消耗当然不应等于零。第14页,共94页,编辑于2022年,星期一14(3)由于终端代价只表示终端时刻tf时的性能,因此,S应为常数阵。至于Q(t)及R(t),可能取为常数阵,也可能取为时变阵为了适应控制过程的特殊需要。l在控制过程的初期出现的较大误差,并非系统品质不佳所致,而是由系统的初始条件引起的,因此,不必过分重视这种误差,以免引起控制作用U(t)不必要的过大冲击;控制过程的后期的误差直接与控制效果相关,必须给予足够的重视。只有把Q(t)和R(t)取为时变阵,才能适应控制过程的这类时变需求。l为了防止模型的失调,也需要Q(t)及R(t)具有时变性质。第15页,共94页,编辑于2022年,星期一15对容许控制U(t)和终态X(tf)的说明(1)在线性二次型问题的定义中,并没有直接提出对控制作用U(t)的不等式约束,但这并不等于在物理上不需要对U(t)进行必要的限制。实际上,用适当选择Q(t)和R(t)数值比例的方法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就可以在保持闭环系统线性性质的前提下,实现对U(t)的限制。(2)在定义问题时,也没有直接提出对终态X(tf)的要求。实际上,对终态的要求,是利用性能指标的终端代价来反映的,性能指标中的终端代价用于限制终端误差,它表明期望终态X(tf)尽量靠近误差信号e(t)=0所对应的状态。第16页,共94页,编辑于2022年,星期一165.25.2 状态调节器问题问题问题5.2.1 给定线性时变系统的状态方程和初始条件 其中X(t)是n维状态变量,U(t)是m维控制变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。性能指标是 其中,Q(t)是nn非负定对称的时变矩阵,R(t)是mm正定对称的时变矩阵,tf是给定的有限终端时刻有限终端时刻,X(tf)是自由自由的终端状态的终端状态,控制函数U(t)不受约束。(5.2.1)一、有限时间状态调节器问题(5.2.2)第17页,共94页,编辑于2022年,星期一17要求确定最优控制函数U*(t),使性能指标 达到最小值。l该最优控制问题是以较小的控制能量为代价,使状态变量X(t)保持在零值附近状态调节器问题;l考虑到终端时间tf是有限的,故称为有限时间状态调节器问题;l相应的最优控制U*(t)称为最优调节作用或最优调节器。第18页,共94页,编辑于2022年,星期一18解:构造Hamilton函数 因为控制函数U(t)本身不受约束,所以有(5.2.3)应用最小值原理来求解:最优调节作用是协态变量(t)的线性函数。由于协态变量在实际系统中不存在,也无法检测到,式(5.2.3)的最优调节作用在工程上难以实现。第19页,共94页,编辑于2022年,星期一19 其中,P(t)是nn待定的时变矩阵。对上式两边求导数,得 为了便于在工程上实现,需将调节作用U(t)表示成系统状态变量X(t)的函数。令:规范方程 为:第20页,共94页,编辑于2022年,星期一20 由于X(t)是任意的,所以有 由于终端状态X(tf)是自由的,故相应的协态变量的 终端值为 所以,矩阵黎卡提(Riccati)微分方程矩阵黎卡提(Riccati)微分方程的边界条件(5.2.4)又考虑第21页,共94页,编辑于2022年,星期一21P(t)的3个重要性质由微分方程理论的存在与唯一性定理,可以证明P(t)存在而且唯一。对于任意的tt0,tf,P(t)均为对称阵,即P(t)PT(t)。若R(t)是正定正定矩阵,Q(t)是半正定半正定矩阵,则P(t)(t0ttf)是半正定半正定矩阵;若R(t)是正定正定矩阵,Q(t)是正定正定矩阵,则P(t)(t0ttf)是正定正定矩阵。证明附后证明附后第22页,共94页,编辑于2022年,星期一22对于任意的tt0,tf,P(t)均为对称阵,即P(t)PT(t)证明:将矩阵Riccati微分方程(5.2.4)两边转置,得:且边界条件为:也就是说,待定的时变矩阵P(t)及其转置PT(t)满足相同的微分方程和相同的边界条件。根据微分方程解的唯一性定理,得P(t)PT(t)。由P(t)的对称性可知,式(5.2.4)中虽包含有n个标量方程,但是,其中只有n(n+1)/2个方程是独立的。第23页,共94页,编辑于2022年,星期一23若R是正定矩阵,Q是半正定矩阵,则P(t)(t0ttf)是半正定矩阵;若R是正定矩阵,Q是正定矩阵,则P(t)(t0ttf)是正定矩阵。证明:对于任意非零的初态X(t)(t0ttf),性能指标的最小值为:由于R是正定的,若Q是半正定的,则式(5.2.5)右端大于等于零,于是 故P(t)是半正定的。(5.2.5)若Q是正定矩阵,则式(5.2.5)右端大于零,于是 所以P(t)是正定的。第24页,共94页,编辑于2022年,星期一24命题命题5.2.1 问题5.2.1的最优调节作用必为如下形式的状态反馈 其中,P(t)是矩阵黎卡提微分方程 满足边界条件 的对称解。满足初始条件的解。并且状态最优轨线X*(t)是状态方程第25页,共94页,编辑于2022年,星期一25 若令 ,则有 其中,K(t)称为反馈增益矩阵。构成一个状态反馈最优调节系统,如图所示。第26页,共94页,编辑于2022年,星期一26 说明说明:设U(t)是任意的控制作用,X(t)是相应于U(t)的状态轨线,性能指标 除了依赖于U(t)之外,还依赖于状态初值X(t0)。因此,性能指标可记为 特别是当控制作用为最优值U*(t)时,性能指标记为 第27页,共94页,编辑于2022年,星期一27命题命题5.2.2 有限时间状态调节器问题的最优控制U*(t)的充要条件充要条件是:且性能指标的最小值为:(证明略)(证明略)命题命题5.2.3 有限时间状态调节器问题的最优控制U*(t)存在且唯一存在且唯一。证明:1存在性由于U*(t)=R1BTP(t)X(t),而P(t)是存在的,故U*(t)亦存在。2唯一性 应用反证法。(略)第28页,共94页,编辑于2022年,星期一28定理定理5.2.1 给定线性时变系统的状态方程 其中,U(t)不受约束。其中,P(t)是矩阵黎卡提微分方程满足边界条件的唯一对称解。则最优控制存在且唯一,最优控制的充要条件是:初始条件X(t0)=X0,性能指标为:第29页,共94页,编辑于2022年,星期一29 并且,当Q为半正定对称矩阵时,P(t)(t0ttf)是半正定对称矩阵;而当Q为正定对称矩阵时,P(t)是正定对称矩阵。满足初始条件X(t0)=X0的解。状态最优轨线是下列状态方程性能指标的最小值为第30页,共94页,编辑于2022年,星期一30定理定理5.2.1的几点说明:的几点说明:l线性二次型最优控制律是一个线性状态反馈状态反馈控制律,便于实现闭环最优控制;l只要时间区间 t0,tf是有限的,Riccati方程的解P(t)就是时变时变的,最优反馈系统为线性时变系统,即使矩阵A,B,Q,R为常数矩阵线性定常系统且Q,R为常数矩阵,P(t)仍时变.第31页,共94页,编辑于2022年,星期一31l如果给定线性时变系统定理定理5.2.15.2.1应作如何调整?应作如何调整?性能指标为:边界条件由P(tf)=S改为P(tf)=0即可。第32页,共94页,编辑于2022年,星期一32lRiccati方程为非线性矩阵微分方程lP(t)的解析解lP(t)的数值解第33页,共94页,编辑于2022年,星期一33例例5.2.1 泛函求极值 试求矩阵Riccati微分方程的解析解P(t)以及Kalman增益K(t)。s.t.第34页,共94页,编辑于2022年,星期一34例例5.2.2 泛函求极值 试求Kalman增益K(t),并观察tf对K(t)的影响。s.t.第35页,共94页,编辑于2022年,星期一35l(1)l(2)l(3)第36页,共94页,编辑于2022年,星期一36%(1)tf=10,P(tf)=k=0 S=dsolve(Dp=p+p2-2,p(10)=0)t=0:0.1:10;K=double(subs(S);plot(t,K,k);axis(0,10,0,2)xlabel(t(sec.)ylabel(K(t)gtext(t_f=10,k=0)hold on用MATLAB绘制K(t):第37页,共94页,编辑于2022年,星期一37例例5.2.3 设调节对象的状态方程为:其中s0,q0,r0,要求确定最优调节作用和状态最优轨线。性能指标为第38页,共94页,编辑于2022年,星期一38l由积分方程得其中第39页,共94页,编辑于2022年,星期一39最优调节作用:状态最优轨线:第40页,共94页,编辑于2022年,星期一40最优调节的闭环系统方框图:第41页,共94页,编辑于2022年,星期一41r=1.00.2P(t)1.000.5t0.4r=0.5r=0.1r=0.02P(t)变化曲线第42页,共94页,编辑于2022年,星期一42r=1000.5x(t)1.000.5t1.0r=1.0r=0.2r=0.02x(t)变化曲线第43页,共94页,编辑于2022年,星期一430.5-3-5-1r=0.02r=0.1r=1tu(t)u(t)变化曲线第44页,共94页,编辑于2022年,星期一44不同终端时刻tf下的p(t)曲线S=10.2P(t)1059t30.40.61.00.8S=0tf=1tf=3tf=5tf=9ntf越大,P(t)保持恒定值的时间区间越大。n只要把tf取得足够大,在t0,tf的大部分时间内,P(t)可视为恒定。第45页,共94页,编辑于2022年,星期一45例例5.2.4 设调节对象的状态方程为:求最优控制u*(t)使得性能指标为最小。性能指标为:初始条件为:并通过Simulink画出x1,x2及u在0,3s内变化曲线。求矩阵Riccati微分方程的解P(t)。第46页,共94页,编辑于2022年,星期一46Riccati方程为非线性矩阵微分方程,通常无法获得其解析解,只能采用计算机逆时间方法求数值解!微分方程个数?第47页,共94页,编辑于2022年,星期一47例例5.2.5 泛函求极值 s.t.试求矩阵Riccati微分方程的解P(t)。第48页,共94页,编辑于2022年,星期一481、在已定义好的用户目录下,建立M文件,用来存入微分方程(组),无初始条件。2、把用户目录设置为当前目录。3、建立M文件,用函数ode45求解微分方程,并画出P(t)。在MATLAB中求解上述微分方程步骤:第49页,共94页,编辑于2022年,星期一49第50页,共94页,编辑于2022年,星期一50二、无限时间状态调节器问题 有限时间状态调节器问题中,所得到最优调节作用是状态变量的线性函数,可以实现状态反馈的闭环控制。但是,其反馈增益矩阵反馈增益矩阵却是时变的。工程实现上是极不方便的。定常的反馈增益矩阵,易于工程实现。当线性定常系统是完全可控的,并且终端时刻tf趋于无限时,就可得到非时变的状态调节器,此时的反馈增益矩阵是一个定常矩阵。1、无限无限时间定常定常状态调节器 第51页,共94页,编辑于2022年,星期一51问题问题5.2.2 给定完全可控线性定常系统的状态方程和初始条件 以及性能指标 其中Q和R都是定常对称正定正定矩阵。假定U(t)不受约束,要求确定最优调节作用U*(t),使性能指标达到最小值。注意:终端时刻tf为无限值,故称为无限时间状态调节器问题,也称为非时变状态调节器问题。第52页,共94页,编辑于2022年,星期一52 由定理5.2.1可知,对于给定的系统 使性能指标 达到最小值的最优调节作用为 其中,P(t)是矩阵黎卡提微分方程满足边界条件 的正定对称解。无限时间的状态调节器问题,可看作有限时间的状态调节器问题中,令tf时的极限情况来处理:第53页,共94页,编辑于2022年,星期一53可以证明:正定对称矩阵P(t)的每个元素pij(t)(i,j=1,2,3,n)随时间变化的情况如下图所示。当tf很大时,随着t的减小pij(t)将达到稳定值 ,并且随着tf的增加,此稳态值的时间区间将加宽。当tf时,此稳态值的时间区间也将趋于无穷大。而当给定的系统完全可控时 第54页,共94页,编辑于2022年,星期一54 当tf时,矩阵黎卡提微分方程就转化为矩阵黎卡提(Riccati)代数方程:所以系统 在性能指标为性能指标可表示为 时的最优调节作用为第55页,共94页,编辑于2022年,星期一55的唯一正定对称唯一正定对称解。定理定理5.2.2 给定线性定常系统的状态方程和初始条件 其中,A,B为定常矩阵,系统(A,B)完全可控完全可控,控制函数U(t)不受约束。性能指标为 使性能指标J达到最小值的最优调节作用为其中,是矩阵黎卡提代数方程代数方程其中,Q和R是定常对称正定正定矩阵。第56页,共94页,编辑于2022年,星期一56满足初始条件 的解。而状态最优轨线X*(t)是状态方程 性能指标的最小值最小值为第57页,共94页,编辑于2022年,星期一57说明说明:l为保证积分值有限,x和u均要收敛到0。如果系统可控,则可通过状态反馈任意配置闭环极点,使系统AS,即:对于无限时间状态调节器,终端状态必须为零,即X()=0。l要求系统完全可控,是为了为了保证性能指标的积分为有限值,从而保证最优解存在;l由于X()=0,所以在性能指标中设置终端代价是多余的。l线性定常系统无限时间状态调节器所构造的闭环系统是时不变的。第58页,共94页,编辑于2022年,星期一58证明:利用反证法来证明该定理。定理定理5.2.3 定理5.2.2中的闭环最优调节系统是渐进稳定的。假设系统不是渐进稳定的,则A1必具有非负实部的特征根。于是,当tf时,状态变量X(t)不会趋于零令第59页,共94页,编辑于2022年,星期一59定常矩阵定常矩阵 的计算方法的计算方法直接求解黎卡提代数方程首先求解黎卡提微分方程 得到其解为 然后令tf,t=0或者tf=0,t,则可得到 。第60页,共94页,编辑于2022年,星期一602、无限时间时变时变状态调节器 问题问题5.2.3 给定线性时变系统的状态方程和初始条件 及性能指标控制向量u(t)无约束.确定最优控制u(t)使指标达到极小.第61页,共94页,编辑于2022年,星期一61定理定理5.2.4 若系统A(t),B(t)完全可控完全可控,其中,则存在唯一的最优控制:最优性能指标为:P(t)满足Riccati矩阵微分方程:正定对称正定对称注意:注意:对于有限和无限时间时变状态调节器,最优控制增益都是时变矩阵,最优控制都是时变的。第62页,共94页,编辑于2022年,星期一62例例5.2.6 二阶系统的状态方程:最优控制u*(t)应使性能指标 取极小值。试求出最优控制u*(t),并绘出最优反馈系统的结构图。第63页,共94页,编辑于2022年,星期一63最优控制为最优控制为:Riccati代数方程:第64页,共94页,编辑于2022年,星期一64系统的最优反馈结构图:第65页,共94页,编辑于2022年,星期一65例例5.2.7 已知系统状态方程:性能指标已知 求最优控制u*(t).第66页,共94页,编辑于2022年,星期一66x1(t)-x2(t)+Riccati代数方程:第67页,共94页,编辑于2022年,星期一67以a为参数的系统根轨迹a=1.5a=2a=0ja=1.5a=3a=3a=0第68页,共94页,编辑于2022年,星期一68状态调节器稳定性能的改善引入积分作用状态调节器是一个比例调节器,因而系统最后稳定时存在余差。设线性定常系统状态方程为设希望有积分作用的那些状态变量构成的一个p维向量,令其中,E为元素为0或1的pn矩阵。利用构成一个n+p维的增广状态变量:第69页,共94页,编辑于2022年,星期一69从而得到增广状态方程为其中性能指标为最优状态调节器为:从而引进了积分作用,使闭环系统稳态误差得以改善。第70页,共94页,编辑于2022年,星期一705.3 输出调节器问题问题问题5.3.1 给定完全可观测的线性时变系统(LTV)的状态方程和输出方程 以及性能指标 其中,S、Q(t)是半正定对称矩阵,R(t)是正定对称矩阵,tf是有限的终端时刻,控制函数U(t)不受约束。要求确定最优调节作用U*(t),使性能指标达到最小值。输出调节器问题:其实质是用不大的控制能量,使输出变量Y(t)保持在零值附近。1 1、有限时间输出调节器问题、有限时间输出调节器问题第71页,共94页,编辑于2022年,星期一71考虑到输出方程,性能指标可写为:加权矩阵为S、Q(t)的有限时间输出调节器问题加权矩阵为S、Q(t)的有限时间状态调节器问题可以利用有限时间状态调节器定理5.2.1来求解!第72页,共94页,编辑于2022年,星期一72注意:注意:要求系统A(t),C(t)在t0时刻必须是完全可观测的!第73页,共94页,编辑于2022年,星期一73引理引理:若系统 完全可观,且S、Q(t)是半正定对称矩阵,则有:第74页,共94页,编辑于2022年,星期一74定理定理5.3.1 已知线性时变系统的状态方程为:性能指标为则能使系统从初态 转移到终态 ,并使性能指标最小的最优控制 存在且唯一:若系统A(t),C(t)在t0时刻必须是完全可观测的,第75页,共94页,编辑于2022年,星期一75其中,是nn对称矩阵,其值为黎卡提微分方程的唯一解,满足的边界条件为系统的最优轨线是以下微分方程的解:性能指标的最小值为第76页,共94页,编辑于2022年,星期一76最优输出调节器系统的结构图x(t)u(t)y(t)C(t)第77页,共94页,编辑于2022年,星期一77有限时间输出调节器问题:(1)最优输出调节器仍是全状态反馈;(2)若系统完全可观,则可由 经状态观测器复现;(3)若系统不完全可观,则部分 无法复现,只能用输出反馈代之,这样必然会丢失部分信息,输出反馈能达到的最小性能指标总要大于状态反馈能达到的最小性能指标,从而使设计出的调节器为次优调节器。(4)状态调节器与输出调节器的Riccati方程不全相同,故其解 也不同,反馈增益矩阵 也不同。(5)性能指标最小值也不能由输出向量来确定,只能由状态向量确定。第78页,共94页,编辑于2022年,星期一782、无限时间的输出调节器问题、无限时间的输出调节器问题 性能指标为:目标为:确定最优控制u,使要求的指标达到极小.给定线性定常系统(LTI)的状态方程和输出方程第79页,共94页,编辑于2022年,星期一79同时要求系统(A,B,C)是完全可控和完全可观测的!无限时间的状态调节器问题无限时间的输出调节器问题第80页,共94页,编辑于2022年,星期一80线性定常 输出调节器 若系统是完全能控能观完全能控能观的,使性能指标定理定理5.3.2 已知线性定常系统的状态方程及初始状态取最小的最优控制 为第81页,共94页,编辑于2022年,星期一81性能指标的最小值为 其中,Q和R是定常的正定对称矩阵,P满足以下Riccati代数方程:最优轨线 是下列方程的解:第82页,共94页,编辑于2022年,星期一82例例5.3.1 受控系统的传递函数为:性能指标为:试求解并绘出最优反馈结构。解:令(4.4.4)第83页,共94页,编辑于2022年,星期一83 则得系统的状态方程和输出方程为 所以 由于 第84页,共94页,编辑于2022年,星期一84 所以 故该系统(A,B,C)是完全可控和完全可观测的。又由于R=r0是正定的,最优调节作用为 第85页,共94页,编辑于2022年,星期一85 其中P是下列黎卡提代数方程的正定对称解 考虑到P为对称的,所以 。根据上面矩阵方程,可得下面代数方程组 第86页,共94页,编辑于2022年,星期一86 因为P是正定的,所以 解上面代数方程组,得到 故最优调节作用为 正定,各阶主子式大于零第87页,共94页,编辑于2022年,星期一87 系统的最优反馈结构如图所示,第88页,共94页,编辑于2022年,星期一88 问题问题5.4.1 给定完全可观测的线性时变系统(LTV)的状态方程和输出方程 跟踪问题:用不大的控制能量,使系统输出变量Y(t)跟踪Yr(t)的变化,称为跟踪问题。1、有限时间时变跟踪问题5.4 5.4 跟踪问题跟踪问题Yr(t)表示预期输出变量,则有 e(t)=Yr(t)Y(t)称为误差向量。其中,S、Q(t)半正定对称矩阵,R(t)正定对称矩阵,tf是有限的终端时刻,控制函数U(t)不受约束。以及性能指标 要求确定最优调节作用U*(t),使性能指标达到最小值。第89页,共94页,编辑于2022年,星期一89 解:应用最小值原理来求解这个问题,首先构造Hamilton函数:第90页,共94页,编辑于2022年,星期一90定理定理5.4.1 已知线性时变系统的状态方程为:性能指标为使性能指标最小的最优控制 存在且唯一:若系统A(t),C(t)是完全可观测的,第91页,共94页,编辑于2022年,星期一91 其中,是nn半正定对称矩阵,其值为黎卡提微分方程系统的最优轨线是以下微分方程的解:的唯一解,满足的边界条件为g(t)为n维伴随向量,满足如下方程:边界条件为第92页,共94页,编辑于2022年,星期一92若系统是完全能控能观完全能控能观的,使性能指标定理定理5.4.2 已知线性定常系统的状态方程及初始状态取最小的近似最优控制 为2、无限时间定常跟踪问题r其中,第93页,共94页,编辑于2022年,星期一93例5.4.1已知状态方程:性能指标:求近似最优控制u(t),其中e=a-y,a为常值.第94页,共94页,编辑于2022年,星期一94