线性系统二次型指标的最优控制线性二次型问题ppt课件.ppt
《线性系统二次型指标的最优控制线性二次型问题ppt课件.ppt》由会员分享,可在线阅读,更多相关《线性系统二次型指标的最优控制线性二次型问题ppt课件.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第五章第五章 线性系统二次型指标的最优控制线性系统二次型指标的最优控制 线性二次型问题线性二次型问题返回主目录经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n5.1 引言引言n5.2 线性二次型问题的提法线性二次型问题的提法n5.3 终端时间有限时连续系统的状态调节器问题终端时间有限时连续系统的状态调节器问题n5.4 稳态时连续系统的状态调节器问题稳态时连续系统的状态调节器问题n5.
2、5 离散系统的线性二次型问题离散系统的线性二次型问题n5.6 伺服跟踪问题伺服跟踪问题n5.7 设计线性二次型最优控制的若干问题设计线性二次型最优控制的若干问题n5.8 小结小结经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用5.1 引言引言 用极小值原理解非线性系统的最优控制将导致用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类问题求解是很困难的。非线性两点边值问题,这类问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最即使系统是线性的,但当指标函数是最短时间、最少燃料这种形式,要
3、求得到最优控制的解析表达式,少燃料这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把并构成反馈控制(即把 表示为表示为 的函数)的函数)也是非常困难的。也是非常困难的。返回子目录返回子目录经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 的确定归结为求解一个非线性矩阵黎卡提(Riccati)微分方程或代数方程。而黎卡提方程的求解已研究得很透彻,有标准的计算机程序可应用,因此,求解既规范又方便。这种问题简称为线性二次型(Linear Quadratic 简称LQ)问题,目前应用得十分广泛,是现代控制理论最
4、重要的结果之一。下面我们将看到,若系统是线性的,指标函数是下面我们将看到,若系统是线性的,指标函数是二次型的(指标函数是二次型的(指标函数是 和和 的二次函数),的二次函数),则可以求得线性最优反馈控制律则可以求得线性最优反馈控制律 。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 线性二次型问题的实用意义还在于:例如,在飞行器的轨迹优化问题中,根据飞行器的状态方程(一般是非线性的)用极小值原理计算出名义的最优控制和最优状态轨迹,设分别 用 和 表示。把它所得到的最优反馈控制与非线性系统的开环把它所得到的最优反
5、馈控制与非线性系统的开环最优控制结合起来,可减小开环控制的误差,达到更最优控制结合起来,可减小开环控制的误差,达到更精确的控制的目的。精确的控制的目的。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 因为状态方程只能是对飞行器实际动力学特性的近似描绘,这里存在着模型误差,把 加到飞行器上去,所产生的实际状态 将不同于 (这里我们还未考虑作用在飞行器上的其它扰动作用)。(这里我们还未考虑作用在飞行器上的其它扰动作用)。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消
6、费者购买商品的价款或接受服务的费用 令状态误差为令状态误差为 ,我们要使我们要使 愈小愈好,为此,可根据愈小愈好,为此,可根据 构构成一个最优反馈控制成一个最优反馈控制 ,作为校正信号加到,作为校正信号加到 上去,得到的实际控制信号上去,得到的实际控制信号 将使飞行器尽可能沿着将使飞行器尽可能沿着 飞行。飞行。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 由于由于 、应该比较小,它们应该比较小,它们将满足线性的状态方程,所以可用线性二次型问将满足线性的状态方程,所以可用线性二次型问题设计出反馈控制题设计出反馈
7、控制 。我们可用图我们可用图5-1表示上面的思想。表示上面的思想。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n 图图5-1 线性二次最优反馈控制的应用线性二次最优反馈控制的应用经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用5.2 线性二次型问题的提法线性二次型问题的提法n一般情况的线性二次型问题可表示如下:其中,其中,为为 维状态向量,维状态向量,为为 维控制向量,维控制向量,为为 维输出向量。设维输出向量。设 不受约束。不
8、受约束。设线性时变系统的方程为设线性时变系统的方程为(5-15-1)(5-25-2)返回子目录返回子目录经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用其中,其中,为为 维理想输出向量。寻找最优控维理想输出向量。寻找最优控制,使下面的性能指标最小制,使下面的性能指标最小(5-4)令误差向量令误差向量 为为(5-35-3)其中,其中,是是 对称半正定常数阵,对称半正定常数阵,是是 对对称半正定阵称半正定阵,是是 对称正定阵。对称正定阵。一般将一般将 、取成对角阵。取成对角阵。经营者提供商品或者服务有欺诈行为的,应当
9、按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 下面对性能指标 中的每一项作一说明。因 为正定阵,则当 ,就有 。例如设 ,则 为正定阵,于是经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 它与消耗的控制能量成正比,消耗得越多,则性能指标值 越大。故性能指标中这一项表示了对消耗控制能量的惩罚。、可看作加权系数,如认为 的重要性大于 ,则可加大 。将 选成时间函数,是为了对不同时刻的 加权不一样。实际上,为了简单起见常选用常数阵 。经营者提供商品或者服务有欺诈行为的,应
10、当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 为半正定阵,则当 ,就有 ,表示误差平方和积分,故这项表示对系统误差的惩罚。表示对终端误差的惩罚,当对终端误差要求较严时,可将这项加到性能指标中。总之,性能指标总之,性能指标 最小表示了要用不大最小表示了要用不大的控制量来保持较小的误差,以达到能量和误差的控制量来保持较小的误差,以达到能量和误差的综合最优。的综合最优。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 这时这时 (单位阵),(单位阵),理想输出理想输出 ,
11、则,则 ,这时,问题归结为用不大的控制量使,这时,问题归结为用不大的控制量使 保保持在零值附近。因而称为状态调节器问题。持在零值附近。因而称为状态调节器问题。n下面讨论几种特殊情况:1)调节器问题。例如电机转速调节系统中,由于外加电压波动例如电机转速调节系统中,由于外加电压波动使转速偏离要求值,通过施加控制使转速偏差趋于使转速偏离要求值,通过施加控制使转速偏差趋于零。零。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 这时 ,这时要用不大的控制量使 跟踪 ,因而称为跟踪问题。例如,用雷达跟踪飞行器的运动,通过控
12、制使跟踪误差趋于零。n2)伺服机问题。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用5.3 终端时间有限时连续系统的状终端时间有限时连续系统的状态调节器问题态调节器问题要求寻找最优控制要求寻找最优控制 ,使,使 最小。这里最小。这里 无约束。无约束。、为对称半正定阵,为对称半正定阵,为对称为对称正定阵。终端时间正定阵。终端时间 为有限值。为有限值。(5-5)(5-6)考虑下面的系统状态方程和性能指标返回子目录返回子目录经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为
13、消费者购买商品的价款或接受服务的费用5.3.1 用极小值原理求解上面的问题用极小值原理求解上面的问题因因 无约束,故等同于用经典变分法求解。无约束,故等同于用经典变分法求解。取哈密顿函数为取哈密顿函数为协态方程为协态方程为最优解的必要条件如下:最优解的必要条件如下:(5-7)(5-8)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用因因 正定,故正定,故 存在,由上式可确定最存在,由上式可确定最优控制优控制 。为寻求最优反馈控制律还需把。为寻求最优反馈控制律还需把 与状态与状态 联系起来。联系起来。(5-9)控制
14、方程为经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 我们再一次遇到了两点边值问题(已知我们再一次遇到了两点边值问题(已知 和和 ),如前所述,一般要试凑),如前所述,一般要试凑 再积分协态方程再积分协态方程使使 满足要求。满足要求。但这里处理的是线性微分方程,可找到更简单但这里处理的是线性微分方程,可找到更简单的解法。从的解法。从(5-10)可见,协态可见,协态 和状态和状态 在终端在终端 时刻成线性关系。时刻成线性关系。(5-10)横截条件为经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其
15、受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 然后再来求出然后再来求出 (这种方法称为扫描法)。(这种方法称为扫描法)。将(将(5-11)代入()代入(5-9),再代入(),再代入(5-5),得),得(5-11)(5-12)(5-13)由(由(5-11)和()和(5-8)可得)可得这启发我们假定:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 上式对任意上式对任意 都应成立,故方括号内的项都应成立,故方括号内的项应为零,这就得出应为零,这就得出(5-14)将(5-12)代入(5-13)可得经
16、营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 上式是 的非线性矩阵微分方程,称为黎卡提(Riccati)矩阵微分方程。一般来说得不出 的解析表达式,但可用计算机程序算出 的数值解。为了求解 ,要知道它的边界条件。比较(5-11)和(5-10)可知 因此可从 到 逆时间积分黎卡提微分方程,求出 。由(5-9)和(5-11)就可构成最优反馈控制(5-15)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 又称为最优反馈增益矩阵。又称为
17、最优反馈增益矩阵。最优反馈系统的结构图如图最优反馈系统的结构图如图5-2所示。所示。(5-16)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 图5-2 最优反馈系统的结构图经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 注意到 与状态 无关,故可在系统未运行前,将 先计算出来(称为离线计算),把它存储在计算机中。在系统运行时,将在系统运行时,将 从计从计算机存储元件中取出,与同一时刻测量到的算机存储元件中取出,与同一时刻测量到
18、的 相乘,就可构成最优控制相乘,就可构成最优控制 。由此可见,系统运行时的计算量(称为在线计由此可见,系统运行时的计算量(称为在线计算量)只是一个乘法计算,故可用简单的微计算机算量)只是一个乘法计算,故可用简单的微计算机来完成。来完成。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用5.3.2 矩阵黎卡提微分方程的求解及的性质矩阵黎卡提微分方程的求解及的性质1、于是可用下面的差分方程来近似黎卡提微分方程于是可用下面的差分方程来近似黎卡提微分方程(5-17)矩阵黎卡提微分方程是非线性的,一般不能求得闭合形式的解。在
19、数字机上求解时,可用一阶差分代替微分经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用2、求解上式时,以求解上式时,以 为初始条件,取为初始条件,取 为负的小量,从为负的小量,从 到到 逆时间递推计算,即逆时间递推计算,即可出可出 。是对称矩阵,即 ,表示转置。这可证明如下:因为 、都是对称的,将(5-14)式转置一下,可得经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 因此 和 一样满足同一黎卡提方程,并且边界条件一样,即 。于是
20、,由微分方程解的唯一性可知 利用这个对称性,求利用这个对称性,求 维维 的元的元时,只需积分时,只需积分 个方程即可。个方程即可。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n3、即使系统是定常的,即系统矩阵A,输入矩阵B为常数阵,加权阵 和 也是常数阵,但 仍为时变阵。这从这从 是黎卡提微分方程的解可看出。是黎卡提微分方程的解可看出。时变时,反馈控制增益也时变,在实现时总是不太时变时,反馈控制增益也时变,在实现时总是不太方便。方便。下一段将看到,对线性定常系统,若终端时间下一段将看到,对线性定常系统,若终端
21、时间 ,且系统满足一些附加条件时,且系统满足一些附加条件时,将变为常数阵将变为常数阵 。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用例例5-1 设系统状态方程为设系统状态方程为(5-18)(5-19)寻找最优控制寻找最优控制 使下面的性能指标使下面的性能指标为最小。为最小。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用解考虑到考虑到 是对称阵,设是对称阵,设 为简单起见,上式右端省略了自变量为简单起见,上式右端省略了自变量 。
22、把上。把上面的面的 、和和 代入黎卡提方程代入黎卡提方程(5-14)式,可得)式,可得(5-20)(5-21)把状态方程(5-18)和(5-5)式相比较,把性能指标(5-19)和(5-6)式相比较,可得经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 令上式等号左右端的对应元相等,得令上式等号左右端的对应元相等,得(5-23)(5-22)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 由由 到到 逆时间积分上面的非线性微分方逆时间
23、积分上面的非线性微分方程组,即可求得程组,即可求得 。于。于是最优控制为是最优控制为(5-24)得得(5-25)这是一组非线性微分方程。由边界条件经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 、和和 随随时间变化的曲线可求出,如图时间变化的曲线可求出,如图5-3(a)、(b)、(c)所所示。示。图图5-3 、和和 的时间曲线的时间曲线 由图5-3可见,定常系统的反馈系数 、都是时变的。当 比系统的过渡过程时间大很多时,、只在接近 时才有较大的变化,其它时间接近于常数。当 时,、和 都趋于零,则黎卡提微分方程变
24、为黎卡提代数方程经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用解上面的方程组可得 、的稳态值于是最优控制律可表示为于是最优控制律可表示为(5-27)最优控制系统的结构图如图最优控制系统的结构图如图5-4所示。所示。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用图5-4 重积分系统最优控制的结构图经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用5.4
25、 稳态时连续系统的状态调节器问稳态时连续系统的状态调节器问题题 对于稳态问题,当系统状态方程和性能指标中对于稳态问题,当系统状态方程和性能指标中的加权阵满足一定条件时,可得出常数的最优反馈的加权阵满足一定条件时,可得出常数的最优反馈增益阵,这样在实现时非常方便,因此有很大的实增益阵,这样在实现时非常方便,因此有很大的实际意义。际意义。我们不加证明地列出下面的结果,然后再对我们不加证明地列出下面的结果,然后再对问题中的条件作一些说明。问题中的条件作一些说明。现在来研究工程实践中经常碰到的情况:系统是定常的,积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。返回子目录返回子目录经营者提供商品
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 系统 二次 指标 最优 控制 问题 ppt 课件
限制150内