最优控制与状态估计.ppt
《最优控制与状态估计.ppt》由会员分享,可在线阅读,更多相关《最优控制与状态估计.ppt(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、华东理工大学华东理工大学ECUSTECUST第一部分、最优控制第一部分、最优控制什么是最优控制?以下通过例子来说明什么是最优控制?以下通过例子来说明问题问题 1:电动机的运动方程为电动机的运动方程为(1)其中,其中,为转矩系数;为转矩系数;为转动惯为转动惯量;量;为恒定的负载转矩为恒定的负载转矩;希望:在时间区间希望:在时间区间0,tf内,电动机从静止起动,转过一定角度内,电动机从静止起动,转过一定角度后停止,使电枢电阻后停止,使电枢电阻 上的损耗上的损耗 最小,求最小,求因为因为 是时间的函数,是时间的函数,E 又是又是 的函数,的函数,E 是函数的函数,是函数的函数,称为泛函。称为泛函。(
2、2)华东理工大学华东理工大学ECUSTECUST采用状态方程表示,令采用状态方程表示,令于是于是(3)初始状态初始状态末值状态末值状态控制控制 不受不受限制限制性能指标性能指标(4)本问题的最优控制问题是:在数学模型(本问题的最优控制问题是:在数学模型(3)的约束下,寻求一个)的约束下,寻求一个控制控制 ,使电动机从初始状态转移到末值状态,性能指标,使电动机从初始状态转移到末值状态,性能指标E 为最小。为最小。华东理工大学华东理工大学ECUSTECUST问题问题 2:对于问题对于问题 1 中的直流他励电动机,如果电动机从初始中的直流他励电动机,如果电动机从初始时刻时刻 的静止状态转过一个角度的
3、静止状态转过一个角度 又停下,求控制又停下,求控制 (是受到限制的),使得所需时间最短。是受到限制的),使得所需时间最短。这也是一个最优控制问题:这也是一个最优控制问题:系统方程为系统方程为初始状态初始状态末值状态末值状态(5)性能指标性能指标(6)最优控制问题为:在状态方程的约束下,寻求最优控制最优控制问题为:在状态方程的约束下,寻求最优控制,将,将 转移到转移到 ,使,使J 为极小。为极小。华东理工大学华东理工大学ECUSTECUST最优控制问题的一般性提法为最优控制问题的一般性提法为系统状态方程为系统状态方程为初始状态为初始状态为其中,其中,x 为为n 维状态向量;维状态向量;u 为为r
4、 维控制向量;维控制向量;f 为为n 维向量函数,维向量函数,它是它是 x、u 和和t 的连续函数,并且对的连续函数,并且对x、t 连续可微。连续可微。最优。其中最优。其中 是是 x、u 和和t 的连续函数的连续函数 寻求在寻求在 上的最优控制上的最优控制 或或 ,以将系统状态从,以将系统状态从 转移到转移到 或或 的一个集的一个集合,并使性能指标合,并使性能指标最优控制问题就是求解一类带有约束条件的条件泛函极值问题。最优控制问题就是求解一类带有约束条件的条件泛函极值问题。华东理工大学华东理工大学ECUSTECUST第一章、用变分法求解最优控制问题第一章、用变分法求解最优控制问题一、泛函与变分
5、一、泛函与变分1、泛函的基本定义:、泛函的基本定义:如果对于某个函数集合如果对于某个函数集合 中的每一个函数中的每一个函数 ,变量,变量J 都都有一个值与之对应,则称变量有一个值与之对应,则称变量J 为依赖于函数为依赖于函数 的泛函,记的泛函,记作作可见,泛函为标量,可以理解为可见,泛函为标量,可以理解为“函数的函数函数的函数”例如:例如:(其中,(其中,为在为在 上连续可积上连续可积函数)函数)当当 时,有时,有 ;当;当 时,有时,有 。华东理工大学华东理工大学ECUSTECUST泛函泛函 如果满足以下条件时,称为线性泛函:如果满足以下条件时,称为线性泛函:1),其中,其中c 为任意常数;
6、为任意常数;2)对于一个任意小正数对于一个任意小正数 ,总是可以找到,总是可以找到 ,当,当 时,有时,有 就称泛函就称泛函 在在 处处是连续的。是连续的。2、泛函的变分、泛函的变分所谓泛函所谓泛函 的宗量的宗量 的变分是指两个函数间的差。的变分是指两个函数间的差。定义:设定义:设 是线性赋泛空间是线性赋泛空间 上的连续泛函,其增量可表上的连续泛函,其增量可表示为示为其中,其中,是关于是关于 的线性连续泛函,的线性连续泛函,是是关于关于 的高阶无穷小。则的高阶无穷小。则 称为泛函称为泛函 的变分。的变分。华东理工大学华东理工大学ECUSTECUST3、泛函变分的规则、泛函变分的规则1)2)3)
7、4)泛函的变分等于泛函的变分等于华东理工大学华东理工大学ECUSTECUST4、泛函的极值、泛函的极值设设 是在线性赋泛空间是在线性赋泛空间 上某个子集上某个子集D 中的线性连续中的线性连续泛函,泛函,若在,若在 的某邻域内的某邻域内在在 时,均有时,均有00或或则称则称 在在 处达到极大值或极小值。处达到极大值或极小值。华东理工大学华东理工大学ECUSTECUST为了判别是极大还是极小,要计算二阶变分为了判别是极大还是极小,要计算二阶变分 。但在实。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般际问题中根据问题的性质容易判别是极大还是极小,故一般不计算不计算 。定理定理:设:设
8、是在线性赋泛空间是在线性赋泛空间 上某个开子集上某个开子集D 中定中定义的可微泛函,且在义的可微泛函,且在 处达到极值处达到极值的必要条件是对于的必要条件是对于 在在 处必有处必有泛函泛函 华东理工大学华东理工大学ECUSTECUST欧拉方程:欧拉方程:定理:设有如下泛函极值问题:定理:设有如下泛函极值问题:其中,其中,及及 在在 上连续可微,上连续可微,和和 给定,给定,已知已知 ,则极值轨,则极值轨线线 满足如下欧拉方程满足如下欧拉方程及横截条件及横截条件注意:满足欧拉方程是必要条件,不是充分条件。注意:满足欧拉方程是必要条件,不是充分条件。华东理工大学华东理工大学ECUSTECUST证明
9、证明:让自变量函数让自变量函数 、在极值曲线在极值曲线 、附附近发生微小变分近发生微小变分 、,即,即 上式中上式中 是高阶项是高阶项。于是泛函于是泛函J J 的增量的增量 可计算如下(以下将可计算如下(以下将*号省去)号省去)华东理工大学华东理工大学ECUSTECUST 根据定义,泛函的变分 是 的线性主部,即对上式第二项作分部积分,按公式对上式第二项作分部积分,按公式可得可得华东理工大学华东理工大学ECUSTECUST J J 取极值的必要条件是取极值的必要条件是 等于零。因等于零。因 是任意的,要是任意的,要使上式中第一项(积分项)为零,必有使上式中第一项(积分项)为零,必有上式称为欧拉
10、上式称为欧拉拉格朗日方程。拉格朗日方程。第二项为零,就有第二项为零,就有华东理工大学华东理工大学ECUSTECUST二、用变分法求解最优控制问题二、用变分法求解最优控制问题1 末值时刻固定、末值状态自由情况下的最优控制末值时刻固定、末值状态自由情况下的最优控制非线性时变系统状态方程为非线性时变系统状态方程为(6)初始状态初始状态(7)其中,其中,x 为为n 维状态向量;维状态向量;u 为为r 维控制向量;维控制向量;f 为为n 维向量函数。维向量函数。要求在控制空间中寻求一个最优控制向量要求在控制空间中寻求一个最优控制向量 ,使以下性能指,使以下性能指标标(8)沿最优轨线沿最优轨线 取极小值。
11、取极小值。(性能指标如(性能指标如(8 8)式所示的最优控制问题,是变分法中的波尔扎)式所示的最优控制问题,是变分法中的波尔扎问题问题)华东理工大学华东理工大学ECUSTECUST引入拉格朗日乘子引入拉格朗日乘子(9)将性能指标(将性能指标(8)式改写为其等价形式)式改写为其等价形式定义哈密顿函数定义哈密顿函数(10)则则(11)由(6)式可知为零 华东理工大学华东理工大学ECUSTECUST(12)对(对(11)式中的第三项进行分部积分,得)式中的第三项进行分部积分,得当泛函当泛函J 取极值时,其一次变分等于零。取极值时,其一次变分等于零。即即可以变分的量:可以变分的量:不可以变分的量:不可
12、以变分的量:求出求出J 的一次变分并令其为零的一次变分并令其为零华东理工大学华东理工大学ECUSTECUST将上式改写成将上式改写成(13)由于由于 未加限制,可以选择未加限制,可以选择 使上式中使上式中 和和 的系数等于零。于是有的系数等于零。于是有(15)(14)(16)由于由于 是任意的变分,根据变分法中的辅助引理,由(是任意的变分,根据变分法中的辅助引理,由(16)式)式得得(17)(14)式称为伴随方程,)式称为伴随方程,为伴随变量,(为伴随变量,(17)式为控制方程。)式为控制方程。华东理工大学华东理工大学ECUSTECUST几点说明:几点说明:1)实际上,()实际上,(14)式和
13、()式和(17)式就是欧拉方程。)式就是欧拉方程。(18)因为因为(19)如果令如果令简记成简记成(20)由欧拉方程得到由欧拉方程得到即即(21)华东理工大学华东理工大学ECUSTECUST可见(可见(21)式和()式和(18)式相同,()式相同,(22)式和()式和(19)式相同。因此,)式相同。因此,(14)式和()式和(17)就是欧拉方程,而()就是欧拉方程,而(7)式和()式和(15)就是横截条)就是横截条件。件。(22)2)是泛函取极值的必要条件是否为极小值还需要二次变分是泛函取极值的必要条件是否为极小值还需要二次变分 来判断,来判断,则泛函则泛函J 取极小值。取极小值。华东理工大学
14、华东理工大学ECUSTECUST3)哈密顿函数沿最优轨线随时间的变化率哈密顿函数沿最优轨线随时间的变化率在最优控制在最优控制 、最优轨线、最优轨线 下,有下,有 和和(10)式的哈密顿函数对 求偏导,结果为 由(14)式可得 因为减号两边是相等标量(行向量与列向量相乘)(23)(24)这两个等于零的式子代入(这两个等于零的式子代入(23)式,于是)式,于是华东理工大学华东理工大学ECUSTECUST 即哈密顿函数即哈密顿函数H 沿最优轨线对时间的全导数等于它对时间的偏沿最优轨线对时间的全导数等于它对时间的偏导数。记为导数。记为 则则(25)对上式积分,得到对上式积分,得到(26)当哈密顿函数不
15、显含当哈密顿函数不显含 t 时,由(时,由(25)式得)式得华东理工大学华东理工大学ECUSTECUST初始条件初始条件例例 1 系统状态方程为系统状态方程为性能指标性能指标试求最优控制试求最优控制 ,使,使J 取极小值。取极小值。解解 哈密顿函数哈密顿函数由伴随方程由伴随方程因为因为华东理工大学华东理工大学ECUSTECUST由控制方程由控制方程即即将将 代入状态方程代入状态方程解为解为当当 时,代入上式,求得时,代入上式,求得 ,所以所以当当 时,时,最优性能指标为最优性能指标为华东理工大学华东理工大学ECUSTECUST2 末值时刻固定,末端状态固定情况下的最优控制末值时刻固定,末端状态
16、固定情况下的最优控制非线性时变系统状态方程为非线性时变系统状态方程为(27)初始状态初始状态(28)末值状态末值状态(29)性能指标性能指标(30)寻求最优控制寻求最优控制 ,在,在 内,将系统从内,将系统从 转移到转移到 ,同时使性能指标,同时使性能指标J 取极小值。取极小值。(性能指标如(性能指标如(3030)式所示的最优控制问题,是变分法中的拉格朗)式所示的最优控制问题,是变分法中的拉格朗日问题日问题)华东理工大学华东理工大学ECUSTECUST引入哈密顿函数引入哈密顿函数其中其中于是于是因为因为对上式右边第对上式右边第2项进行分部积分,可以得到项进行分部积分,可以得到上式中可以变分的量
17、:上式中可以变分的量:不可以变分的量:不可以变分的量:华东理工大学华东理工大学ECUSTECUST令性能指标令性能指标J 的一次变分等于零,得的一次变分等于零,得(31)选择选择 ,使其,使其满足满足(32)则则(33)在末端状态固定情况下,在末端状态固定情况下,不是任意的。只有在系统能控的情不是任意的。只有在系统能控的情况下,才有控制方程况下,才有控制方程华东理工大学华东理工大学ECUSTECUST例例 2 问题问题 1的系统状态方程为的系统状态方程为末值状态末值状态初始状态初始状态性能指标性能指标设设最优控制问题就是在状态方程的约束下,寻求最优控制问题就是在状态方程的约束下,寻求 ,使,使
18、 转移到转移到 ,并使,并使J 取极小值。取极小值。华东理工大学华东理工大学ECUSTECUST解解 根据能控性判据知,该系统是能控的根据能控性判据知,该系统是能控的1)哈密顿函数为)哈密顿函数为2)由控制方程得到)由控制方程得到即即华东理工大学华东理工大学ECUSTECUST3)由伴随方程)由伴随方程 ,得到,得到(,为积分常为积分常数)数)4)由状态方程得)由状态方程得(,为积分常为积分常数)数)华东理工大学华东理工大学ECUSTECUST根据边界条件,确定积分常数,得根据边界条件,确定积分常数,得代入代入 和和它们的曲线如图所示它们的曲线如图所示(图中(图中 ,实线,实线是理论上的变化,
19、虚是理论上的变化,虚线是实际的轨线。)线是实际的轨线。)华东理工大学华东理工大学ECUSTECUST 3 末值时刻自由情况下的最优控制末值时刻自由情况下的最优控制非线性时变系统状态方程为非线性时变系统状态方程为初始状态初始状态初始时刻初始时刻 固定,末值时刻固定,末值时刻 是自由的。是自由的。自由,性自由,性能指标能指标(34)寻求最优控制寻求最优控制 以及以及 ,使性能指标,使性能指标J 取极小值。为取极小值。为了求出最优控制,引入哈密顿函数了求出最优控制,引入哈密顿函数其中其中华东理工大学华东理工大学ECUSTECUST于是于是可以变分的量可以变分的量不能变分的量不能变分的量上式中上式中H
20、 为为 的简化表示的简化表示对上式中对上式中 进行分部积分,进行分部积分,成为成为(35)华东理工大学华东理工大学ECUSTECUST应当注意,末值时刻应当注意,末值时刻 自由时,自由时,不等于不等于 或或上式代入(上式代入(35)式)式华东理工大学华东理工大学ECUSTECUST性能指标取极值时,必有性能指标取极值时,必有(36)选择选择 使其满足使其满足(37)(38)由于由于 、是任意的,是任意的,可得可得(39)华东理工大学华东理工大学ECUSTECUST(40)(41)而而例例 3 系统的状态方程为系统的状态方程为性能指标性能指标求最优控制求最优控制 和末值时刻和末值时刻 ,使性能指
21、标泛函取极,使性能指标泛函取极小值。小值。解解经判断系统是能控的经判断系统是能控的1)构造哈密顿函数构造哈密顿函数华东理工大学华东理工大学ECUSTECUST2)由控制方程)由控制方程 ,得,得或或3)由伴随方程)由伴随方程4)将)将 代入状态方程代入状态方程解为解为其中,其中,、为积分常数,由为积分常数,由 ,确定,得确定,得华东理工大学华东理工大学ECUSTECUST5)由于)由于 自由,自由,得到,得到或或解得解得华东理工大学华东理工大学ECUSTECUST第二章、第二章、用极小值原理求解最优控制问题用极小值原理求解最优控制问题一、一、问题的提出问题的提出 用变分法求解最优控制时,认用变
22、分法求解最优控制时,认为控制向量为控制向量 不受限制。但不受限制。但是是实际的系统,控制信号都是受到实际的系统,控制信号都是受到某种限制的。某种限制的。因此,应用控制方程因此,应用控制方程来确定最优控制,可能出错。来确定最优控制,可能出错。a)图中所示,图中所示,H 最小值出现在左最小值出现在左侧,不满足控制方程。侧,不满足控制方程。b)图中不存在图中不存在 华东理工大学华东理工大学ECUSTECUST二、二、极小值原理极小值原理非线性定常系统的状态方程为非线性定常系统的状态方程为(42)初始时刻初始时刻 ,初始状态,初始状态 ,末值时刻,末值时刻 ,末端状态,末端状态 自由自由(43)性能指
23、标为末值型性能指标性能指标为末值型性能指标(44)要求在状态方程约束下,寻求最优控制要求在状态方程约束下,寻求最优控制 及及 使使系统从系统从转移到转移到 ,并使,并使J 取极小值。取极小值。华东理工大学华东理工大学ECUSTECUST以下就是用极小值原理解前面的问题:以下就是用极小值原理解前面的问题:设设 为容许控制,为容许控制,为对应的状态轨线。为了使它们分为对应的状态轨线。为了使它们分别成为最优控制别成为最优控制 和最优轨线和最优轨线 ,存在一个向量函数,存在一个向量函数 ,使得,使得(45)(46)其中哈密顿函数:其中哈密顿函数:(47)(49)(48)和和 满足边界条件满足边界条件华
24、东理工大学华东理工大学ECUSTECUST则哈密顿函数则哈密顿函数H 相对最优控制取极小值,即相对最优控制取极小值,即(50)或者或者(51)在末值时刻在末值时刻 是自由的情况是自由的情况哈密顿函数沿最优轨线随时间的变化规律:哈密顿函数沿最优轨线随时间的变化规律:在末值时刻在末值时刻 是固定的情况是固定的情况(52)(53)几点说明:几点说明:1)极小值原理给出的只是最优控制应该满足的必要条件。)极小值原理给出的只是最优控制应该满足的必要条件。2)极小值原理的结果与用变分法求解最优问题的结果相比,差别)极小值原理的结果与用变分法求解最优问题的结果相比,差别仅在于极值条件。仅在于极值条件。4)非
25、线性时变系统也有极小值原理。)非线性时变系统也有极小值原理。3)这里给出了极小值原理,而在庞德里亚金著作论述的是极大值)这里给出了极小值原理,而在庞德里亚金著作论述的是极大值原理。因为求性能指标原理。因为求性能指标J的极小值与求的极小值与求J的极大值等价。的极大值等价。华东理工大学华东理工大学ECUSTECUST三、三、二次积分模型的快速控制二次积分模型的快速控制在问题在问题 2 中,若中,若 ,令,令 。就是二次积分模型。就是二次积分模型。其状态方程模型其状态方程模型(54)1(55)系统的初始状态为系统的初始状态为(56)末值状态为末值状态为(57)性能指标为性能指标为(58)华东理工大学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 状态 估计
限制150内