第07章:最优控制的计算方法精选PPT.ppt
《第07章:最优控制的计算方法精选PPT.ppt》由会员分享,可在线阅读,更多相关《第07章:最优控制的计算方法精选PPT.ppt(102页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第07章:最优控制的计算方法第1页,此课件共102页哦本章主要内容n7.1 直接法 7.2 间接法 7.3 小结 返回主目录第2页,此课件共102页哦 在前面讨论变分法、极小值原理和动态规划时,我们列举了一些例子。为了易于说明问题,这些例子都是非常简单的,可以用手算来解决问题。但是在实际工作中所遇到的最优控制问题,一般都是很复杂的,必须用计算机求解。因此,最优控制的计算方法就变得十分重要了。这方面的内容十分丰富,由于篇幅所限,我们只介绍几种典型的算法。第3页,此课件共102页哦(无约束)(ii)哈密顿函数 取极小的必要条件(有约束)(7-2)或 由极小值原理可知,最优控制问题的解必须满足以下几
2、个条件(iii)边界条件(包括横截条件)(i)正则方程(7-1)第4页,此课件共102页哦 最优控制的计算方法一般是先求出满足上面三个条件中某两个的解,然后用合适的迭代计算形式逐次改变这个解,以达到满足剩下的另一个条件的解(即最优解)。通常把最优控制的计算方法分成两类:直接法和间接法。第5页,此课件共102页哦 n直接法 它的特点是,在每一步迭代中,不一定要满足 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,而且,积分状态方程是从 到 ,积分协态方程是从 到 ,这样就避免了去寻找缺少的协态初值 的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。第6页,此课件共102页哦
3、 n间接法 它的特点是,在每一步迭代中都要满足 取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从 到 或从 到 。常用的间接法有边界迭代法和拟线性化法。第7页,此课件共102页哦7.1 直接法直接法(一)梯度法 这是一种直接方法,应用比较广泛。它的特点是:先猜测任意一个控制函数 ,它可能并不满足 取极小的必要条件,然后用迭代算法根据 梯度减小的方向来改善 ,使它最后满足必要条件。计算步骤如下:第8页,此课件共102页哦1 先猜测 中的一个控制向量 ,是迭代步数,初始时 。的决定要凭工程经验,猜得合理,计算收敛得就快。第9页,此课件共102页哦2 在第 步,以估计值 和给定
4、的初始条件 ,从 到 顺向积分状态方程,求出状态向量 。第10页,此课件共102页哦 3 用 、和横截条件求得的终端值 ,从 到 反向积分协态方程,求出协态向量 。第11页,此课件共102页哦4 表示在 、处取值。当这些量非最优值时,。计算哈密顿函数 对 的梯度向量第12页,此课件共102页哦5、是一个步长因子,它是待定的数。选择 使指标达到极小。这是一维寻优问题,有很多现成的优化方法可用。如分数法,0.618法,抛物线法,立方近似法等。(7-3)表明迭代是沿着梯度的负方向进行的。修正控制向量(7-3)第13页,此课件共102页哦 6、计算是否满足下列指标(7-4)是指定小量,若满足则停止计算
5、,否则,令 ,转步骤2。另一停止计算的标准是(7-5)第14页,此课件共102页哦例7-1考虑下面的一阶非线性状态方程(7-6)用梯度法寻找最优控制使下面的指标最小(7-7)第15页,此课件共102页哦解因 自由,由横截条件得哈密顿函数为(7-8)协态方程为(7-9)第16页,此课件共102页哦、选初始估计 。代入初始条件:,确定积分常数、将 代入状态方程(7-6)可得(7-11)积分上式可得(7-12)代入(7-12)式即可得(7-13)第17页,此课件共102页哦3将 代入协态方程(7-9),且由边界条件 从t=1倒向积分可得5 。这里选步长因子 。如此继续下去,直至指标函数随迭代变化很小
6、为止。4由第18页,此课件共102页哦 图7-1用梯度法寻找最优控制 图7-2 最优状态的求解 图7-1和图7-2表示了控制和状态 的初始值和第一次迭代值,可以看到第一次迭代 就几乎 收 敛 到 最 优 值,与最优值还有差异,而且一般说来愈接近最优值收敛愈慢第19页,此课件共102页哦梯度法应用得比较多,它的优点是:(1)简单,编制程序容易;(2)计算稳定可靠。缺点是:(1)在接近最优解时,迭代收敛很慢,为改善 收敛性可用共轭梯度法和二阶变分法等;(2)不能区分局部极小和全局极小;(3)对控制变量受约束,终端状态受约束的情 况不能直接处理。对于这种有约束的情况可用约束梯度法或惩罚函数法加以处理
7、。第20页,此课件共102页哦约束梯度法可处理如下的不等式约束:(7-15)首先,对于任何控制 ,定义约束算子(7-16)第21页,此课件共102页哦显然 满足约束,即 满足约束,其中 ,再由 用无约束的梯度法求解,在每一次迭代中得出 ,然后用 代替,再进行下一次迭代。(7-17)第22页,此课件共102页哦 惩罚函数法可处理如下形式的约束:(7-18)(7-19)第23页,此课件共102页哦这时,将性能指标 增广为其中,(7-21)(7-20)第24页,此课件共102页哦 显然,当满足约束时,中后两项为零。当不满足约束时,后两项将使 增大,故称为惩罚函数。在迭代过程中,逐次增大 和 。显然当
8、 和 很大时,所求得的 的无约束最优控制近似于 的有约束最优控制。第25页,此课件共102页哦(二)共轭梯度法 用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。第26页,此课件共102页哦 1求函数极值的共轭梯度法其中,为常数,为正定阵。是 和 的内积。要求寻找 使 取极值。(7-23)设 是定义在 空间中的二次指标函数(7-22)第27页,此课件共102页哦定义 则称 和 是 共轭的。(单位阵)时,共轭就变为通常的正交。若 中两个向量 和 满足(7-24)第28页,此课件共102页哦 设向量
9、 ,是两两 共轭的,以 为寻找方向,可得共轭梯度法的迭代寻优程序:(7-25)与梯度法不同处仅在于用共轭梯度 代替负梯度 。问题是如何产生共轭梯度方向 。第29页,此课件共102页哦 值由 和 对 共轭的关系来确定,即(7-26)(7-27)令 ,即初始时共轭梯度与梯度方向相反、大小相等。以后的共轭梯度可如下递归产生:第30页,此课件共102页哦将(7-26)代入(7-27),得称为共轭系数。故(7-28)第31页,此课件共102页哦用(7-28)式计算 是不方便的,因为要用到二阶导数阵 。由(7-22)和(7-23)知 分别为 的第 个和第 个分量,右端表示由 的第 行第 列元素构成的矩阵。
10、计算这个二阶导数阵非常困难。为此,有必要推导不用 来计算 的公式。(7-29)第32页,此课件共102页哦 性质1 若 是 空间中彼此 共轭的向量,则它们是线性独立的。在这个推导中要用到共轭梯度的下列性质:第33页,此课件共102页哦证明:证明:因为 正定,上式对每一个 成立,所以必须有 与假设矛盾,这说明 是线性独立的,它们构成了 空间中的一组基向量。上式左端各项对 取内积后有(7-31)用反证法。若不线性独立,则必存在不全为零的常数 使(7-30)第34页,此课件共102页哦其中,可这样来求:作内积(7-33)从而按照这个性质,函数 的极小点 可用这组基来表示,即(7-32)第35页,此课
11、件共102页哦性质2 式中,。(7-34)说明,在 处函数 的梯度 与前一步的寻找方向 必正交。如果 ,则有(7-34)第36页,此课件共102页哦若不然,不妨先设 。再设 ,即 是最优步长。在 附近选一个 ,将 在 处展开,保留一阶项后,有 证明:证明:(7-35)第37页,此课件共102页哦这与 为极小相矛盾。若设 则可取 ,同样得出矛盾,于是必有(7-34)成立。第38页,此课件共102页哦性质3(7-36)说明,在 处的梯度 与以前各步的共轭梯度寻找方向都正交。若 ,则必有(7-36)第39页,此课件共102页哦证明证明由(7-22)式所假定的二次函数 ,可得(7-38)(7-37)得
12、到重复使用第40页,此课件共102页哦设 为极小点,则(7-39)(7-38)减去(7-39)得(7-40)第41页,此课件共102页哦上式两边对 作内积,得(7-42)(7-41)=(7-37)代入(7-40),得第42页,此课件共102页哦由性质2知 再由 与是 共轭的定义可知(7-42)右端第二项也为零,因此 (7-36)得证。第43页,此课件共102页哦但 是线性无关的,它们构成 中一组基,与所有基正交,而 中只有 个基,故 。这说明 处的梯度为零,即 为二次函数 的极小点。如果取 ,则(7-43)第44页,此课件共102页哦如果一个算法能在有限步内求出二次函数的极小点,就称这个算法具
13、有二阶收敛性或有限步收敛性。由此可见,在 空间中,对二次函数 用(7-25)式所示的共轭梯度法寻优,迭代至多 步就可达到极小点。第45页,此课件共102页哦性质4若 ,则(7-44)第46页,此课件共102页哦证:证:(7-44)得证。由性质3和(7-26)式知第47页,此课件共102页哦 下面根据这四个性质来推出 的一个简单的计算公式。在(7-41)中令 ,可导出第48页,此课件共102页哦再利用(7-26)式,可得 由性质4知 ,因此得(7-45)第49页,此课件共102页哦 用(7-46)计算 ,只用到 在 和 两处的梯度,因此非常方便。(7-46)对二次函数是精确的,对非二次函数,它只
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 07 最优 控制 计算方法 精选 PPT
限制150内