最优控制的计算方法.ppt
《最优控制的计算方法.ppt》由会员分享,可在线阅读,更多相关《最优控制的计算方法.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1最优控制的计算方法最优控制的计算方法一、直接法一、直接法二、间接法二、间接法2最优控制的计算方法最优控制的计算方法 在前面讨论变分法、极小值原理和动态规划时,我们在前面讨论变分法、极小值原理和动态规划时,我们在前面讨论变分法、极小值原理和动态规划时,我们在前面讨论变分法、极小值原理和动态规划时,我们列举了一些例子。为了易于说明问题,这些例子都是非常列举了一些例子。为了易于说明问题,这些例子都是非常列举了一些例子。为了易于说明问题,这些例子都是非常列举了一些例子。为了易于说明问题,这些例子都是非常简单的,可以用手算来解决问题。但是在实际工作中所遇简单的,可以用手算来解决问题。但是在实际工作中所
2、遇简单的,可以用手算来解决问题。但是在实际工作中所遇简单的,可以用手算来解决问题。但是在实际工作中所遇到的最优控制问题,一般都是很复杂的,必须用计算机求到的最优控制问题,一般都是很复杂的,必须用计算机求到的最优控制问题,一般都是很复杂的,必须用计算机求到的最优控制问题,一般都是很复杂的,必须用计算机求解。解。解。解。因此,最优控制的计算方法就变得十分重要了。这方因此,最优控制的计算方法就变得十分重要了。这方因此,最优控制的计算方法就变得十分重要了。这方因此,最优控制的计算方法就变得十分重要了。这方面的内容十分丰富,由于篇幅所限,我们只介绍几种典型面的内容十分丰富,由于篇幅所限,我们只介绍几种典
3、型面的内容十分丰富,由于篇幅所限,我们只介绍几种典型面的内容十分丰富,由于篇幅所限,我们只介绍几种典型的算法。的算法。的算法。的算法。3最优控制的计算方法最优控制的计算方法直接法直接法直接法直接法的特点是,在每一步迭代中,的特点是,在每一步迭代中,的特点是,在每一步迭代中,的特点是,在每一步迭代中,U U(t t)不一定要满足不一定要满足不一定要满足不一定要满足H H 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这取极小的必要条件,而是逐步改善它,在迭代终了使它满足这取极小的必要条件,而是逐步改善它,在迭代终了使它满足这取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,
4、而且,积分状态方程是从个必要条件,而且,积分状态方程是从个必要条件,而且,积分状态方程是从个必要条件,而且,积分状态方程是从t t0 0到到到到t tf f,积分协态方程是,积分协态方程是,积分协态方程是,积分协态方程是从从从从t tf f到到到到t t0 0,这样就避免了去寻找缺少的协态初值,这样就避免了去寻找缺少的协态初值,这样就避免了去寻找缺少的协态初值,这样就避免了去寻找缺少的协态初值 (t t0 0)的困难。常的困难。常的困难。常的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。用的直接法有梯度法,二阶梯度法,共轭梯度法。用的直接法有梯度法,二阶梯度法,共轭梯度法。用的直接法有梯
5、度法,二阶梯度法,共轭梯度法。间接法间接法间接法间接法的特点是,在每一步迭代中都要满足的特点是,在每一步迭代中都要满足的特点是,在每一步迭代中都要满足的特点是,在每一步迭代中都要满足HH取极小的必取极小的必取极小的必取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积要条件,而且要同时积分状态方程和协态方程,两种方程的积要条件,而且要同时积分状态方程和协态方程,两种方程的积要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从从分都从从分都从从分都从从t t0 0到到到到t tf f或从或从或从或从t tf f到到到到t t0 0。常用的间接法有边界迭代法和拟线。常用的间接法
6、有边界迭代法和拟线。常用的间接法有边界迭代法和拟线。常用的间接法有边界迭代法和拟线性化法。性化法。性化法。性化法。4最优控制的计算方法最优控制的计算方法(U U无约束无约束无约束无约束)(ii ii)哈密顿函数)哈密顿函数)哈密顿函数)哈密顿函数HH取极小的必要条件取极小的必要条件取极小的必要条件取极小的必要条件或或或或 由极小值原理可知,最优控制问题的解必须满足以下几由极小值原理可知,最优控制问题的解必须满足以下几由极小值原理可知,最优控制问题的解必须满足以下几由极小值原理可知,最优控制问题的解必须满足以下几个条件:个条件:个条件:个条件:(iiiiii)边界条件(包括横截条件)边界条件(包
7、括横截条件)边界条件(包括横截条件)边界条件(包括横截条件)(i i)正则方程)正则方程)正则方程)正则方程(U U有约束有约束有约束有约束)最优控制的计算方法一般是先求出满足上面三个条件中最优控制的计算方法一般是先求出满足上面三个条件中最优控制的计算方法一般是先求出满足上面三个条件中最优控制的计算方法一般是先求出满足上面三个条件中某两个的解,然后用合适的迭代计算形式逐次改变这个解,某两个的解,然后用合适的迭代计算形式逐次改变这个解,某两个的解,然后用合适的迭代计算形式逐次改变这个解,某两个的解,然后用合适的迭代计算形式逐次改变这个解,以达到满足剩下的另一个条件的解(即最优解)。以达到满足剩下
8、的另一个条件的解(即最优解)。以达到满足剩下的另一个条件的解(即最优解)。以达到满足剩下的另一个条件的解(即最优解)。5一、直接法一、直接法1 1、梯度法、梯度法、梯度法、梯度法这是一种直接方法,应用比较广泛。它的特点是:先猜这是一种直接方法,应用比较广泛。它的特点是:先猜这是一种直接方法,应用比较广泛。它的特点是:先猜这是一种直接方法,应用比较广泛。它的特点是:先猜测任意一个控制函数测任意一个控制函数测任意一个控制函数测任意一个控制函数U U(t t),它可能并不满足,它可能并不满足,它可能并不满足,它可能并不满足H H 取极小的必要条取极小的必要条取极小的必要条取极小的必要条件,然后用迭代
9、算法根据件,然后用迭代算法根据件,然后用迭代算法根据件,然后用迭代算法根据H H 梯度减小的方向来改善梯度减小的方向来改善梯度减小的方向来改善梯度减小的方向来改善U(tU(t),使它,使它,使它,使它最后满足必要条件。最后满足必要条件。最后满足必要条件。最后满足必要条件。计算步骤如下:计算步骤如下:计算步骤如下:计算步骤如下:1 1、先猜测、先猜测、先猜测、先猜测 t t0 0,t tf f 中的一个控制向量中的一个控制向量中的一个控制向量中的一个控制向量U UK K(t t)=)=U U0 0(t t),K K是迭代是迭代是迭代是迭代步数,初始时步数,初始时步数,初始时步数,初始时K K=0
10、=0。U U0 0 的决定要凭工程经验,猜得合理,计的决定要凭工程经验,猜得合理,计的决定要凭工程经验,猜得合理,计的决定要凭工程经验,猜得合理,计算收敛得就快算收敛得就快算收敛得就快算收敛得就快2 2、在第、在第、在第、在第K K步,以估计值步,以估计值步,以估计值步,以估计值U UK K和给定的初始条件和给定的初始条件和给定的初始条件和给定的初始条件X X(t t0 0),从,从,从,从t t0 0到到到到t tf f 顺向积分状态方程,求出状态向量顺向积分状态方程,求出状态向量顺向积分状态方程,求出状态向量顺向积分状态方程,求出状态向量X XK K(t t)。61、梯度法、梯度法3 3、
11、用、用、用、用U UK K(t t)、X XK K(t t)和横截条件求得的终端值和横截条件求得的终端值和横截条件求得的终端值和横截条件求得的终端值 (t tf f),从,从,从,从t tf f到到到到t t0 0反向积分协态方程,求出协态向量反向积分协态方程,求出协态向量反向积分协态方程,求出协态向量反向积分协态方程,求出协态向量 K K(t tf f)。表示在表示在表示在表示在 、处取值。当这些量非最优值时,处取值。当这些量非最优值时,处取值。当这些量非最优值时,处取值。当这些量非最优值时,。4 4、计算哈密顿函数、计算哈密顿函数、计算哈密顿函数、计算哈密顿函数HH对对对对U U的梯度向量
12、的梯度向量的梯度向量的梯度向量71、梯度法、梯度法是一个步长因子,它是待定的数。选择是一个步长因子,它是待定的数。选择是一个步长因子,它是待定的数。选择是一个步长因子,它是待定的数。选择 使指标达到使指标达到使指标达到使指标达到极小。这是一维寻优问题,有很多现成的优化方法可用。极小。这是一维寻优问题,有很多现成的优化方法可用。极小。这是一维寻优问题,有很多现成的优化方法可用。极小。这是一维寻优问题,有很多现成的优化方法可用。如分数法,如分数法,如分数法,如分数法,0.6180.618法,抛物线法,立方近似法等。上式表明法,抛物线法,立方近似法等。上式表明法,抛物线法,立方近似法等。上式表明法,
13、抛物线法,立方近似法等。上式表明迭代是沿着梯度迭代是沿着梯度迭代是沿着梯度迭代是沿着梯度的负方向进行的。的负方向进行的。的负方向进行的。的负方向进行的。5 5、修正控制向量、修正控制向量、修正控制向量、修正控制向量6 6、计算是否满足下列指标、计算是否满足下列指标、计算是否满足下列指标、计算是否满足下列指标 是指定小量,若满足则停止计算,否则,令是指定小量,若满足则停止计算,否则,令是指定小量,若满足则停止计算,否则,令是指定小量,若满足则停止计算,否则,令 ,转步骤转步骤转步骤转步骤2 2。另一停止计算的标准是。另一停止计算的标准是。另一停止计算的标准是。另一停止计算的标准是81、梯度法、梯
14、度法例、考虑下面的一阶非线性状态方程例、考虑下面的一阶非线性状态方程例、考虑下面的一阶非线性状态方程例、考虑下面的一阶非线性状态方程用梯度法寻找最优控制使下面的指标最小用梯度法寻找最优控制使下面的指标最小用梯度法寻找最优控制使下面的指标最小用梯度法寻找最优控制使下面的指标最小因因因因x x(1)(1)自由,由横截条件得自由,由横截条件得自由,由横截条件得自由,由横截条件得解:哈密顿函数为解:哈密顿函数为解:哈密顿函数为解:哈密顿函数为协态方程为协态方程为协态方程为协态方程为91、梯度法、梯度法1 1、选初始估计、选初始估计、选初始估计、选初始估计 。代入初始条件:代入初始条件:代入初始条件:代
15、入初始条件:,确定积分常数,确定积分常数,确定积分常数,确定积分常数2 2、将、将、将、将 代入状态方程可得代入状态方程可得代入状态方程可得代入状态方程可得积分上式可得积分上式可得积分上式可得积分上式可得可得可得可得可得10 4 4、由、由、由、由 ,得,得,得,得1、梯度法、梯度法3 3、将、将、将、将 代入协态方程,且由边界条件代入协态方程,且由边界条件代入协态方程,且由边界条件代入协态方程,且由边界条件 从从从从t t=1=1倒向积分可得倒向积分可得倒向积分可得倒向积分可得这里选步长因子这里选步长因子这里选步长因子这里选步长因子 。如此继续下去,直至指标函数随。如此继续下去,直至指标函数
16、随。如此继续下去,直至指标函数随。如此继续下去,直至指标函数随迭代变化很小为止。迭代变化很小为止。迭代变化很小为止。迭代变化很小为止。5 5、111、梯度法、梯度法右图表示了控制和右图表示了控制和右图表示了控制和右图表示了控制和状态的初始值和第一次状态的初始值和第一次状态的初始值和第一次状态的初始值和第一次迭代值,可以看到第一迭代值,可以看到第一迭代值,可以看到第一迭代值,可以看到第一次迭代次迭代次迭代次迭代 就几乎收敛就几乎收敛就几乎收敛就几乎收敛到最优值,到最优值,到最优值,到最优值,与最优与最优与最优与最优值还有差异,而且一般值还有差异,而且一般值还有差异,而且一般值还有差异,而且一般说
17、来愈接近最优值收敛说来愈接近最优值收敛说来愈接近最优值收敛说来愈接近最优值收敛愈慢。愈慢。愈慢。愈慢。图图图图b b 最优状态的求解最优状态的求解最优状态的求解最优状态的求解图图图图a a 用梯度法寻找最优控制用梯度法寻找最优控制用梯度法寻找最优控制用梯度法寻找最优控制121、梯度法、梯度法梯度法应用得比较多,它的梯度法应用得比较多,它的梯度法应用得比较多,它的梯度法应用得比较多,它的优点优点优点优点是:是:是:是:(1 1)简单,编制程序容易;)简单,编制程序容易;)简单,编制程序容易;)简单,编制程序容易;(2 2)计算稳定可靠。)计算稳定可靠。)计算稳定可靠。)计算稳定可靠。缺点缺点缺点
18、缺点是:是:是:是:(1 1)在接近最优解时,迭代收敛很慢,为改善收敛性)在接近最优解时,迭代收敛很慢,为改善收敛性)在接近最优解时,迭代收敛很慢,为改善收敛性)在接近最优解时,迭代收敛很慢,为改善收敛性可用共轭梯度法和二阶变分法等;可用共轭梯度法和二阶变分法等;可用共轭梯度法和二阶变分法等;可用共轭梯度法和二阶变分法等;(2 2)不能区分局部极小和全局极小;)不能区分局部极小和全局极小;)不能区分局部极小和全局极小;)不能区分局部极小和全局极小;(3 3)对控制变量受约束,终端状态受约束的情)对控制变量受约束,终端状态受约束的情)对控制变量受约束,终端状态受约束的情)对控制变量受约束,终端状
19、态受约束的情 况不能况不能况不能况不能直接处理。对于这种有约束的情况可用约束梯度法或惩罚函直接处理。对于这种有约束的情况可用约束梯度法或惩罚函直接处理。对于这种有约束的情况可用约束梯度法或惩罚函直接处理。对于这种有约束的情况可用约束梯度法或惩罚函数法加以处理。数法加以处理。数法加以处理。数法加以处理。132 2、共轭梯度法、共轭梯度法、共轭梯度法、共轭梯度法用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求
20、函数的方向进行的。为了说明共轭梯度的意义,我们先从求函数的方向进行的。为了说明共轭梯度的意义,我们先从求函数的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。极值问题的共轭梯度法开始,再推广到求泛函极值问题。极值问题的共轭梯度法开始,再推广到求泛函极值问题。极值问题的共轭梯度法开始,再推广到求泛函极值问题。(1)(1)求函数极值的共轭梯度法求函数极值的共轭梯度法求函数极值的共轭梯度法求函数极值的共轭梯度法其中,其中,其中,其中,C C为常数,为常数,为常数,为常数,Q Q为正定阵。为正定阵。为正定阵。为正定阵。要求寻找要求寻找要求寻找要求寻找
21、X X使使使使F F(X X)取极值。取极值。取极值。取极值。设设设设F F(X X)是定义在是定义在是定义在是定义在R Rn n空间中的二次指标函数空间中的二次指标函数空间中的二次指标函数空间中的二次指标函数是是是是X X和和和和QXQX的内积。的内积。的内积。的内积。142、共轭梯度法、共轭梯度法则称则称则称则称X X和和和和Y Y是是是是Q Q共轭的。共轭的。共轭的。共轭的。Q Q=I I(单位阵)时,共轭就变为通常(单位阵)时,共轭就变为通常(单位阵)时,共轭就变为通常(单位阵)时,共轭就变为通常的正交。的正交。的正交。的正交。定义定义定义定义:若:若:若:若R Rn n中两个向量中两
22、个向量中两个向量中两个向量X X和和和和Y Y满足满足满足满足设向量设向量设向量设向量 ,是两两是两两是两两是两两Q Q共轭的,以共轭的,以共轭的,以共轭的,以 为为为为寻找方向,可得共轭梯度法的迭代寻优程序:寻找方向,可得共轭梯度法的迭代寻优程序:寻找方向,可得共轭梯度法的迭代寻优程序:寻找方向,可得共轭梯度法的迭代寻优程序:与梯度法不同处仅在于用共轭梯度与梯度法不同处仅在于用共轭梯度与梯度法不同处仅在于用共轭梯度与梯度法不同处仅在于用共轭梯度P PK K代替负梯度代替负梯度代替负梯度代替负梯度 g gK K=(F F/X X)KK。问题是如何产生共轭梯度方向。问题是如何产生共轭梯度方向。问
23、题是如何产生共轭梯度方向。问题是如何产生共轭梯度方向 。152、共轭梯度法、共轭梯度法值由值由值由值由 和和和和 对对对对 共轭的关系来确定,即共轭的关系来确定,即共轭的关系来确定,即共轭的关系来确定,即令令令令 ,即初始时共轭梯度与梯度方向相反、大小,即初始时共轭梯度与梯度方向相反、大小,即初始时共轭梯度与梯度方向相反、大小,即初始时共轭梯度与梯度方向相反、大小相等。以后的共轭梯度可如下递归产生:相等。以后的共轭梯度可如下递归产生:相等。以后的共轭梯度可如下递归产生:相等。以后的共轭梯度可如下递归产生:于是,得于是,得于是,得于是,得称为共轭系数。称为共轭系数。称为共轭系数。称为共轭系数。故
24、故故故162、共轭梯度法、共轭梯度法 K K的计算是不方便的,因为要用到二阶导数阵的计算是不方便的,因为要用到二阶导数阵的计算是不方便的,因为要用到二阶导数阵的计算是不方便的,因为要用到二阶导数阵Q Q。而。而。而。而 分别为分别为分别为分别为X X 的第的第的第的第i i个和第个和第个和第个和第j j个分量,右端表示由个分量,右端表示由个分量,右端表示由个分量,右端表示由Q Q 的第的第的第的第i i行行行行第第第第j j列元素构成的矩阵。计算这个二阶导数阵非常困难。为此,列元素构成的矩阵。计算这个二阶导数阵非常困难。为此,列元素构成的矩阵。计算这个二阶导数阵非常困难。为此,列元素构成的矩阵
25、。计算这个二阶导数阵非常困难。为此,有必要推导不用有必要推导不用有必要推导不用有必要推导不用Q Q来计算来计算来计算来计算 K K 的公式。的公式。的公式。的公式。通过推导(略),可得通过推导(略),可得通过推导(略),可得通过推导(略),可得上式计算上式计算上式计算上式计算 K K,只用到只用到只用到只用到F F(X X)在在在在X XK K和和和和X XK K 1 1两处的梯度,因此非常两处的梯度,因此非常两处的梯度,因此非常两处的梯度,因此非常方便。上式对二次函数是精确的,对非二次函数,它只是一个方便。上式对二次函数是精确的,对非二次函数,它只是一个方便。上式对二次函数是精确的,对非二次
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 计算方法
限制150内