变分法及其在最优控制中的应用.ppt
《变分法及其在最优控制中的应用.ppt》由会员分享,可在线阅读,更多相关《变分法及其在最优控制中的应用.ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、变分法及其在最优控制中的应用现在学习的是第1页,共94页主 要 内 容 1.1 泛函的变分泛函的变分 1.2 欧拉方程欧拉方程 1.3 横截条件横截条件 1.4 泛函局部极值的充分条件泛函局部极值的充分条件 1.5 等式约束条件下的变分问题等式约束条件下的变分问题 1.6 利用变分法求解最优控制问题利用变分法求解最优控制问题 课外习题课外习题返回目录返回目录现在学习的是第2页,共94页1.1 1.1 泛函的变分泛函的变分一、泛函的定义 如果变量J对于某一函数类中的每一个函数x(t),都有一个 与之对应,那么就称变量J为依赖于函数x(t)的泛函,记为:J=Jx(t)。确定的值说明:由于函数的值是
2、由自变量的选取而确定的,而泛函的值是由自变量的函数的选取而确定的,所以将泛函理解为“函数的函数”。例1.1.1 函数的定积分是泛函。因为变量J的值是由函数的选取而确定的。现在学习的是第3页,共94页例1.1.2 在平面上连接给定两点A(ta,xa)和B(tb,xb)的曲线的弧长J是一个泛函,如图1-1所示。当曲线方程x=x(t)(满足x(ta)=xa,x(tb)=xb)给定后,可算出它在A、B两点间的弧长为:例1.1.3 函数的不定积分 不是泛函。泛函的上述概念,可以推广到含有几个函数的泛函的情况,例如:现在学习的是第4页,共94页从例1.1.2可以知道,连接A、B两点的曲线之弧长的泛函,其被
3、积函数 是未知函数导数的函数。在一般情况下,被积函数是自变量t,未知函数x(t)及其导数 的函数。所以最简单的一类泛函可表示为:求函数的极值时,微分或导数起着重要的作用。求泛函的极值时,变分起着类似的作用。我们将求泛函的极值问题称为变分问题,其相应的方法称为变分法。(1.1.1)如图1-2所示。二、泛函宗量的变分 泛函Jx(t)的宗量是函数x(t),其变分是指在同一函数类中的两个函数间的差:现在学习的是第5页,共94页三、泛函的连续性三、泛函的连续性 函数相近函数相近 当函数当函数x x(t t)与与 x x0 0(t t)之差的绝对值,即之差的绝对值,即 x x(t t)-)-x x0 0(
4、t t),t t1 1 t t t t2 2 (1.1.2)(1.1.2)对于对于x x(t t)的定义域中的一切的定义域中的一切t t(t t1 1 t t t t2 2 )都很小时,称函数)都很小时,称函数x x(t t)与函数与函数x x0 0(t t)是相近的,也称为零阶相近。如图是相近的,也称为零阶相近。如图1-31-3所示。所示。现在学习的是第6页,共94页 一阶相近一阶相近 当函数当函数x x(t t)与与 x x0 0(t t)之差的绝对值以及它们的一阶导数之差的绝对值以及它们的一阶导数 和和 之差的绝对值,即之差的绝对值,即 t t1 1 t t t t2 2 (1.1.3)
5、(1.1.3)都很小,称函数都很小,称函数x x(t t)与函数与函数x x0 0(t t)是一阶相近的,如图是一阶相近的,如图1-41-4所示。所示。注意:一阶相近的两个函数,必然是零阶相近,反之不成立。现在学习的是第7页,共94页 k k阶接近阶接近 当当 t t1 1 t t t t2 2 (1.1.4)(1.1.4)都很小时,称函数都很小时,称函数x x(t t)与函数与函数x x0 0(t t)是是k k阶相近的。阶相近的。函数间距离函数间距离 在不同的函数空间,函数间的距离定义也不同。在不同的函数空间,函数间的距离定义也不同。在函数空间在函数空间C C a a,b b(在区间在区间
6、 a a,b b 上连续的函数的全体构成的函数空间)上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:中,通常采用下式定义距离:(1.1.51.1.5)在函数空间在函数空间C Ck k a a,b b(在区间在区间 a a,b b 上连续且具有连续的上连续且具有连续的k k阶导数的函数的阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:全体构成的函数空间)中,任意两个函数间的距离定义为:(1.1.61.1.6)显然,式(1.1.5)定量地表示两个函数之间的零阶相近度,而式(1.1.6)定量地表示两个函数之间的k阶相近度。现在学习的是第8页,共94页 泛函的连续性泛函的
7、连续性 如果对于任意给定的正数如果对于任意给定的正数,可以找到这样一个,可以找到这样一个 00,当,当 ddx x(t t),x x0 0(t t)(1.1.71.1.7)时,存在时,存在 J J x x(t t)J J x x0 0(t t)(1.1.8)(1.1.8)那么,就说泛函那么,就说泛函J J在点在点x x0 0(t t)处是连续的。处是连续的。根据所采用的函数之间距离定义的不同,是按式(根据所采用的函数之间距离定义的不同,是按式(1.1.51.1.5)还是式)还是式(1.1.61.1.6),其对应的泛函分别称为零阶连续泛函或),其对应的泛函分别称为零阶连续泛函或k k阶连续泛函。
8、阶连续泛函。四、线性泛函四、线性泛函 连续泛函如果满足下列条件:(1)Jx1(t)+x2(t)=Jx1(t)+Jx2(t)(2)Jcx(t)=c Jx(t)现在学习的是第9页,共94页其中,c是任意常数,就称为线性泛函。例如都满足上述两个条件,故均为线性泛函。五、泛函的变分如果连续泛函Jx(t)的增量可以表示为:(泰勒级数)其中,Lx(t),x(t)是关于x(t)的线性连续泛函,而rx(t),x(t)是关于x(t)的高阶无穷小。Lx(t),x(t)称为泛函的变分,记为(1.1.9)现在学习的是第10页,共94页(1.1.10)也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,即泛
9、函的增量可以用式(1.1.9)来表示时,称该泛函是可微的。例如,泛函的增量为:于是,其变分为:现在学习的是第11页,共94页可以证明,泛函的变分是唯一的。因为,若泛函的变分不是唯一的,则泛函的增量可以写为:引理1.1.1 泛函Jx(t)的变分为:证明:如上所述,泛函Jx(t)的增量为:其中,(0 1)是一个参变量。由于Lx(t),x(t)是关于 x(t)的线性连续泛函,根据线性泛函的性质(2),有(1.1.11)现在学习的是第12页,共94页又由于rx(t),x(t)是关于 x(t)的高阶无穷小,所以利用上述两点结论,便得根据偏微分的定义现在学习的是第13页,共94页因为泛函Jx(t)的变分为
10、:所以QED现在学习的是第14页,共94页例1.1.4 求泛函 的变分。根据式(1.1.11),该泛函的变分为:现在学习的是第15页,共94页例1.1.5 求泛函 的变分 根据式(1.1.11),所求泛函的变分为:现在学习的是第16页,共94页若设 则六、泛函的极值 如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函Jx(t)在点x0(t)处达到极小值;如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函Jx(t)在点x0(t)处达到极大值;x0(t)的邻域包含满足条件:的所有点x(t)的球(即以x0(t)为圆心,以为半径的球)。现在学习的是第17
11、页,共94页注意:所采用的函数间的距离的定义的不同,点 x0(t)的邻域内所包含的函数也不同。若强极值若弱极值 显然,如果泛函Jx(t)在点x0(t)处达到强极值,那么它在点x0(t)处也一定达到弱极值。反之不成立。定理1.1.1(必要条件)(必要条件)若泛函Jx(t)是连续可微的,并且在点x0(t)处达到极值,则泛函在点x0(t)处的变分等于零,即(1.1.12)现在学习的是第18页,共94页证明:对于任意给定的x(t),Jx0(t)+x(t)既是函数x(t)的泛函,又是变量的函数。泛函Jx0(t)+x(t)在x0(t)处达到极值,也可看成是函数Jx0(t)+x(t)在=0处达到极值,所以函
12、数Jx0(t)+x(t)对变量的偏导数在=0处应等于零,即而由式(1.1.11)有比较上面两式,又考虑x(t)是任意给定的,所以,QED现在学习的是第19页,共94页 从定理1.1.1的推证中可见,泛函达到强极值与弱极值的必要条件是相同的。应当指出:本节所讨论的定义、引理和定理,稍加变动就可以应用于含有多个未知函数的泛函:Jx1(t),x2(t),xn(t)现在学习的是第20页,共94页 拉格朗日(拉格朗日(LagrangeLagrange)问题问题基本问题基本问题 (1.2.1)(1.2.1)麦耶耳麦耶耳(Mayer)Mayer)问题问题 (1.2.2)(1.2.2)波尔扎(波尔扎(Bolz
13、aBolza)问题问题 (1.2.3)(1.2.3)1.2 1.2 欧拉方程欧拉方程 最优控制问题中,根据性能指标的类型(积分型性能指标、终值型性能指标、复合型性能指标)的不同,分别对应了古典变分法中的三类基本问题。现在学习的是第21页,共94页固定端点的Lagrange问题问题描述:假定点A(t0,x0)和B(tf,xf)是所要寻求的泛函(1.2.1)的极值曲线x(t)的两个固定端点,如图1-5所示,其坐标为:(1.2.4)现在的问题是:从满足边界条件(1.2.4)的二阶可微的函数中,选择使泛函(1.2.1)达到极小值的函数x(t)。解:设x*(t)是使泛函(1.2.1)达到极小值且满足边界
14、条件(1.2.4)的极值条件。现用表示满足边界条件(1.2.4)的极值曲线x*(t)的邻域曲线。其中(1.2.5)现在学习的是第22页,共94页x(t)是泛函宗量x(t)的变分,(01)是一参变量。为使x(t)是满足边界条件(1.2.4)的极值曲线x*(t)的邻域曲线,x(t)应具有连续导数且满足条件:x(t0)=x(tf)=0 (1.2.6)于是,由式(1.2.5)得到(1.2.7)由于x*(t)是极值曲线,所以泛函(1.2.1)在极值曲线x*(t)上的变分等于零(定理1.1.1),即由引理1.1.1知,泛函的变分为(1.2.8)(1.2.9)现在学习的是第23页,共94页将式(1.2.1)
15、代入式(1.2.9),得(1.2.10)现在学习的是第24页,共94页 对式(1.2.10)右端第二项进行分部积分(1.2.12)将式(1.2.11)代入式(1.2.10),并考虑式(1.2.8)得利用条件(1.2.6),则上式变为(1.2.13)(1.2.11)考虑到泛函宗量的变分x(t)是任意的函数,不妨选择(1.2.14)其中w(t)是任一满足下列条件的函数:现在学习的是第25页,共94页将式(1.2.14)代入式(1.2.13),可得由上式可见,一个非负的函数的定积分为零,只能是被积函数恒等于零,因此有(1.2.15)将上式左端第二项展开,可得(1.2.16)欧拉(Euler)方程欧拉
16、方程现在学习的是第26页,共94页式中若 时,欧拉方程是一个二阶微分方程。定理1.2.1 若给定曲线x(t)的始端x(t0)=x0和终端x(tf)=xf,则泛函达到极值的必要条件是,曲线x(t)满足欧拉方程其中x(t)应有连续的二阶导数,则至少应是二次连续可微的。现在学习的是第27页,共94页几种特殊的欧拉方程(可以得到封闭形式的解)几种特殊的欧拉方程(可以得到封闭形式的解)被积函数被积函数L L不依赖于不依赖于 ,即,即 被积函数被积函数L L不依赖于不依赖于x x,即即 被积函数被积函数L L不依赖于不依赖于t t,即即 在这种情况下,欧拉方程的首次积分为在这种情况下,欧拉方程的首次积分为
17、 (1.2.171.2.17)其中其中c c是待定的积分常数。实际上,将上式左边对是待定的积分常数。实际上,将上式左边对t t求全导数,有求全导数,有 被积函数被积函数L L 线性地依赖于线性地依赖于 ,即,即 式(1.2.16)现在学习的是第28页,共94页 对于向量空间的泛函,也存在着欧拉方程,不过是欧拉方程组(即向量欧拉方程)。定理1.2.2 在n维函数空间中,若极值曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和终端X(tf)=x1(tf),x2(tf),xn(tf)T是给定的,则泛函达到极值的必要条件是曲线X(t)满足向
18、量欧拉方程其中X(t)应有连续的二阶导数,而 则至少应是二次连续可微的。(1.2.18)现在学习的是第29页,共94页例1.2.1 求泛函 满足边界条件 的极值函数。解:由式(1.2.18)得:其特征方程为:特征根为:从而得现在学习的是第30页,共94页由给定的边界条件得于是得极值函数:可以利用MATLAB符号工具箱求解,求解过程如下:syms x1 x2;s=dsolve(D2x1-x2=0,D2x2-x1=0,x1(0)=0,x1(pi/2)=1,x2(0)=0,x2(pi/2)=-1,t);x1=s.x1x2=s.x2运行结果如下:x1=sin(t)x1=-sin(t)现在学习的是第31
19、页,共94页例1.2.2 最速降线(又称捷线)问题 所谓最速降线问题是:设在竖直平面内有两点A和B,它们不在同一条铅垂线上,现有一质点受重力的作用自较高的A点向较低的B点滑动,如果不考虑各种阻力的影响,问应取怎样的路径,才能使所经历的时间最短?解:在A、B两点所在的竖直平面内选择 一坐标系,如图16所示。A点为坐标原点,水平线为x轴,铅垂线为y轴。设质点的初速度为零,则由力学的知识可知,质点在重力的作用下,不考虑各种阻力的影响,从A点向B点下滑的速度的大小为(1.2.19)现在学习的是第32页,共94页由图16得(1.2.20)将式(1.2.20)代入式(1.2.19)中,并变换,得对上式两边
20、进行积分,可得质点自点A(0,0)滑动到点B(xf,yf)所需的时间为(1.2.21)设y=y(x)是连接点A(0,0)和点B(xf,yf)的任一光滑曲线,则最速降线问题的数学提法是:在XOY平面上确定一条满足边界条件(1.2.22)现在学习的是第33页,共94页的极值曲线y=y(x),使泛函(1.2.23)达到极小值。这时被积函数为:不显含自变量x,由(1.2.17)知,它的首次积分为化简上式得现在学习的是第34页,共94页这种方程宜于利用参数法求解,为此,令于是,又由对上式积分,得由边界条件y(0)知,c2=0,于是现在学习的是第35页,共94页令最后得 这是圆滚线的参数方程。式中r是滚动
21、圆半径,其值由另一边界条件y(xf)=yf确定。所以,最速降线是一条圆滚线。现在学习的是第36页,共94页1.3 横截条件当极值曲线x*(t)的端点变化时,要使泛函 达到极小值,x*(t)首先应当满足欧拉方程:若端点固定,可以利用端点条件:确定欧拉方程中的两个待定的积分常数。问题:若端点可变,如何确定这两个积分常数?现在学习的是第37页,共94页横截条件推导过程问题描述:假定极值曲线的始端A(t0,x0)是固定的,而终端B(tf,xf)是可变的,并沿着给定的曲线(1.3.1)变动,如图17所示。现在的问题是需要确定一条从给定的点A(t0,x0)到给定的曲线(1.3.1)上的某一点B(tf,xf
22、)的连续可微的曲线x(t),使得泛函达到极小值。(1.3.2)现在学习的是第38页,共94页解:设x*(t)是泛函(1.3.2)的极值曲线。x*(t)的邻域曲线可表示为:(1.3.3)(1.3.4)由图1-7可见,每一条邻域曲线x(t)都对应一个终端时刻tf,设极值曲线x*(t)所对应的终端时刻为tf*,则邻域曲线x(t)所对应的终端时刻tf可以表示为:(1.3.5)将式(1.3.3)(1.3.5)代入式(1.3.2),得(1.3.6)现在学习的是第39页,共94页根据泛函达到极值的必要条件则有:(1.3.7)式(1.3.7)左边第一项相当于tf固定时的泛函的变分,按照上一节推导的结果可得(1
23、.3.8)现在学习的是第40页,共94页式(1.3.7)左边第二项先利用中值定理,然后求导,则得(1.3.9)将式(1.3.8)和式(1.3.9)代入式(1.3.7),得考虑到欧拉方程和始端固定所以(1.3.10)若x(t*f)与dtf互不相关,则由上式得现在学习的是第41页,共94页(1.3.11)但是,终端点沿曲线(1.3.1)变动,所以x(t*f)与dtf相关。为了进一步简化式(1.3.10),应当求出x(t*f)与dtf之间的关系。根据终端约束条件(1.3.1),应有将上式对取偏导数,并令=0,利用式(1.3.4),整理得将上式代入式(1.3.10),可得现在学习的是第42页,共94页
24、由于dtf是任意的,所以(1.3.12)横截条件定理1.3.1 若曲线x(t)由一给定的点(t0,x0)到给定的曲线x(tf)=(tf)上的某一点(tf,xf),则泛函达到极值的必要条件是,x(t)满足欧拉方程和横截条件其中x(t)应有连续的二阶导数,则至少应是二次连续可微的,而(t)则应有连续的一阶导数。现在学习的是第43页,共94页若极值曲线的始端不是固定的,并沿着曲线(1.3.13)变动,则同样可以推导出始端的横截条件(1.3.14)根据定理1.3.1和式(1.3.14),可得到端点可变时,Lagrange问题的解,除有欧拉方程外,还有横截条件:(1)始端、终端可变,即x(t0)=(t0
25、),x(tf)=(tf),则横截条件为:(2)当t0、tf 可变,而x(t0)与x(tf)固定时,则横截条件为:现在学习的是第44页,共94页(3)当t0、tf 固定,而x(t0)与x(tf)可变时,即始端与终端分别在t=t0、t=tf上滑动,则横截条件为:定理1.3.1和以上几种情况的横截条件,都可以将其推广到n维函数向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。定理1.3.2 在n维函数空间中,若曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T是固定的,而终端X(tf)=x1(tf),x2(tf),xn(tf)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变分法 及其 最优 控制 中的 应用
限制150内