最优控制理论课件.doc

资源ID：17625993 资源大小：2.33MB 全文页数：41页
资源格式： DOC 下载积分：15金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

最优控制理论课件.doc

【精品文档】如有侵权，请联系网站删除，仅供学习与交流最优控制理论课件.精品文档.第一章绪论1.1 引言近50年来，科学技术的迅速发展，对许多被控对象如宇宙飞船、导弹、卫星和现代工业设备与生产过程的性能提出了更高的要求，在许多情况下要求系统的某种性能指标为最优。这就要求人们对控制问题都必须从最优控制的角度进行研究分析和设计。最优控制理论是现代控制理论的重要组成部分。其形成与发展奠定了整个现代控制理论的基础。早在20世纪50年代初九开始了对最短时间控制问题的研究。随后，由于空间技术的发展，越来越多的学者和工程技术人员投身于这一领域的研究和开发，逐步形成了较为完整的最优控制理论体系。最优化问题就是根据各种不同的研究对象以及人们预期要达到的目标，寻找一个最优控制规律，或设计出一个最优控制方案或最优控制系统。最优控制理论研究的主要问题是：根据已建立的被控对象的时域数学模型或频域数学模型，选择一个容许的控制律，使得被控对象按预定要求运行，并使给定的某性能指标达到最优值。从数学的观点来看，最优控制理论研究的问题是求解一类带有约束条件的泛函取值问题，属于变分学的理论范畴。然而，经典变分学理论只能解决容许控制属于开机的一类，为适应工程实践的需要，20世纪50年代中期出现了现代变分理论。在现代变分理论中最常用的两种分法是动态规划和极小值原理。动态规划时美国学者R.E贝尔曼于1953-1957年为了解决多级决策问题的算法而逐步创立的。最小值原理时前苏联科学院院士.C.庞特里亚金与1956年-1958年间逐步创立的。近年来，由于数字计算机的飞速发展和完善，逐步形成了最优控制理论中的数值计算法，参数优化方法。当性能指标比较复杂或者不能用变量或函数表示时，可以采用直接搜索法，经过若干次迭代，都所到最优点。常用的方法有邻近极值法、梯度法、共轭梯度法及单纯形法等。同时由于可以把计算机作为控制系统的一个组成部分，以实现在线控制，从而使最优控制理论的工程实现成为现实。因此，最优控制理论提出的求解方法，既是一种数学方法，又是一种计算机算法。时至今日，最优控制理论的研究，无论在深度和广度上，都有了很大的发展，并且日益与其他控制理论相互渗透，形成了更为实用的学科分支，如：鲁棒最优控制、随机最优控制、分布参数系统最优控制及大系统的次优控制等。可以说最优控制理论目前仍然是在发展中的，极其活跃学科领域之一。1.2最优化问题一、最优化问题的数学描述所谓最优化问题，就是寻找一个最优控制方案或者最优控制规律，使所研究的对象（或系统）能最优地达到预期地目标。例如：在控制发射N级火箭时，如何规划各级火箭地质量使得火箭地总质量为最小；或在雷达高炮随动系统中，当发现敌机后，如何以最快地速度跟踪目标而将敌机击落。也就是说，最优化问题就是依据各种不同的研究对象以及人们预期达到的目的，寻找出一个最优控制规律或者设计出一个最优控制方案或者最优控制系统。例1.甲仓库（1500包水泥），乙仓库（1800包水泥）工地A需要900包，工地B需要600包，工地C需要1200包，从甲仓库送往A、B、C工地的运费分别为每包1元、2元、4元，从乙仓库送往A、B、C工地的运费分别为每包4元、5元、9元，应如何发运这些水泥，能使运费最省？设总运费f(x)=x1+2x2+4x3+4x4+5x5+9x6最优化的任务在于确定x使f(x)为最小。x受到以下条件限制：x1+x2+x31500x4+x5+x61800 由于f(x)为x的一次函数x1+ x4=900x2+ x5=600x3+ x6=1200 例2.关于飞船的月球软着陆问题为使飞船实现软着陆，即到达月球表面时速度为零，要寻找飞船发动机推力的最优变化规律，使燃料消耗最少，以便完成任务有足够燃料返回地球。飞船运动方程：初始条件：末端条件：控制约束：0u(t)umax 性能指标取为表征燃料消量耗（1-5页）的飞船着陆时的质量：最优化问题就是在满足和的约束条件下，寻求发动机推力的最优变化规律u(t)，使飞船从x(0)x(tf),并使J=m(tf)=max最优化问题的数学描述包含以下几个方面的内容：1. 受控制系统的数学模型即系统微分方程(集中参数系统可用一组一阶常微分方程来描述) 2. 边界条件与目标集边界条件即初始状态时刻t0和初始状态x(t0)通常已知，而终端时刻tf和终端状态x(tf）可以固定也可以自由。一般地，对终端的要求可以用如下的终端等式或不等式约束条件来表示：N1=x(tf),tf=0 或N2x(tf),tf0 目标集：满足终端约束条件的转台集合，用M表示：M=x(tf):x(tf)Rn，N1x(tf),tf=0,或N2x(tf),tf 0为简单起见，笼统称式为目标集。3. 容许控制每一个实际的控制问题，控制向量u(t)都有一个规定的取值范围，通常可以用如下不等式饿约束条件来表示：0u(t) umax 或，i=1,2,3r在Rr空间中，把满足上式的点u(t)的集合v成为控制集，把属于u(t)U的u(t)称为容许控制若u(t)的取值不受限制，则容许控制属于某一开集。U为开集还是闭集在处理方法上有着本质的差别。4. 性能指标(目标函数)衡量控制作用效果的性能指标将x(t0)x(tf)通过不同u(t)来完成，而控制效果好坏，则用性能指标来判别。对于最优化问题的目标函数，其内容与形式主要取决于具体优化问题所要解决的主要矛盾。例如在人造卫星的姿态控制问题中，可分为时间最短、燃料最少、时间最少燃料最少不同目标函数的最优化问题二最优化问题的分类1单变量函数与多变量函数最优化问题单变量函数最优化方法是求解最优化问题的基本方法2.无约束与有约束最优化问题3.确定性和随机性最优化问题4.线性和非线性最优化问题5.静态和动态最优化问题三最优化问题的求解方法1 间接法（解析法）无约束：经典微分法、经典变分法有约束：极大值原理、动态规划2 直接法(数值解法)函数逼近法（插值法或曲线拟合法）区间消去法：菲波纳奇法、黄金分割法（0.618法）爬山法：变量轮换法、步长加速法、方向加速法、单纯形法、随机搜索法3 以解析法为基础的数值解法：无约束梯度法：最速下降法、共轭梯度法、牛顿法与拟牛顿法、变尺度法、牛顿高斯最小二乘法有约束梯度法：可解方向法、梯度投形法、简约梯度法化有约束为无约束问题：序列无约束极小化法、线性近似化法最优控制属于最优化范畴，因此最优控制与最优化有其共同的性质和理论基础，但最优化涉及面极广，举凡生产过程的控制企业的生产调度对资金、材料、设备的分配、乃至经济政策的制定等等，无不与最优化有关。而最优控制是针对控制系统本身而言的，目的在于使一个机组、一台设备或一个生产过程实现局部最优。1.3 最优控制问题所谓最优控制问题，就是指在给定条件下，对给定系统确定一种控制规律，使该系统能在规定的性能指标下具有最优值。也就是说最优控制就是要寻找容许的控制作用（规律）使动态系统（受控系统）从初始状态转移到某种要求的终端状态，且保证所规定的性能指标（目标函数）达到最大（小）值。最优控制问题的示意图如图所示。其本质乃是一变分学问题。经典变分理论只能解决一类简单的最优控制问题。为满足工程实践的需要，20世纪50年代中期，出现了现代变分理论。最常用的方法就是极大值原理和动态规划。最优控制在被控对象参数已知的情况下，已成为设计复杂系统的有效方法之一。一最优控制问题的性能指标在状态空间中要使系统的状态由初始状态x(t0)x(tf)，可以用不同的控制规律来实现。为了衡量控制系统在每一种控制规律作用下工作的优劣，就需要用一个性能指标来判断。性能指标的内容、形式取决于最优控制所完成的任务。不同最优控制问题就应有不同的性能指标。同一最优控制问题，其性能指标也可能因设计者着眼点而异。1. 综合性或波尔扎（Bolza）型性能指标L标量函数：动态性能指标标量函数：终端性能指标J标量函数，对每一个控制函数u(t)都有一个对应值，u(·)控制函数整体2. 积分变量或拉格朗日（Lagrange）型性能指标强调系统的过程要求。3.终端型或麦耶尔（Mager）型性能指标以上三种性能指标，通过一些简单的数学处理，可以相互转化。在特殊情况下，可采用如下的二次型性能指标F终端加权矩阵 Q(t)状态加权矩阵 R(t)控制加权矩阵二最优控制问题的提法所谓最优控制的提法，就是将通常的最优控制问题抽象成一个数学问题，并用数学语言严格的表示出来。1. 给定系统的状态方程初始条件2. 给定初始条件和终端条件初始状态为：x(t0)=x0终端状态x(tf)可用如下约束条件表示N1x(tf)，tf=0 或N2x(tf)，tf03给定性能指标（目标函数）确定J最优控制向量，使系统从x(t0)x(tf)，并使性能指标具有极大（小）值。三最优控制问题的分类1.按状态方程分类：连续最优化系统、离散最优化系统2.按控制作用实现方法分类：开环最优控制系统、闭环最优控制系统3.按性能指标分类：最小时间控制问题最少燃料控制问题最少燃料控制问题线性二次型性能指标最优控制问题非线性性能指标最优控制问题4.按终端条件分类：固定终端最优控制问题自由终端（可变）最优控制问题终端时间固定最优控制问题终端时间可变最优控制问题 5.按应用领域来分：终端控制问题、调节器问题、跟踪问题、伺服机构问题、效果研究问题、最小时间问题、最少燃料问题第二章最优控制中的变分法在动态最优控制中，由于目标函数是一个泛函数，因此求解动态最优化问题可归结为求泛函极值问题。变分法是研究极值的一种经典分法。2.1 函数的极值一一元函数的极值设连续可微一元函数y=f(x)在定义区间a,b有极值，则函数在x0处可导，并在x0处存在极值的必要条件是在xo处存在极大值，极小值，若，还要从f(x)在xo附近的变化情况来判断xo是否是极小值、极大值或拐点。例1 试求的极值解：例2 如图所示:边长为a的正方形铁皮，四个角处剪去相等正方形，折起后制成方形无盖水槽，要求其容积最大，或求所剪去的小正方形的边长。无盖方形水槽容积为：max=二多元函数与极值设多元函数存在极值的必要条件是：极小值的充分条件是：，极大值的充分条件是：若下列矩阵(Hesse海赛)正定则极小值负定则极大值 Hesse矩阵的正定性可用sylvester准则判别例：设多元函数，试求函数的极值点及极小值4解： Hesse矩阵：因为40， 0，0，故Hesse阵正定所以函数存在极小值三条件极值和拉格朗日乘子问题实际问题中自变量之间受到其他条件的约束限制极值常用拉格朗日乘子法(待定乘子法、增量法) 原理：引入待定参数，将求解带有约束条件的极值问题转化为一个求解无约束条件的极值问题设连续可微的目标函数为:J=f(x,u)等式约束条件为： g(x,u)=0引入乘子矢量，将乘等式约束条件并与目标函数相加，构造拉格朗日函数目标函数存在极值的必要条件是：例已知函数约束条件为，试求函数的条件极值解：求解此类问题有多种方法，如消元法和拉格朗日乘子法方法一：消元法方法二：拉格朗日乘子法引入拉格朗日乘子，得到一个新函数即：例：把半径为1的实心金属球融化，铸造成一个实心固体柱，问固体柱取什么尺寸才能使其表面积最小？解：圆柱体底部半径为r，高为h，则其表面积为：约束条件为圆柱体体积与实心球体积相等，即：所以 2.2 变分法一变分法的基本概念泛函可简单理解为“函数的函数”，求泛函的极大值和极小值问题都称为变分问题。求泛函极值的方法称为变分法。1.泛函设对自变量t，存在一类函数x(t)，如果对于每个函数x(t)，有一个J值与之对应，则变量J称为依赖于x(t)的泛函数，记作，中的为某一特定函数的整体，而不是对应于t的函数值。函数称为泛函J的宗量，泛函为标量。例：当时，当时，等。在控制系统中，自变量是时间t，宗量函数是状态矢量，积分型性能泛函为J的值取决于函数u(t)。不同的J值于不同的u(t)对应。所以J是函数u(t)的泛函。所谓求解最优控制，就是寻找使J取极值的控制u(t)。2.泛函的变分1）宗量的变分即两函数之差为泛函宗量的变分，2）泛函变分的定义当宗量函数x(t)有变分时，连续泛函Jx(t)的增量可表示为，其中是泛函的变分，并记为，所以泛函的变分也就是可以称为泛函的微分。当泛函具有微分时，可用表示时，称泛函是可微的。例：求泛函的变分3）泛函变分的求法定理：连续函数的变分等于泛函对的导数在=0处的值，即：证明：由于是的现行连续函数又由于是的高阶无穷小量于是：例求泛函的变分解：4）泛函变分的规则设L1和L2是函数和t的函数3 泛函的极值1）泛函极值的定义若泛函在任何一条与接近的曲线上的值不小于即：则称泛函在曲线上达到极小值。其中称为泛函的极小值函数或极小值曲线。2）宗量函数的接近度若两个函数和相接近，就应对于任意都满足很小正数称与具有零阶接近度。称为强极值。若称与具有一阶接近度。为弱极值。接近度阶次越高函数接近程度越好。强极大值必大于或等于弱极大值。3）泛函极值的必要条件定理：若可微泛函在上达到了极大（小）值，则在上有证明：对于任意给定的是的函数=0二.固定端点的变分问题所谓固定端点问题，是指状态空间中曲线的起点和终点都是预知固定的。由于已固定，性能泛函变为积分型性能泛函了。1.欧拉方程定理：已知容许曲线x(t)的初始端和终端状态，则积分性能泛函，取极值的必要条件是容许极值曲线满足如下欧拉方程或及边界条件和其中及在上至少两次连续可微。证明：设极值曲线如图所示，在极值附近有一容许曲线，其中是任给的连续可微函数，则代表了在及之间的所有可能的曲线。当就是极值曲线。对于每条不同曲线，的值就有不同。为寻找使达到极值的曲线，就要考察曲线变动对于变化的影响，而曲线的变化可以看成是变化的结果。因此便成了的函数，并在上达到了极值，即于是有端点固定，故有为任意，由此推得泛函取极值的必要条件为：将展开为：欧拉公式可写为欧拉方程是一个二阶微分方程，求解时有两个积分常数待定，对于固定端点问题，给定和就是两个边界条件。所以求解欧拉方程就是求解两点边值问题。对于自由端点，因其一个端或或是两个端点是自由的，这时所欠缺的一个或两个边界条件便应由模载条件来补充。 (始端自由) (终端自由) 应当指出，上述欧拉方程和横截条件只是泛函极值存在的必要条件。至于所解得的极值曲线是极大值曲线还是极小值曲线，还需由充分条件来判定。但对许多工程问题，往往何以根据物理含义直接判断。例求泛函满足边界条件x(1)=1,x(2)=2的极值曲线。解：泛函极值只能在曲线上实现2.泛函极值的充分条件勒让德(legendse)条件如同函数极值的性质可由二阶导数的符号来判定一样，泛函极值的性质可由二阶变分的符号来判定。若两个函数x(t)存在无穷小量的差异，则x(t)的一次变分可写成。对于泛函数，若它有三阶以上的连续偏导数，则在满足欧拉方程的极值曲线邻域内，有如下泰勒级数展开式：定义：当为极值曲线时，是泛函取极值的必要条件，其充分条件是：当矩阵型式：勒让德(legendse)条件例：求泛函满足边界条件的极值函数并判别泛函极值的性质。解：，代入欧拉方程边界条件又3.几种典型泛函的欧拉方程一般来说欧拉方程是一个非线性二次微分方程，其解并不是以在所有情况下都能表示成封闭式的解，但在下列几种特殊情况下，欧拉方程一定能积分出来，并将它表示成封闭形式1) L不依赖于，即2) L不依赖于，即3) L只依赖于，即4) L只依赖于，即欧拉方程：4. 多变量系统的泛函设多变量系统的积分型性能指标泛函为：欧拉方程：横截条件：固定端点：边界条件自由端点：自由终端自由始端例：求泛函在条件的极值曲线。解：欧拉方程：由边界条件可求出三、可变端点的变分问题端点固定情况是一种最简单的情况。在工程实际问题中，经常会遇到曲线的始端或终端是变动的可变端点问题。可假设始端时刻固定，即，终端时间可变，终端边界条件为，即，如右图所示。当可变时，其典型例子为导弹的拦截问题问题提法：寻找一条件连续可微的极值曲线。从且使性能泛函达到极值。1泛函极值的必要条件定理：设容许曲线从且使取极值的必要条件是：极值曲线满足欧拉方程设始端边界条件和终端横截条件为证明：设为领域内任一条容许曲线由图可知，可存在如下近似关系不难理解：如果某一容许极值曲线能使J在端点变动的情况下取极值，那么对于和容许极值有同样边界点的更窄的函数类来说，其极值曲线自然也能使J达到极值。也就是说，终端受约束的函数类中的极值曲线，也必定是端点固定的函数类中的极值曲线。因此必能满足端点固定时泛函极值必要条件：但终端可变时，其边界条件发生变化前以证明：欧拉方程依然成立：由于始端固定，边界条件：横截条件：（1）终端时刻tf可变，终端状态自由，固定。因为：代入中，由于和均任意。（2）终端时刻tf可变，终端状态有约束，固定。设终端约束方程为：代入式中，由于任意，注意：横截条件与欧拉方程连理才能构成泛函极值的必要条件。例：求从到直线间距离最短的曲线解：问题是求的极小值曲线，由欧拉方程：故：横截条件：，即a=1,由所以：由终端约束条件：2、特征形式下的横截条件在控制工程中，大多数终端约束条件都比较特殊。（1）当目标曲线是平行横轴直线时，其终端状态相当于固定，使可变称为平动端点，此时=0，则横截条件可简化为：（2）当目标曲线是垂直横轴直线时，此时相当于终端时刻，自由，自由终端，横截条件改写为0（3）若终端状态也固定固定端点问题（4）若曲线的始端可变，终端固定，始端只能沿着给定目标曲线变化时，可用上述同样方法推证始端横截调件为：，终端边界条件：例：求使性能泛函取极值的轨迹，要求任意。解：始端固定，终端自由欧拉方程：=0即：=常数，故必为常数。设，由B=0，所以：由终端横截条件：=A=0，或A=-2/3A=-2/3时极值轨迹为容易验证时，J=0，局部极小；，J=4/27，对应局部极大。3、一般泛函表达形式在最优控制中，目标函数包括项，用以表示对终端时刻的特殊要求，即使泛函取极小值，还有不计动态性能指标的性能泛函取极值的问题，计Q也可以是和的函数。显然，拉格朗日（积分型）和麦耶尔可看成波尔扎问题的特殊情况，所以波尔扎问题有最一般形式，但是若引入辅助变量，常可以使这3种问题相互转换。令，若恒定不变，波尔扎问题拉格朗日问题。若引进一个新变量，使，波尔扎问题麦耶尔问题2.3 应用变分法求解最优控制问题在前面讨论的泛函极值问题中，没有对容许曲线附加任何条件，属于无约束条件的变分问题，但在最优控制问题中，泛函所依赖的函数往往受到一定约束条件的限制状态方程，它可以看成是一种等式约束条件，可采用拉格朗日乘子法，将具有等式约束条件的变法问题转化为一种等价的无约束变分问题，从而将在等式约束条件下对泛函J求极值的最优控制问题在无约束的条件下求哈密顿函数H的极值问题哈密顿发方法。一、固定端点的最优控制问题设系统的状态方程为：系统终端和始端满足：，系统的性能泛函为：试确定最优控制和最优曲线，使系统由，并使达到极值。将状态方程改写为：引入拉格朗日乘子向量，构造下列泛函现引入一个标量函数泛函极值的必要条件任意，伴随方程化为状态方程控制方程横截条件状态方程以上等式亦可以欧拉方程求出令由由状态方程与伴随方程通常合称正则方程，其标量形式为：（i=1,2n） 2n 个边界条件 i=1,2n 由与的函数关系哈密顿函数的一个重要性质：当H不显含t时，=0定理：设系统的状态方程为：则把自始端取极值，以实现最优控制的必要条件是：（1）最优曲线和最优伴随向量满足正则方程：（2）最优控制满足正则方程：（3）边界条件：，当然上述具有等式约束（状态方程）问题，也可先利用状态方程得到与，的关系，代入上例性能泛函，使的形式。无约束最优控制问题。最优控制计算步骤：Step 1:构造根据：，求出Step 2:以代入正则方程中，消去u 的两点边值问题Step 3:以代入得到例：设人造卫星姿态控制系统的状态方程为：性能指标，边界条件为：求使J取极值的最优曲线和最优控制解：，伴随方程：控制方程：状态方程：边界条件：所以，最优曲线为：最优控制为：二可变端点的最优控制问题设状态方程为：，性能指标为：试确定最优控制和最优曲线使系统有已知可变终端并使J达到极值。1、终端时刻固定，终端状态自由引入拉格朗日乘子向量定义：泛函极值存在的必要条件及所以：状态方程：伴随方程：控制方程：横截条件：例：上例中，终端状态设为自由，部分约束，部分自由解：，横截条件：由状态方程：设边界条件、横截条件可得：故最优控制：最优曲线：2、终端时刻固定，终端状态有约束假设终端状态的约束条件为引入两个拉格朗日向量和令与终端时刻固定，终端状态自由相比，仅仅横截条件发生了变化。其余均不变。因此，终端状态有约束的泛函极值存在的必要条件为：状态方程：伴随方程：控制方程：横截条件：终端约束：例：试求使被控系统，由已知初始状态出发，在时，转移到目标集。，且使性能指标为最小的和解：伴随方程：控制方程：由状态方程：由初始状态：由目标集：由横截条件：3、终端时刻可变，终端状态有约束设终端状态的约束条件为，引入拉格朗日乘子矢量要确定，及又因为：代入上式整理考虑到，均是任意的。泛函极值存在必要条件为：状态方程：伴随方程：控制方程：横截条件：终端约束：定理：设系统状态方程是，则为把状态从转移到满足约束条件的终端状态，式中固定或可变，并使性能泛函为：取极值，实现最优控制的必要条件是：1、最优曲线和最优伴随向量满足以下正则方程：2、最优控制满足控制方程：3、始端边界条件与终端横截条件：4、当终端时间可变时，还需以下终端横截条件确定例：设一阶系统方程为：，已知，要求，试求性能指标为极小的解：由伴随方程：由控制方程：由状态方程：初始条件终端条件横截条件：所以：第3章极大值原理在利用经典变分法求解最优控制问题中，泛函极值的必要条件都是在等式约束下，并且控制向量u(t)没有约束及状态方程对u(t)是可微的情况下取得的。然而，在实际物理系统中，控制向量是受到一定限制的，容许控制只能在一定的控制域内取值。对于不等式的约束问题，也是先将不等式约束化成等式约束，然后再用相同的方法求解最优控制问题。但对于多变量系统来说，这种方法使求解过程相当复杂。所谓极大值原理是求出当前控制向量受到约束时的最优控制必要条件现代变分法 3.1 引言在实际工程问题中，控制向量u(t)往往受到一定的限制。如控制元件饱和，驱动电机的力矩不可能无穷大，流量的最大值受到输送管道的和阀门的限制等。一般可用下面的不等式来表示，即式中属于有限闭集，更一般的情况可用下面不等式约束来表示：。若属于有界闭集，当在边界上取值时，就不是任意的了，由于受到约束在其容许取值范围内可能无解，也可能的解，并非使H取极小值的解。如右图所示。另外，在应用经典变分法求解最优控制问题时，要求函数和关于所有自变量二次连续可微。要求H关于u的偏导存在。于是类似的性能泛函无法用经典变分法求解。例如最小燃料消耗问题。前苏联数学家庞德里亚金总结了经典变分法和最简单最优控制的早期研究成果。特别是受力学中的哈密顿原理的启发。于19561958年间逐步创立了最大值原理一种适用性广泛又有严格理论依据的求解最优控制问题的简便方法。最大值原理的一个显著特点。是易于确定最优控制系统的普遍结构形式。因而应用甚广，成为求解最优控制问题的一种强有力的工具。被誉为“现代变分法”。3.2.连续下调的极大值原理在实际控制系统中，由许多问题要求控制变量或状态变量在某一范围内，例如：，此时，连续系统最优控制问题可描述为：设n维系统状态方程：始端时间和始端状态：终端时间和终端状态满足约束方程：控制向量取值于：性能泛函J取极小值：与前面讨论过的等式约束条件最优控制问题相比较。他们的主要区别在于是属于有界闭集。受到不等式约束，可采用以下措施：1）引入一个新的r维控制变量，令：显然不连续，但是连续的。若分段连续，分段光滑连续。2）引入另一个新的L维变量，令：无论是正是负，但非负，满足的要求。通过以上变换，将上述具有不等式约束的最优控制问题转化为具有等式约束的波尔扎问题。再应用拉格朗日乘子法引入乘子和T。将问题转化为求广义性能指标的极值。广义性能指标的一阶变分：由于是任意的，可推出广义性能泛函取极值的必要条件如下：欧拉方程：，即即横截条件：由于欧拉方程：横截条件：需指出：以上条件是最优解的必要条件，使最优解极小。还必须满足维尔斯勒拉E函数沿最优曲线成非负的条件，即：由于沿最优曲线，且，所以：即：在极大值原理中，容许条件放宽了，另外，极大值原理不要求H对的可微性，因而扩大了应用范围必经典变分法具有真正的实用价值。定理：设系统的状态方程为：始端约束为：终端约束为：待定控制约束为：性能泛函为：取哈密顿函数：则实现最优控制的必要条件为：满足下列关系：1）沿最优轨线满足正则方程：2）在最优轨线上，与最优控制相应的H函数取绝对极小值，即3） H函数在最优轨线的终点处的值决定于4）协态终值满足横截条件5）满足边界条件：例：设系统方程及初始条件为：，其中，自由试求，使性能指标解：本例为线性定常系统，终端型性能指标自由，固定。控制受约束的最优控制问题由伴随方程：由横截条件：所以：根据极大值原理，最优控制函数应使H取极小值。为此，为使的函数H在约束条件下达到极小值，显然应取易知：故：将代入状态方程中：由此得例：设一阶系统方程为：，其中试求性能指标：为取极小的解：，固定，自由。由于H是u的线性函数，根据极大值原理。，使H绝对极小相当于使J极小，因此要求极小。当u与异号且u 取其边界值。故由伴随方程：由横截条件：所以显然：即为切换点。令此时t=ts 即故最优控制：将代入状态方程中，求最优曲线当时时，当时，所以3.4.极大值原理的应用一、最小时间控制问题最小时间控制问题，又称时间最优控制问题。它要求在容许控制范围内寻求最优控制，使系统以最短时间从任意初始状态转移到要求的目标集。例如要求导弹以最短时间击中目标，被控对象以最快时间达到平衡等。由于这种控制方式的目标泛函特别简单而且实用价值较大，所以在50年代初期就已发表了研究最短时间控制的论文。推动了现代控制理论的发展，而且现代控制理论的发展又反过来加深了对这种控制好方式内部规律的认识，并产生了一批更复杂的时间最优控制系统。例：设一阶系统状态方程为：性能指标：如果（1）无约束（2）的约束为试求，使性能指标J 为极小解：本例为线性定常积分型性能指标，固定，自由。令：（1）、无约束由正则方程：由横截条件：初始条件：所以，最优曲线最优控制：最优性能指标：（2）、有约束若伴随方程：状态方程：求切换点对应的时间，即当时，有所以：于是得：一般来说，求非线性系统和任意目标集的时间最优控制的解析解十分困难，在此考虑线性定常系统，且目标集为状态空间原点，即终端状态固定的时间最优控制问题。设已知系统的状态方程为：系统完全能控，且u(t)具有以下不等式约束j=1、2、r. 始端和终端条件为： t0=0, ,tf可变。试求控制作用u(t)使系统从初始状态转移到平衡状态（原点）所需时间最短。即J=tf构造哈密顿函数。设最优控制存在，则应用极小值原理，可推出以下结论：（1）最优曲线和最优伴随向量满足正则方程：（2）边界条件：x(0)=x0 ,x(tf)=0(3)在t0,tf上，对所有容许控制u(t)，下列关系成立即当>0时，u(t)越小，越小，因此取下限，=-1当<0时，u(t)越大，越小，=1当=0时，则因u(t)不定，无法用极小值原理确定，只能去满足的约束条件的任意值，这种情况称为奇异情况，对应状态方程称为奇异系统式。故：这种根据符号取的容许边界值的开关控制砰砰控制。他要求控制变量取边界值，但符号与相反（4）在最优曲线上，哈密顿函数恒为零，即因为：由于t=tf, x(tf)=0, 故在最优曲线上，哈密顿函数恒为零而，线性齐次定常微分方程所以最优控制=-sgn=-sgn=-sgn在此上讨论正常情况下时间最优控制问题，即可取-1和+1.随着时间变化，在这两个值上跳变，满足=0的诸点恰好是转换点这是一种继电器型控制，故有Bang-Bang控制之称。例：设人造卫星姿态控制系统方程为：边界条件为：，控制约束为性能指标为求最优控制，使J最小。解：本例为二次积分模型的最小时间控制问题，显然系统能控，故时间最优控制必为Bang-Bang控制 -sgn= 伴随方程：为直线，有极大值原理可知，要使HHmin, 的可能形式有：图在整个控制过程中，u(t)在-1+1最多只有一次转换，因此最优控制规律只有以下4种可能形式： 1, -1, +1,-1, +1,-1为确定究尽迭哪一种控制方式，要研究一下u取-1或1时，解时情况。若令=1，，在上述方程中清去t ，求的最优曲线为由于，故 x2(t)随 t的增大而增大，显然满足终端状态要求x1(tf)=x2(tf)=0的最优曲线为。表示为：，若令=-1，相应最优曲线为：满足终端状态x(tf)=0的最优曲线为，可表示为：曲线和在向平面上组合成曲线，称为开关线，即可见曲线将向平面分割为R+和R-两个区域R+=R-=当初始状态（x10，x20）为不同情况，分别论述如下：（1）若x0 在上，则在u(t)=-1作用下，不经切换，可直接沿运动至x(tf)=0，此时最优控制=-1，（2）若x0位于上，=1，（3）若x0位于R+区域C点则在u(t)作用下，沿u(t)=1的某一条抛物线转移到E，然后改变控制为u(t)=-1，沿转移到原点，此时=+1，-1，控制作用在E点处产生一次切换。C点CEEOO (4)若x0位于R-区域D点，则在u(t)=-1作用下，沿u(t)=-1的某一条抛物线转移到F点，然后在交点F处改变控制为u(t)= +1，沿转移到原点，此时=-1，+1，控制作用在F点处产生一次切换。D点DFFOO，由此可见：不论初始状态x0位于R+区域还是R-区域，将状态有已知初始状态向要求终端状态x(tf)=0转移时，都必须在曲线上改变控制的符号，产生控制切换，故称曲线开关曲线。初始状态x0唯一决定了当前应采用的最优控制；本例中；若定义开关函数h()=则最优控制可表示为双积分装置的时间最优控制框图如右图所示。计算系统状态转移最短时间tf的基本方法：把状态轨线按控制序列分成若干段，依次计算出每段所需时间，再求和。本例中 (1) 当时，=1当时，=-1故当时,(2) 当+时，即设初始点C到达曲线上点E的时间为，由于，因此有即：设由，到达原点所需时间为，则（3）同理，当位于R-时，即应当指出，在本例求解过程中，只采用了“最优控制必定使H极小”这一事实，以及形状提供了信息，并未具体求解协态，因而不需要“沿最优轨线H恒为零”这一条件。有些实际问题并不要求将终端状态转移到状态空间原点，而是到某一集合。例：以上例为例，要求，使系统由与上例的主要差别在于目标集不同，对于固定目标集而言，目标集改变只影响横截条件，有极小值原理，最优解的必要条件为（1）正则方程：状态方程：,伴随方程：（2）边界条件：（3）极小值条件：（4）沿最优轨线：根据极小值条件，由于,故不会变，根据乘子v的符号，只能是+1或-1.当时，初态位于

注意事项

本文（最优控制理论课件.doc）为本站会员（豆****）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。