第七章-最优控制:最大值原理ppt课件.ppt
经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第四章第四章 最优控制最优控制第一节第一节 最大值原理最大值原理第二节第二节 其他终结条件其他终结条件第三节第三节 变分法与最优控制的比较变分法与最优控制的比较第四节第四节 政治商业周期政治商业周期经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用导入例子导入例子最大化n满足n和自由表示资源的储量表示时间 时这种资源的抽取速度表示使用资源带来的总效用经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用状态变量是用来描述某一状态范围内所给定的变量,在状态不变的情况下,状态变量的值也就是一定的。n控制变量是引起状态变量变动的变量。n变分法是寻求状态变量 的最优时间路径,最优控制理论把决定控制变量 的最优时间路径作为首要任务。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用自由端点问题(垂直终结线):最大化n满足n和,对于所有的自由(A、T给定)n汉密尔顿函数:n解决最优控制问题的工具是汉密尔顿函数。包含被积函数 加上共积变量 与函数 的乘积。第一节第一节 最大值原理最大值原理经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(一)最大值原理(一)最大值原理对于所有的的运动方程的运动方程横截条件关于 最大化 的这种要求称为最大值原理。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用曲线1有内部解;曲线2和3有边界解。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用最大化n满足n和(给定)n根据运动方程:n所以n步骤步骤1 推导新的目标泛函推导新的目标泛函n证明思路:由原泛涵证明思路:由原泛涵 推导出新泛涵推导出新泛涵 ,根据新泛涵,根据新泛涵 推导得到最大值原理的三个条件和一般横截条件。推导得到最大值原理的三个条件和一般横截条件。(二)最大值原理的证明n把汉密尔顿函数定义为:n则新泛函为:n根据分部积分公式n新泛函为:n上页推导得到:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n根据汉密尔顿函数 ,得:n状态变量的运动方程n最大化n满足n和(给定)推导得到最大值推导得到最大值原理的条件之一原理的条件之一n步骤步骤2 推导状态变量推导状态变量 的运动方程的运动方程n以上两个方程右边相同,因此左边相等:以上推导得到:的邻近路径:的邻近路径:n更进一步,如果 与 都是可变的,则有:n新目标泛函 的新形式:n步骤步骤3 推导新目标泛函推导新目标泛函 的另一种形式的另一种形式上页推导得到n 的第一项对 求导,得:n 的后两项对 求导,得:n令 ,即(7.28)与(7.29)的和设为零得:(7.28)(7.29)(7.30)n步骤步骤4 令令 推导另外两个条件和横截条件推导另外两个条件和横截条件经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(7.30)n由于 是任意的,因此:推导得到最大值推导得到最大值原理的条件之二原理的条件之二n由于 是任意的,因此:推导得到最大值推导得到最大值原理的条件之三原理的条件之三n由于积分项(即第一项)为零,因此:推导得到最大值原推导得到最大值原理的一般横截条件理的一般横截条件n上页推导得到:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第二节第二节 其他终结条件其他终结条件固定终结点的横截条件:(和 给定)n水平终结线的横截条件:n一般横截条件:(7.30)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n终结曲线的横截条件:n终结曲线n一般横截条件:(7.30)n一般横截条件:(7.30)n截断垂直终结线:对于n情况一n情况二对于令 ,n根据库恩塔克条件对于n综合情况一和二:情况一情况一情况二情况二经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n一般横截条件:对于(7.30)n截断水平终结线:n情况一n情况二n综合情况一和二:对于情况一情况一情况二情况二经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用例1 最大化n满足n和n步骤1n汉密尔顿函数:的解是最大化(7.39)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n步骤2n可以得到通解:n汉密尔顿函数:(任意)(7.40)n例1 最大化n满足n和n步骤步骤3n解方程:解方程:n该方程属于该方程属于 这种类型。这种类型。n这里的这里的和n根据标准公式根据标准公式,它的解如下它的解如下:(7.41)n把把(7.39)和和(7.40)代入状态变量的运动方程,得:代入状态变量的运动方程,得:(7.39)(7.40)n以上推导得到:以上推导得到:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n步骤步骤4 4n根据边界条件根据边界条件和和n代入代入 ,得:,得:n把这些代入把这些代入(7.41)、(7.40)和和(7.39)得:得:n以上推导得到:以上推导得到:(7.39)(7.40)(7.41)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第三节第三节 变分法与最优控制的比较变分法与最优控制的比较一、最简单的问题最大化满足和经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用运动方程具有如下简单形式 ,并且 的选择是无约束的。一个特例最大化满足把运动方程 代入被积函数,我们可以消去,以上最优控制问题可以重新写成变分法问题:最大化满足最优控制问题:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用二、变分法与最优控制的比较最大化满足(7.2)最优控制问题:汉密尔顿函数是:最大值原理可列出下列条件:(7.56)第一个方程可重写为 ,考虑到第二个方程,它进一步可写为:(7.57)(7.57)关于 求导,得:第三个方程给出了 的另一个表达式,因此得:欧拉方程欧拉方程经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用上页推导得到:当关于 最大化汉密尔顿函数时,除了满足一阶条件之外,还要满足二阶必要条件 。这就是勒让德必要条件。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用最优控制垂直终结线的横截条件:以上推导得到:(7.57)把(7.57)式代入该横截条件,得:这就是变分法垂直终结线的横截条件。最优控制水平终结线的横截条件:根据以上例子的汉密尔顿函数 ,最优控制水平终结线的横截条件可变为:(7.56)把(7.56)和(7.57)式代入该横截条件,得:这就是变分法水平终结线的横截条件。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第四节第四节 政治商业周期政治商业周期一、选举函数与菲利普斯曲线选举函数:为失业率,为通货膨胀率。菲利普斯曲线:其中,表示预期通货膨胀率。其中,度量执政党的得票能力。预期通货膨胀率 按照适应性预期理论生成:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用最大化满足(7.61)最优控制问题:为了定量求解,诺德豪斯假设如下函数形式:二、最优控制问题和最大化满足(7.64)最优控制问题:和(7.62)(7.63)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用三、最大化汉密尔顿函数最大化满足(7.64)最优控制问题:和汉密尔顿函数为:关于控制变量U最大化H,我们有一阶条件:二阶条件:(7.66)因此,(7.66)式的控制路径最大化了汉密尔顿函数。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用汉密尔顿函数:的运动方程:这是一阶非齐次线性微分方程,该方程的特解为:对应的一阶齐次线性微分方程的通解为:该一阶非齐次线性微分方程的通解为:根据垂直终结线的横截条件:代入(7.67)得最优共态路径:四、最优共态路径(7.67)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用五、最优控制路径以上得到最优共态路径:控制路径:(7.66)把 代入(7.66)得到最优共态路径:是 的减函数,因为经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用预备知识一:对定积分的求导对于函数(1)莱布尼兹法则对定积分的求导(2.6)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(2)积分上限函数的求导(2.8)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用由积分中值定理得证:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(3)对积分下限函数求导证:根据对积分上限函数求导的公式,得:(2.9)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(4)如果定积分具有如下形式:根据(2.6)式和(2.8)式,得:(2.11)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用一阶线性微分方程标准形式:若 Q(x)0,若 Q(x)0,称为非齐次方程非齐次方程.1.解齐次方程分离变量两边积分得故通解为称为齐次方程齐次方程;预备知识二:一阶线性微分方程经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用对应齐次方程通解齐次方程通解非齐次方程特解2.解非齐次方程用常数变易法常数变易法:则故原方程的通解即即作变换两端积分得经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用例例.解方程 解解:先解即积分得即用常数变易法常数变易法求特解.则代入非齐次方程得解得故原方程通解为令