第5章动态规划精选PPT.ppt
《第5章动态规划精选PPT.ppt》由会员分享,可在线阅读,更多相关《第5章动态规划精选PPT.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5章动态规划第1页,本讲稿共90页什么是动态规划o动态规划是解决多阶段决策过程最优化的动态规划是解决多阶段决策过程最优化的一种方法。一种方法。o19511951年美国数学家贝尔曼(年美国数学家贝尔曼(R RBellmanBellman)等人提出了解决这类问题的等人提出了解决这类问题的“最优化原理最优化原理”,并研究了许多实际问题。,并研究了许多实际问题。第2页,本讲稿共90页o在工程技术、企业管理、工农业生产及军在工程技术、企业管理、工农业生产及军事部门中都有广泛应用:解决最优路径问事部门中都有广泛应用:解决最优路径问题、资源分配问题、生产调度问题、库存题、资源分配问题、生产调度问题、库存问
2、题、装载问题、排序问题、设备更新问问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等。题、生产过程最优控制问题等等。o动态规划模型分类:离散确定型、离散随动态规划模型分类:离散确定型、离散随机型、连续确定型、连续随机型。机型、连续确定型、连续随机型。什么是动态规划第3页,本讲稿共90页5.15.1多阶段决策问题的最优化多阶段决策问题的最优化 o多阶段决策问题,是指可将过程划分为多阶段决策问题,是指可将过程划分为若干个互相联系的阶段,在它的每一个若干个互相联系的阶段,在它的每一个阶段都需要作出决策,并且一个阶段的阶段都需要作出决策,并且一个阶段的决策确定以后,常影响下一阶段的决策,
3、决策确定以后,常影响下一阶段的决策,从而影响整个过程的活动。从而影响整个过程的活动。o各个阶段所确定的决策就构成一个决策各个阶段所确定的决策就构成一个决策序列,通常称为策略。序列,通常称为策略。第4页,本讲稿共90页o由于每一个阶段可供选择的决策往往不只由于每一个阶段可供选择的决策往往不只一个,因而就有许多策略可供选择。一个,因而就有许多策略可供选择。o多阶段的决策问题,就是要在允许选择的多阶段的决策问题,就是要在允许选择的那些策略中,选择一个最优策略,使在预那些策略中,选择一个最优策略,使在预定的标准下达到最好的效果。定的标准下达到最好的效果。5.15.1多阶段决策问题的最优化多阶段决策问题
4、的最优化 第5页,本讲稿共90页5.15.1多阶段决策问题的最优化多阶段决策问题的最优化o阶段往往可以用时段来表示。阶段往往可以用时段来表示。o在各个时间阶段,采用不同的决策是随在各个时间阶段,采用不同的决策是随时间而变动的,这就有时间而变动的,这就有“动态动态”的含义。的含义。o它是在时间的推移过程中要在每一段选它是在时间的推移过程中要在每一段选择最恰当的决策,以期整体上达到最优。择最恰当的决策,以期整体上达到最优。第6页,本讲稿共90页o动态规划在一定条件下也可以解决一些与动态规划在一定条件下也可以解决一些与时间无关的问题,只要人为地引进时间无关的问题,只要人为地引进 时段时段 因素以后,
5、这些问题就可变为一个多阶段因素以后,这些问题就可变为一个多阶段决策问题。决策问题。5.15.1多阶段决策问题的最优化多阶段决策问题的最优化第7页,本讲稿共90页5.15.1多阶段决策问题的最优化多阶段决策问题的最优化o例例1 1 生产与存贮问题生产与存贮问题o 某工厂每月需供应市场一定数量的产某工厂每月需供应市场一定数量的产品,并将所余产品存入仓库。一般某月品,并将所余产品存入仓库。一般某月适当增加产量可降低生产成本,但超产适当增加产量可降低生产成本,但超产部分存入仓库会增加库存费用。要求确部分存入仓库会增加库存费用。要求确定一个逐月的生产计划,在满足需求条定一个逐月的生产计划,在满足需求条件
6、下,使一年的生产与存贮费用之和最件下,使一年的生产与存贮费用之和最小。小。o全年分为全年分为1212个阶段逐次决策。个阶段逐次决策。第8页,本讲稿共90页5.15.1多阶段决策问题的最优化多阶段决策问题的最优化o例例2 2投资决策问题投资决策问题o某公司现有资金某公司现有资金Q Q万元,在今后万元,在今后5 5年内考年内考虑给虑给A A,B B,C C,D 4D 4个项目投资,这些项个项目投资,这些项目投资的回收期限、回报率均不相同,目投资的回收期限、回报率均不相同,问该公司应如何确定这些项目每年的投问该公司应如何确定这些项目每年的投资额,使到第资额,使到第5 5年末拥有资金的本利总额年末拥有
7、资金的本利总额最大。最大。o这是一个这是一个5 5阶段决策问题。阶段决策问题。第9页,本讲稿共90页5.15.1多阶段决策问题的最优化多阶段决策问题的最优化o例例3 3设备更新问题设备更新问题o 企业在使用设备时都要考虑设备的更企业在使用设备时都要考虑设备的更新问题,因为设备越陈旧所需的维修费用新问题,因为设备越陈旧所需的维修费用越多,但购买新设备则要一次性支出较大越多,但购买新设备则要一次性支出较大的费用;现某企业要决定一台设备未来的费用;现某企业要决定一台设备未来8 8年的更新计划,已预测了第年的更新计划,已预测了第j j年购买设备年购买设备的价格为的价格为KjKj,设,设GjGj为设备经
8、过为设备经过j j年后的残年后的残值,值,CjCj为设备连续使用为设备连续使用j-1j-1年后在第年后在第j j年的年的维修费维修费(j(j1 1,2 2,8)8),问应在哪些年,问应在哪些年更新设备可使总费用最小。更新设备可使总费用最小。o这是一个这是一个8 8阶段决策问题阶段决策问题第10页,本讲稿共90页o例例4 4:最短路线问题:最短路线问题5.15.1多阶段决策问题的最优化多阶段决策问题的最优化图图5-3第11页,本讲稿共90页5.25.2动态规划的基本概念和基本原理动态规划的基本概念和基本原理5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念 使用动态规划方法解决多阶段决
9、策使用动态规划方法解决多阶段决策问题,首先要将实际问题写成动态规划问题,首先要将实际问题写成动态规划模型,此时要用到以下概念:模型,此时要用到以下概念:(1)(1)阶段;阶段;(2)(2)状态;状态;(3)(3)决策和策略;决策和策略;(4)(4)状态转移;状态转移;(5)(5)指标函数。指标函数。第12页,本讲稿共90页o例例4 4最短路线问题最短路线问题 5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念图图53如图如图5-35-3所示,给所示,给定一个线路网络图,定一个线路网络图,要从要从A A地向地向F F地铺设地铺设一条输油管道,各一条输油管道,各点间连线上的数字点间连线上
10、的数字表示距离,问应选表示距离,问应选择什么路线,可使择什么路线,可使总距离最短。总距离最短。第13页,本讲稿共90页o阶段和阶段变量:阶段和阶段变量:n将所给问题的过程,按时间或空间特征分解成将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,以便按次序去求每阶若干互相联系的阶段,以便按次序去求每阶段的解,常用字母段的解,常用字母k k表示表示阶段变量阶段变量。n例例4 4中,从中,从A A到到F,F,可以分成从可以分成从A A到到B(BB(B有两种选有两种选择择),从,从B B到到C(CC(C有四种选择有四种选择),从,从C C到到D(DD(D有三有三种选择种选择),从,从D D到
11、到E(EE(E有两种选择有两种选择),再从,再从E E到到F,F,五个阶段。五个阶段。k k1 1,2 2,3 3,4 4,5 5。5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第14页,本讲稿共90页状态和状态变量:状态和状态变量:-状态表示某一阶段初所处的位置或状况。状态表示某一阶段初所处的位置或状况。-通常一个阶段包含若干个状态。通常一个阶段包含若干个状态。描述状态的变量称为状态变量,常用描述状态的变量称为状态变量,常用sksk表示第表示第k k阶段的某阶段的某一状态,状态变量一状态,状态变量sksk的集合称为状态集合,用的集合称为状态集合,用SkSk表示。表示。5.2.1
12、 5.2.1 动态规划的基本概念动态规划的基本概念第15页,本讲稿共90页在例在例4 4中,第一阶段状态为中,第一阶段状态为A,A,第二阶段状态:第二阶段状态:B1B1,B2B2,或,或s1=As1=A,s21=B1 s21=B1,s22=B2s22=B2。状态变量的集合状态变量的集合:S1=AS1=AS2 S2 B1 B1,B2 B2 S3 S3 C1 C1,C2C2,C3 C3,C4 C4 S4 S4 D1 D1,D2D2,D3 D3 S5 S5 E1 E1,E2 E2 5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第16页,本讲稿共90页动态规划中的状态应具有如下性质:动态
13、规划中的状态应具有如下性质:1.1.代表性。能够反映过程的演变特征。代表性。能够反映过程的演变特征。2.2.可知性。能够通过某种方式,直接或间接地可知性。能够通过某种方式,直接或间接地确定下来。确定下来。3.3.无后效性。所谓无后效性,是指某阶段的状无后效性。所谓无后效性,是指某阶段的状态,只对该阶段状态以后过程的演变起作用,态,只对该阶段状态以后过程的演变起作用,而不受以前各阶段状态的影响。而不受以前各阶段状态的影响。n这就是说,过程的过去历史只能通过当前的这就是说,过程的过去历史只能通过当前的状态去影响它的未来的发展,当前的状态就状态去影响它的未来的发展,当前的状态就是未来过程的初始状态是
14、未来过程的初始状态 5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第17页,本讲稿共90页5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第18页,本讲稿共90页n要正确地定义状态变量,就必须对问题具要正确地定义状态变量,就必须对问题具有深入的观察和理解,可以从下面两个方有深入的观察和理解,可以从下面两个方面来考虑:面来考虑:1)1)把阶段连系在一起的因素是什么把阶段连系在一起的因素是什么?2)2)需要用什么信息来进行当前的决策,而不需要用什么信息来进行当前的决策,而不用检查以前阶段所作决策的可行性。用检查以前阶段所作决策的可行性。5.2.1 5.2.1 动态规划的基
15、本概念动态规划的基本概念第19页,本讲稿共90页决策和决策变量决策和决策变量:决策就是某阶段状态给定以后,从该状态演变到决策就是某阶段状态给定以后,从该状态演变到下一阶段某状态的选择。下一阶段某状态的选择。描述决策的变量,称为决策变量。描述决策的变量,称为决策变量。常用常用u uk k(s(sk k)表示第表示第k k阶段当状态为阶段当状态为s sk k时的决策变量。时的决策变量。在实际问题中,决策变量的取值往往限制在一定在实际问题中,决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,常用范围内,我们称此范围为允许决策集合,常用D Dk k(s(sk k)表示第表示第k k阶段从
16、状态阶段从状态s sk k出发的允许决策集合,出发的允许决策集合,显然有:显然有:u uk k(s(sk k)D Dk k(s(sk k)。5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第20页,本讲稿共90页在例在例4中,从第二阶段的状态集合为中,从第二阶段的状态集合为S2=B1,B2,从,从B1出发,允许决策集合为:出发,允许决策集合为:D2(B1)C1,C2,C3如我们决定选择如我们决定选择C3:,则可表为:,则可表为:u2(B1)C35.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第21页,本讲稿共90页策略和最优策略策略和最优策略:由第由第1阶段开始到最后一
17、个阶段终点为止的过程,阶段开始到最后一个阶段终点为止的过程,称为问题的全过程。由每阶段的决策称为问题的全过程。由每阶段的决策uk(sk)组成的组成的决策序列就构成一个全过程策略,简称为策略,记决策序列就构成一个全过程策略,简称为策略,记为为P1,n:P1,n(s1)=u1(s1),u2(s2),un(sn)由过程的第由过程的第k阶段开始到终点为止的过程,称为原阶段开始到终点为止的过程,称为原过程的后部子过程过程的后部子过程(或称为或称为k子过程子过程)。其决策函数。其决策函数序列称为序列称为k子过程策略,简称子策略,记为子过程策略,简称子策略,记为Pk,n 即:即:Pk,n(sk)=uk(sk
18、),uk+1(sk+1),un(sn)5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第22页,本讲稿共90页允许策略集合用允许策略集合用P表示。从允许策略集合中找出达到最优效表示。从允许策略集合中找出达到最优效果的策略称为最优策略。果的策略称为最优策略。在上图中,用在上图中,用P1,5=A,B1,C2,D2,E1,F是一个策略,是一个策略,P3,5=C2,D2,E1,F 是是P1,5的的一个子策略。一个子策略。5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第23页,本讲稿共90页状态转移方程状态转移方程 动态规划中本阶段的状态往往是上一阶段状态和上动态规划中本阶段的
19、状态往往是上一阶段状态和上一阶段的决策结果。如果给定了第一阶段的决策结果。如果给定了第k段的状态段的状态sk,则第,则第k+1段的状态段的状态sk+1 也就完全确定。也就完全确定。状态转移方程:由状态转移方程:由k段到段到k十十l段的状态转移规律段的状态转移规律,sk+1=Tk(sk,uk)。例例4中,状态转移方程为:中,状态转移方程为:sk+1=uk(sk)5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第24页,本讲稿共90页指标函数及最优指标函数指标函数及最优指标函数在多阶段决策过程最优化问题中,用来衡量所在多阶段决策过程最优化问题中,用来衡量所实现过程的优劣的数量指标,称为
20、指标函数;实现过程的优劣的数量指标,称为指标函数;它是一个定义在全过程和所有后部子过程上的它是一个定义在全过程和所有后部子过程上的确定的数量函数,常用确定的数量函数,常用Vk,n表示即:表示即:Vk,n=Vk,n(sk,sk+1,sn)指标函数指标函数Vk,n的最优值,称为相应的最优指标的最优值,称为相应的最优指标函数,记为函数,记为fk(sk)。5.2.1 5.2.1 动态规划的基本概念动态规划的基本概念第25页,本讲稿共90页5.25.2动态规划的基本概念和基本原理动态规划的基本概念和基本原理5.1.2.5.1.2.动态规划的基本原理动态规划的基本原理 BellmanBellman最优化原
21、理最优化原理作为整个过程的最优策略具有这样作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优而言,余下的诸决策必须构成最优策略。策略。第26页,本讲稿共90页结合例结合例4 4最短最短路线问题介绍动态路线问题介绍动态规划的基本思想。规划的基本思想。从过程的最后一段从过程的最后一段开始,用逆序递推开始,用逆序递推方法求解,逐步求方法求解,逐步求各段各点到终点厂各段各点到终点厂的最短路线,最后的最短路线,最后求得求得A A点到点到F F点的最点的最短路线。短路线。5.1
22、.2.动态规划的基本原理动态规划的基本原理第27页,本讲稿共90页o 第一步,从第一步,从s5开始,状态变量开始,状态变量s5可取两种可取两种状态状态E1,E2,它们到它们到F点的路长分别为点的路长分别为第二步,第二步,k4,状态变量,状态变量s5可取三个值可取三个值D1,D2,D3,这是经,这是经过一个中途点到达终点过一个中途点到达终点F的两级决策问题,从的两级决策问题,从D1到到F只有两条路只有两条路线,需加以比较,取其中最短的,即:线,需加以比较,取其中最短的,即:第28页,本讲稿共90页第29页,本讲稿共90页图7-2第30页,本讲稿共90页动态规划方法的基本思想:动态规划方法的基本思
23、想:(1)(1)将多阶段决策过程将多阶段决策过程划分阶段划分阶段,恰当地选取,恰当地选取状态变量、决策状态变量、决策变量变量及定义及定义最优指标函数最优指标函数,从而把问题化成一族同类型的子,从而把问题化成一族同类型的子问题,然后逐个求解。问题,然后逐个求解。(2)(2)求解时从求解时从边界条件边界条件开始,逆开始,逆(或顺或顺)过程行进方向,逐段过程行进方向,逐段递推寻优。在每一个子问题求解时,都要使用它前面已求递推寻优。在每一个子问题求解时,都要使用它前面已求出的子问题的最优结果,出的子问题的最优结果,最后一个子问题的最优解,就最后一个子问题的最优解,就是整个问题的最优解是整个问题的最优解
24、。(3)(3)动态规划方法是既把当前一段动态规划方法是既把当前一段与未来各段分开与未来各段分开,又把,又把当前效益当前效益和未来效益结合和未来效益结合起来考虑的一种最优化方法,因起来考虑的一种最优化方法,因此每段的最优决策选取是从全局考虑的,与该段的最优选此每段的最优决策选取是从全局考虑的,与该段的最优选择一般是不同的。择一般是不同的。5.1.2.动态规划的基本原理动态规划的基本原理第31页,本讲稿共90页o动态规划的基本方程是递推逐段求解的根据,一般动态规划的基本方程是递推逐段求解的根据,一般的动态规划基本方程可以表为:的动态规划基本方程可以表为:Bellman Bellman最优化原理:作
25、为整个过程的最优策略具有这最优化原理:作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。策所形成的状态而言,余下的诸决策必须构成最优策略。5.1.2.动态规划的基本原理动态规划的基本原理第32页,本讲稿共90页o动态规划的基本解题步骤如下:动态规划的基本解题步骤如下:第一步:划分阶段;第一步:划分阶段;第二步:确定状态变量及其取值范围;第二步:确定状态变量及其取值范围;1)1)代表性。代表性。2)2)可知性。可知性。3)3)无后效性。无后效性。第三步:确定决策变量及其取值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章动 规划 精选 PPT
限制150内