运筹学课件动态规划精.ppt
《运筹学课件动态规划精.ppt》由会员分享,可在线阅读,更多相关《运筹学课件动态规划精.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹学课件动态规划2023/2/24运筹学课件第1页,本讲稿共68页2023/2/24运筹学课件 动态规划所研究的对象是多阶段决策问题。动态规划所研究的对象是多阶段决策问题。所谓所谓多阶段决策问题是多阶段决策问题是指一类活动过程,它可以指一类活动过程,它可以分为若干个相互联系的阶段,在每个阶段都需要作出决分为若干个相互联系的阶段,在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益,而且决定下一策。这个决策不仅决定这一阶段的效益,而且决定下一阶段的初始状态。阶段的初始状态。每个阶段的决策确定以后,就得到一个决策序每个阶段的决策确定以后,就得到一个决策序列,称为策略。多阶段决策问题就是求一个
2、策略,列,称为策略。多阶段决策问题就是求一个策略,使各阶段的效益的总和达到最优。使各阶段的效益的总和达到最优。8.1 多阶段决策问题与动态规划多阶段决策问题与动态规划第2页,本讲稿共68页2023/2/24运筹学课件安全过河问题安全过河问题古代有3位商人各自带了一个仆人外出来到了一个渡口,渡口只有一条小船每次只能乘2人,仆人私下约定只要岸上的仆人人数超过商人人数,就可杀人越货.但是过河的决策由商人制定.问商人如何安全的渡过河去?第3页,本讲稿共68页2023/2/24运筹学课件第4页,本讲稿共68页2023/2/24运筹学课件一、多阶段决策问题1.时间阶段的例子(机器负荷问题)某厂有1000台
3、机器,现需作一个五年计划,以决定每年安排多少台机器投入高负荷生产(产量大但损耗也大)可使五年的总产量最大。123 4 5S1=1000 x1x2x5x4x3s5v1v2v3v4v5s2s3s48.1 多阶段决策问题与动态规划多阶段决策问题与动态规划第5页,本讲稿共68页2023/2/24运筹学课件2.空间阶段的例子(最短路问题)如图为一线路网络。现要从A点铺设一条管道到E点,图中两点间连线上数字表示两点间距离。现需选一条由A到E的铺管线路,使总距离最短。AEB1B2B3C1C2C3D1D229531225156468101312111410阶段1 阶段2 阶段3 阶段4第6页,本讲稿共68页2
4、023/2/24运筹学课件动态规划解决问题的基本特征1.动态规划一般解决最值(最优,最大,最小,最长)问题;2.动态规划解决的问题一般是离散的,可以分解(划分阶段)的;3.动态规划解决的问题必须包含最优子结构,即可以由(n1)的最优推导出n的最优第7页,本讲稿共68页2023/2/24运筹学课件动态规划模型的分类:动态规划模型的分类:以以“时间时间”角度可分成:角度可分成:离散型离散型和连续型。和连续型。从信息确定与否可分成:从信息确定与否可分成:确定型确定型和随机型。和随机型。从目标函数的个数可分成:从目标函数的个数可分成:单目标单目标型和多目标型。型和多目标型。第8页,本讲稿共68页202
5、3/2/24运筹学课件1.基本概念阶段(StageStage)分步求解的过程,用阶段变量k表示,k=1,n状态(StateState)每阶段初每阶段初可能的情形或位置,用状态变量Sk表示。按状态的取值是离散或连续,将动态规划问题分为 离散型和连续型。决策(Decision Decision)每阶段状态确定后的抉择,即从该状态演变到下阶段某状态的选择,用决策变量xk表示。状态转移由Sk转变为Sk+1的规律,记Sk+1=T(Sk,xk)。策略(PolicyPolicy)由各阶段决策组成的序列,记P1n=x1,xn,称Pkn=xk,xn为阶段k至n的后部子策略。8.28.2基本概念与方程基本概念与方
6、程第9页,本讲稿共68页2023/2/24运筹学课件决策显然,从上图可以看出,当前状态通过决策,回到了以前状态.可见决策其实就是状态之间的桥梁。而以前状态也就决定了当前状态的情况。KSkSk+1XkVk第10页,本讲稿共68页2023/2/24运筹学课件过河:决策向量xk(I,J)初始状态s1是T(3,3)结束状态sn是 T(0,0)可达状态有哪些?(3,J)(2,2)(1,1)(0,J)0321123AJII 表示留在左岸的商人人数J 表示留在左岸的仆人人数第11页,本讲稿共68页2023/2/24运筹学课件阶段指标每阶段选定决策xk后所产生的效益,记 vk=vk(Sk,xk)。指标函数各阶
7、段的总效益,记相应于Pkn的指标函数 为vkn=vkn(Sk,Pkn)。其中最优的称最优 指标函数,记 fk=fk(Sk)=opt vkn。问题:动态规划的最优解和最优值各是什么?最优解:最优策略P1n,最优值:最优指标f1。第12页,本讲稿共68页2023/2/24运筹学课件多阶段决策过程多阶段决策过程 d1 d2 dNs1 s2 s3 sN sN+1 1 2 N V1 V2 VN N 阶段决策系统示意图第13页,本讲稿共68页2023/2/24运筹学课件2.基本原理与基本方程(1)基本原理以最短路为例说明第14页,本讲稿共68页2023/2/24运筹学课件(2)基本方程根据最优性原理,可建
8、立从后向前逆推求解的递推公式基本方程:通常动态规划问题的最优值函数满足递推关系式.。边界条件第15页,本讲稿共68页2023/2/24运筹学课件 动态规划求解的一般步骤:-确定过程的分段,构造状态变量;-设置决策变量,写出状态转移;-列出阶段指标和指标函数;-写出基本方程,由此逐段递推求解。KSkSk+1XkVk8.3 动态规划的求解方法动态规划的求解方法第16页,本讲稿共68页2023/2/24运筹学课件例1 用动态规划方法求解前面的最短路问题。AEB1B2B3C1C2C3D1D2295312251564681013121114101.离散型离散型求解方法求解方法第17页,本讲稿共68页20
9、23/2/24运筹学课件 标号法求解标号法求解在每个节点上标出从该节点到终点终点的最短距离AEB1B2B3C1C2C3D1D229531225156468101312111410始端终端0528712201419191234逆序解法第18页,本讲稿共68页2023/2/24运筹学课件AEB1B2B3C1C2C3D1D229531225156468101312111410请在每个节点上标出从该节点到始点始点的最短距离顺序解法第19页,本讲稿共68页2023/2/24运筹学课件解:设阶段k=1,2,3,4依次表示4个阶段选路的过程;状态sk表示k阶段初可能处的位置;决策xk表示k阶段初可能选择的路
10、;阶段指标vk表示k阶段与所选择的路段相应的路长;指标函数 vk4=表示k至4阶段的总路长;用表格方式求解用表格方式求解逆推第20页,本讲稿共68页2023/2/24运筹学课件AEB1B2B3C1C2C3D1D2295312251564681013121114104k Sk xk vk vkn=vk+fk+1 fk3C1C2C38712C1D1EC2D2EC3D2E第21页,本讲稿共68页2023/2/24运筹学课件k Sk xk vk vkn=vk+fk+1 fkAEB1B2B3C1C2C3D1D2295312251564681013121114102B1B2B320B1C1D1E14B2C
11、1D1E19B3C2D2E第22页,本讲稿共68页2023/2/24运筹学课件k Sk xk vk vkn=vk+fk+1 fkAEB1B2B3C1C2C3D1D2295312251564681013121114101A19AB2C1D1EP*14=AB2C1D1Ef1=19(最短路)(最短距)第23页,本讲稿共68页2023/2/24运筹学课件作业作业:用表格方式法求解用表格方式法求解8.2,并给出阶段并给出阶段,状态变量状态变量,决决策变量策变量.状态转移方程和指标函数状态转移方程和指标函数;最优值函数最优值函数第24页,本讲稿共68页2023/2/24运筹学课件第25页,本讲稿共68页2
12、023/2/24运筹学课件2.连续型(用公式递推求解)例2 用动态规划方法求解前面的机器负荷问题。某种机器可以在高、低两种负荷下进行生产。高负荷年产量8,年完好率0.7;低负荷年产量5,年完好率0.9。现有完好机器1000台,需制定一个5年计划,以决定每年安排多少台机器投入高、低负荷生产,使5年的总产量最大。123 4 5S1=1000 x1x2x5x4x3s5v1v2v3v4v5s2s3s4第26页,本讲稿共68页2023/2/24运筹学课件阶段指标vk=8xk+5(sk-xk)表示第k年的产量;指标函数vkn=表示第k至5年的总产量;解:设阶段k=1,5表示第k年安排机器的过程;状态sk表
13、示第k年初的完好机器台数;决策xk表示第k年投入高负荷的机器台数;则投入低负荷的台数为sk-xk;状态转移sk+1=0.7xk+0.9(sk-xk);第27页,本讲稿共68页2023/2/24运筹学课件f5(S5)是关于x5的单调增函数 x5*=S5 f5(S5)=8S5第28页,本讲稿共68页2023/2/24运筹学课件5年的最大总产量为23.721000=23720。第29页,本讲稿共68页2023/2/24运筹学课件逆推解法的特点:123 4 5 S1x1x2x5x4x3s5v1v2v3v4v5s2s3s4始端已知终端边界值取0或11.已知初始状态s12.最优值函数fk(sk)表示第k阶
14、段的初始状态为sk,从k阶段到n阶段的最优值.该问题的最优值f1(s1)3.边界条件是fn+1=0或者14.递推关系是 fk(sk)=opt(vk+fk+1)第30页,本讲稿共68页2023/2/24运筹学课件第四节 动态规划应用举例 本节将通过动态规划的四种应用类型静态规划问题的动态规划求解、资源分配问题、复合系统可靠性问题、设备更新问题,进一步介绍动态规划的特点和处理方法。第31页,本讲稿共68页2023/2/24运筹学课件123 S1x1x2x3v1v2v3s2s3s4三阶段决策问题状态变量Sk:s1,s2,s3,s4决策变量为xi:x1,x2,x3例子例子:一、静态规划问题的动态规划求
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 课件 动态 规划
限制150内