运筹与决策5动态规划.ppt
《运筹与决策5动态规划.ppt》由会员分享,可在线阅读,更多相关《运筹与决策5动态规划.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 动态规划动态规划不要过河拆桥动态规划 Dynamic programming五十年代贝尔曼(B.E.Bellman)为代表的研究成果属于现代控制理论的一部分以长远利益为目标的一系列决策最优化原理,可归结为一个递推公式5.1 动态规划的最优化原理及其算法5.1.1 求解多阶段决策过程的方法例5.1.1 最短路问题 决策树法可以枚举出可以枚举出20条路径,其中最短的路径长度为条路径,其中最短的路径长度为16 例 最短路问题表现为明显的阶段性一条从A 到B 的最短路径中的任何一段都是最短的 最优性原理最优性原理“最优策略的一部分也是最优的最优策略的一部分也是最优的”每步的决策只与相邻阶
2、段状态有关,每步的决策只与相邻阶段状态有关,而与如何达到这一状态无关而与如何达到这一状态无关因此我们可以从因此我们可以从B向回搜索最短路向回搜索最短路标记法标记法如何找出最短路径如何找出最短路径 5.1.2 动态规划的基本概念及递推公式状态(每阶段初始的出发点)最短路问题中,各个节点就是状态生产库存问题中,库存量是状态物资分配问题中,剩余的物资量是状态控制变量(决策变量)最短路问题中,走哪条路生产库存问题中,各阶段的产品生产量物资分配问题中,分配给每个地区的物资量阶段的编号与递推的方向一般采用反向递推,所以阶段的编号也是逆向的当然也可以正向递推 动态规划的步骤1、确定问题的阶段和编号2、确定状
3、态变量用 Sk 表示第 k 阶段的状态变量及其值3、确定决策变量用 xk 表示第 k 阶段的决策变量,并以 xk*表示该阶段的最优决策4、状态转移方程 sk-1=g(sk,xk)反向编号 sk+1=g(sk,xk)正向编号 5、直接效果直接一步转移的效果 dk(sk,xk)6、总效果函数指某阶段某状态下到终端状态的总效果,它是一个递推公式 动态规划的步骤hk 是一般表达形式,求当前阶段当前状态下的阶段最优总效果(1)如最短路问题,是累加形式,此时有终端的边际效果一般为终端的边际效果一般为 f0(s0,x0)=0(2)如串联系统可靠性问题,是连乘形式,此时有如串联系统可靠性问题,是连乘形式,此时
4、有终端的边际效果一般为终端的边际效果一般为 f0(s0,x0)=1从第从第1 1阶段开始,利用边际效果和边界条件,可以递推到最后阶段开始,利用边际效果和边界条件,可以递推到最后阶段阶段5.2 动态规划模型举例 5.2.1 产品生产计划安排问题 例1 某工厂生产某种产品的月生产能力为10件,已知今后四个月的产品成本及销售量如表所示。如果本月产量超过销售量时,可以存储起来备以后各月销售,一件产品的月存储费为2元,试安排月生产计划并做到:1、保证满足每月的销售量,并规定计划期初和期末库存为零;2、在生产能力允许范围内,安排每月生产量计划使产品总成本(即生产费用加存储费)最低。例1 产品生产计划安排设
5、xk为第k阶段生产量,则有直接成本 dk(sk,xk)=ck xk+2sk状态转移公式为 sk-1=sk+xk-yk总成本递推公式第一阶段第一阶段:(即第即第4月份月份)由边界条件和状态转移方程由边界条件和状态转移方程 s0=s1+x1 y1=s1+x1 6=0 得得 s1+x1=6 或或 x1=6 s1 0估计第一阶段,即第估计第一阶段,即第4月份初库存的可能状态:月份初库存的可能状态:0 s1 30 6 7 12=5,所以,所以,s1 0,5第一阶段最优决策表第二阶段:最大可能库存量 7 件由状态转移方程:s1=s2+x2 120 及 x210,可知 s22,7,min x2=5由阶段效果
6、递推公式有:f2(2,10)=d2(2,10)+f1*(0,6)=22+8010+456=1260得第二阶段最优决策表,如下第二阶段最优决策表第三阶段:最大可能库存量 4 件由状态转移方程:s2=s3+x3 72 及 x310,可知 s30,4,min x3=5由阶段效果递推公式有:f3(1,10)=d3(1,10)+f2*(4,8)=21+7210+1104=1826得第三阶段最优决策表,如下第三阶段最优决策表第四阶段:初始库存量 s4=0由状态转移方程:s3=s4+x460 可知 x46,由阶段效果递推公式有:f4(0,6)=d4(0,6)+f3*(0,10)=706+1902=2322得
7、第四阶段最优决策表,如下回回溯溯得得此此表表 例2 生产库存管理问题(连续变量)设某厂计划全年生产某种产品A。其四个季度的订货量分别为600公斤,700公斤,500公斤和1200公斤。已知生产产品A的生产费用与产品的平方成正比,系数为0.005。厂内有仓库可存放产品,存储费为每公斤每季度1元。求最佳的生产安排使年总成本最小。解:四个季度为四个阶段,采用阶段编号与季度顺序一致。设 sk 为第k季初的库存量,则边界条件为 s1=s5=0 设 xk 为第k季的生产量,设 yk 为第k季的订货量;sk,xk,yk 都取实数,状态转移方程为 sk+1=sk+xk-yk 仍采用反向递推,但注意阶段编号是正
8、向的 目标函数为例2 生产库存管理问题(连续变量)第一步:(第四季度)总效果 f4(s4,x4)=0.005 x42+s4 由边界条件有:s5=s4+x4 y4=0,解得:x4*=1200 s4 将x4*代入 f4(s4,x4)得:f4*(s4)=0.005(1200 s4)2+s4=7200 11 s4+0.005 s42第二步:(第三、四季度)总效果 f3(s3,x3)=0.005 x32+s3+f4*(s4)将 s4=s3+x3 500 代入 f3(s3,x3)得:例2 生产库存管理问题(连续变量)第三步:(第二、三、四季度)总效果 f2(s2,x2)=0.005 x22+s2+f3*(
9、s3)将 s3=s2+x2 700 代入 f2(s2,x2)得:注意:阶段最优总效果仅是当前状态的函数,与其后的决策无关 例2 生产库存管理问题(连续变量)第四步:(第一、二、三、四季度)总效果 f1(s1,x1)=0.005 x12+s1+f2*(s2)将 s2=s1+x1 600=x1 600 代入 f1(s1,x1)得:由此由此回溯回溯:得最优生产:得最优生产库存方案库存方案 x1*=600,s2*=0;x2*=700,s3*=0;x3*=800,s4*=300;x4*=900。5.2.2 资源分配问题例3 某公司有9个推销员在全国三个不同市场推销货物,这三个市场里推销人员数与收益的关系
10、如下表,试作出使总收益最大的分配方案。解解:设分配人员的顺序为市场:设分配人员的顺序为市场1,2,3,采用反向阶段编号。,采用反向阶段编号。设设 sk 为第为第k阶段尚未分配的人员数,边界条件为阶段尚未分配的人员数,边界条件为 s3=9 设设 xk 为第为第k阶段分配的推销人员数;仍采用反向递推,阶段分配的推销人员数;仍采用反向递推,状态转移方程为状态转移方程为 sk1=sk xk 目标函数为目标函数为 例3 第一阶段:给第三市场分配 s1 有09种可能,第一阶段最优决策表如下:为什么与为什么与例例1 的第一阶段的表有差别?的第一阶段的表有差别?因为不存在边界条件因为不存在边界条件 s0=0
11、例3 第二阶段:给第二市场分配 s2 有09种可能,第二阶段最优决策表如下:例3 第三阶段:给第一市场分配 由边界条件 s3=9,第三阶段最优决策表如下:得决策过程:得决策过程:x3*=2,x2*=0,x1*=7,f3*=218 即即 市场市场1 分配分配 2人,市场人,市场2 不分配不分配,市场,市场3 分配分配 7人人最优解与分配的顺序有关吗最优解与分配的顺序有关吗?5.2.2 资源分配问题例4 项目选择问题 某工厂预计明年有A,B,C,D四个新建项目,每个项目的投资额 wk及其投资后的收益 vk如右表所示。投资总额为30万元,问如何选择项目才能使总收益最大。上述问题的静态规划模型如下:这
12、是一类这是一类0-1规划问题规划问题该问题是经典的该问题是经典的旅行背包问题旅行背包问题(Knapsack)该问题是该问题是 NP-complete 例4 项目选择问题解:设项目选择的顺序为A,B,C,D;1、阶段 k=1,2,3,4 分别对应 D,C,B,A项目的选择过程2、第 k 阶段的状态 sk,代表第 k 阶段初尚未分配的投资额3、第 k 阶段的决策变量 xk,,代表第 k 阶段分配的投资额4、状态转移方程为 sk1=sk wk xk5、直接效益 dk(sk,xk)=vk 或 06、总效益递推公式 该问题的难点在于各阶段的状态的确定,当阶段增加时,状该问题的难点在于各阶段的状态的确定,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹 决策 动态 规划
限制150内