动态规划的基本原理和基本应用精选PPT.ppt
《动态规划的基本原理和基本应用精选PPT.ppt》由会员分享,可在线阅读,更多相关《动态规划的基本原理和基本应用精选PPT.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于动态规划的基本原理和基本应用第1页,讲稿共82张,创作于星期日2 动动态态规规划划是是解解决决多多阶阶段段决决策策过过程程最最优优化化问问题题的的一一种种方方法法。由由美美国国数数学学家家贝贝尔尔曼曼(Bellman)等等人人在在20世世纪纪50年年代代提提出出。他他们们针针对对多多阶阶段段决决策策问问题题的的特特点点,提提出出了了解解决决这这类类问问题题的的“最最优优化化原原理理”,并并成成功功地地解解决决了了生生产产管管理理、工工程程技技术术等等方方面的许多实际问题。面的许多实际问题。第2页,讲稿共82张,创作于星期日3 动动态态规规划划是是现现代代企企业业管管理理中中的的一一种种重重
2、要要决决策策方方法法,可可用用于于最最优优路路径径问问题题、资资源源分分配配问问题题、生生产产计计划划和和库库存存问问题题、投投资资问问题题、装装载载问问题题、排排序序问问题题及及生生产产过过程程的的最最优控制等。优控制等。第3页,讲稿共82张,创作于星期日4 9.1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例多阶段决策过程最优化多阶段决策过程最优化 多阶段决策过程是指这样一类特殊的活动过程,多阶段决策过程是指这样一类特殊的活动过程,他们可以按时间顺序分解成若干相互联系的阶段,在他们可以按时间顺序分解成若干相互联系的阶段,在每个阶段都要做出决策,全部过程的决策是一个决策每个阶段都要
3、做出决策,全部过程的决策是一个决策序列,所以多阶段决策问题也称为序贯决策问题。序列,所以多阶段决策问题也称为序贯决策问题。第4页,讲稿共82张,创作于星期日5例例1 1 多阶段资源分配问题多阶段资源分配问题 设设有有数数量量为为x的的某某种种资资源源,将将它它投投入入两两种种生生产产方方式式A和和B中中:以以数数量量y投投入入生生产产方方式式A,剩剩下下的的量量投投入入生生产产方方式式B,则则可可得得到到收收入入g(y)+h(x-y),其其中中g(y)和和h(y)是是已已知知函函数数,并并且且g(0)=h(0)=0;同同时时假假设设以以y与与x-y分分别别投投入入两两种种生生产产方方式式A,B
4、后后可可以以回回收收再再生生产产,回回收收率率分分别别为为a与与b。试试求求进进行行n个个阶阶段段后后的的最大总收入。最大总收入。第5页,讲稿共82张,创作于星期日6 若以若以y与与x-y分别投入生产方式分别投入生产方式A与与B,在第一,在第一阶段生产后回收的总资源为阶段生产后回收的总资源为x1=ay+b(x-y),再将,再将x1投入生产方式投入生产方式A和和B,则可得到收入,则可得到收入g(y1)+h(x1-y1),继续回收资源继续回收资源x2=ay1+b(x1-y1),若上面的过程进行若上面的过程进行n个阶段,我们希望选择个阶段,我们希望选择n个变量个变量y,y1,y2,yn-1,使这,使
5、这n个阶段的总收入最大。个阶段的总收入最大。例例1 1第6页,讲稿共82张,创作于星期日7 因因 此此,我我 们们 的的 问问 题题 就就 变变 成成:求求y,y1,y2,yn-1,以以 使使g(y)+h(x-y)+g(y1)+h(x1-y1)+g(yn-1)+h(xn-1-yn-1)达达 到到最大,且满足条件最大,且满足条件 x1=ay+b(x-y)x2=ay1+b(x1-y1)xn-1=ayn-2+b(xn-2-yn-2)yi与与xi均非负均非负,i=1,2,n-1 例例1 1第7页,讲稿共82张,创作于星期日8例例2 2 生产和存储控制问题生产和存储控制问题 某工厂生产某种季节性商品,需
6、要作下一某工厂生产某种季节性商品,需要作下一年度的生产计划,假定这种商品的生产周期需年度的生产计划,假定这种商品的生产周期需要两个月,全年共有要两个月,全年共有6个生产周期,需要作出个生产周期,需要作出各个周期中的生产计划。各个周期中的生产计划。设已知各周期对该商品的需要量如下表所示设已知各周期对该商品的需要量如下表所示:周期周期123456需求量需求量551030508第8页,讲稿共82张,创作于星期日9例例2 2 假设这个工厂根据需要可以日夜两班生产或只是日班生假设这个工厂根据需要可以日夜两班生产或只是日班生产,当开足日班时,每一个生产周期能生产商品产,当开足日班时,每一个生产周期能生产商
7、品1515个单位,个单位,每生产一个单位商品的成本为每生产一个单位商品的成本为100100元。当开足夜班时,每一元。当开足夜班时,每一生产周期能生产的商品也是生产周期能生产的商品也是1515个,但是由于增加了辅助性生产个,但是由于增加了辅助性生产设备和生产辅助费用,每生产一单位商品的成本为设备和生产辅助费用,每生产一单位商品的成本为120120元。由于生元。由于生产能力的限制,可以在需求淡季多生产一些商品储存起来以备产能力的限制,可以在需求淡季多生产一些商品储存起来以备需求旺季使用,但存储商品是需要存储需求旺季使用,但存储商品是需要存储费用的,假设每单位商费用的,假设每单位商品存储一周期需要品
8、存储一周期需要16元,已知开始时存储为零,年终也不存元,已知开始时存储为零,年终也不存储商品备下年使用,问应该如何作生产和存储计划,才能使储商品备下年使用,问应该如何作生产和存储计划,才能使总的生产和存储费用最小?总的生产和存储费用最小?第9页,讲稿共82张,创作于星期日10例例2 2 设第设第i个周期的生产量为个周期的生产量为xi,周期末的存储量为,周期末的存储量为ui,那,那么这个问题用式子写出来就是:求么这个问题用式子写出来就是:求x1,x2,x6,满足条件:,满足条件:x1=5+u1 x2+u1=5+u2 x3+u2=10+u3 x4+u3=30+u4 x5+u4=50+u5 x6+u
9、5=8 0 xi 30,0 uj,i=1,2,6;j=1,2,5 使使 S=为最小,其中为最小,其中第10页,讲稿共82张,创作于星期日11 例例例例3 3 3 3 运运输输网网络络问问题题:如如图图1 1所所示示的的运运输输网网络络,点点间间连连线线上上的的数数字字表表示示两两地地距距离离(也也可可是是运运费费、时时间间等等),要求从要求从v v1 1至至v v1010的最短路线。的最短路线。这这种种运运输输网网络络问问题题也也是是静静态态决决策策问问题题。但但是是,按按照照网网络络中中点点的的分分布布,可可以以把把它它分分为为4 4个个阶阶段段,而而作作为多阶段决策问题来研究。为多阶段决策
10、问题来研究。第11页,讲稿共82张,创作于星期日121234图图1 1 运输网络图示运输网络图示第12页,讲稿共82张,创作于星期日13动态规划方法导引动态规划方法导引 为了说明动态规划的基本思想方法和特点,下面以为了说明动态规划的基本思想方法和特点,下面以图图1 1所示为例讨论求最短路问题的方法。所示为例讨论求最短路问题的方法。第第第第一一一一种种种种方方方方法法法法称称称称做做做做全全全全枚枚枚枚举举举举法法法法或或或或穷穷穷穷举举举举法法法法,它它的的基基本本思思想想是是列列举举出出所所有有可可能能发发生生的的方方案案和和结结果果,再再对对它它们们一一一一进进行行比比较较,求求出出最最优
11、优方方案案。这这里里从从v v1 1到到v v1010的的路路程程可可以以分分为为4 4个个阶阶段段。第第一一二二段段的的走走法法有有三三种种,第第三三段段的的走走法法有有两两种种,第第四四段段的的走走法法仅仅一一种种,因因此此共共有有332133211818条条可可能能的的路路线线,5454次次加加法法算算出出各各条条路路线线的的距距离离,最最后后进进行行1717次次两两两两比比较较,可可知最优路线是知最优路线是v v1 1 v v2 2 v v5 5 v v8 8 v v10 10,最短距离是最短距离是2727第13页,讲稿共82张,创作于星期日14 显显然然,当当组组成成交交通通网网络络
12、的的节节点点很很多多时时,用用穷穷举举法法求求最最优优路路线线的的计计算算工工作作量量将将会会十十分分庞庞大大,而而且且其其中中包包含含着着许许多重复计算多重复计算 第第第第二二二二种种种种方方方方法法法法即即即即所所所所谓谓谓谓“局局局局部部部部最最最最优优优优路路路路径径径径”法法,是是说说某某人人从从k k出出发发,他他并并不不顾顾及及全全线线是是否否最最短短,只只是是选选择择当当前前最最短短途途径径,“逢逢近近便便走走”,错错误误地地以以为为局局部部最最优优会会致致整整体体最最优优,在在这这种种想想法法指指导导下下,所所取取决决策策必必是是v v1 1 v v2 2 v v5 5 v
13、v9 9 v v1010 ,全全程程长长度度是是3030;显显然然,这这种种方方法法的的结结果果常常是是错误的错误的第14页,讲稿共82张,创作于星期日15 第第三三种种方方法法是是动动态态规规划划方方法法,动动态态规规划划方方法法寻寻求求该该最最短短路路问问题题的的基基本本思思想想是是,首首先先将将问问题题划划分分为为4 4个个阶阶段段,每每次次的的选选择择总总是是综综合合后后继继过过程程的的一一并并最最优优进进行行考考虑虑,在在各各段段所所有有可可能能状状态态的的最最优优后后继继过过程程都都已已求求得得的的情情况况下下,全全程程的最优路线便也随之得到。的最优路线便也随之得到。为为了了找找出
14、出所所有有可可能能状状态态的的最最优优后后继继过过程程,动动态态规规划划方方法法是是从从过过程程的的最最后后阶阶段段开开始始考考虑虑,然然后后逆逆着着实实际际过过程程发发展展的的顺顺序序,逐逐段段向向前前递递推推计计算算直直至至始始点。点。第15页,讲稿共82张,创作于星期日16具具体体说说,此此问问题题先先从从v v1010开开始始,因因为为v v1010是是终终点点。再再无无后后继继过过程程,故故可可以以接接着着考考虑虑第第4 4阶阶段段上上所所有有可可能能状状态态v v8 8,v v9 9的的最最优优后后续续过过程程因因为为从从v v8 8,v v9 9 到到v v1010的的路路线线是
15、是唯唯一一的的,所所以以v v8 8,v v9 9 的的最最优优决决策策和和最最优优后后继继过过程程就就是是到到v v1010 ,它它们们的的最最短短距距离离分别是分别是1010和和1414。接接着着考考虑虑阶阶段段3 3上上可可能能的的状状态态v v5 5,v v6 6,v v7 7 到到v v1010的的最最优优决决策策和和最最优优后后继继过过程程在状态在状态V V5 5上,虽然到上,虽然到v v8 8是是6 6,到,到v v9 9是是5 5,但是,但是1234(10)(14)第16页,讲稿共82张,创作于星期日17综综合合考考虑虑后后继继过过程程整整体体最最优优,取取最最优优决决策策是是
16、到到v v8 8,最最优优后后继继过过程程是是v v5 5v v8 8 v v10 10,最最短距离是短距离是1616同理,状态同理,状态v v6 6的最优决策是至的最优决策是至v v8 8 ;v v7 7的最优决策是到的最优决策是到v v9 9 。同同样样,当当阶阶段段3 3上上所所有有可可能能状状态态的的最最优优后后继继过过程程都都已已求求得得后后,便便可可以以开开始始考考虑虑阶阶段段2 2上上所所有有可可能能状状态态的的最最优优决决策策和和最最优优后后继继过过程程,如如v v2 2的的最最优优决决策策是到是到v v5 5,最优路线是最优路线是1234(10)(14)(16)(15)(17
17、)第17页,讲稿共82张,创作于星期日18v v2 2v v5 5v v8 8v v10 10,最短距离是,最短距离是2222依此类推,最后可以得到从初始状态依此类推,最后可以得到从初始状态v v1 1的最优决的最优决策是到策是到v v2 2最优路线是最优路线是v v1 1v v2 2v v5 5v v8 8v v10 10,全程的最短距离是,全程的最短距离是2727。图。图1 1中红线表示最中红线表示最优路线,每点上圆括号内的数字表示该点到终点的最短路距离。优路线,每点上圆括号内的数字表示该点到终点的最短路距离。1234(10)(14)(16)(15)(17)(22)(22)(21)(27)
18、第18页,讲稿共82张,创作于星期日19综上所述可见,全枚举法虽可找出最优方案,但不是个好算法,综上所述可见,全枚举法虽可找出最优方案,但不是个好算法,局部最优法则完全是个错误方法,只有动态规划方法属较科学局部最优法则完全是个错误方法,只有动态规划方法属较科学有效的算法。它的基本思想是,把一个比较复杂的问题分解为有效的算法。它的基本思想是,把一个比较复杂的问题分解为一系列同类型的更易求解的子问题,便于应用计算机。整个求一系列同类型的更易求解的子问题,便于应用计算机。整个求解过程分为两个阶段,先按整体最优的思想逆序地求出各个子解过程分为两个阶段,先按整体最优的思想逆序地求出各个子问题中所有可能状
19、态的最优决策与最优路线值,然后再顺序地问题中所有可能状态的最优决策与最优路线值,然后再顺序地求出整个问题的最优策略和最优路线。计算过程中,系统地删求出整个问题的最优策略和最优路线。计算过程中,系统地删去了所有中间非最优的方案组合,从而使计算工作量比穷举法去了所有中间非最优的方案组合,从而使计算工作量比穷举法大为减少。大为减少。第19页,讲稿共82张,创作于星期日20拾火柴游戏拾火柴游戏:桌子上放桌子上放30根火柴根火柴,每人一次可每人一次可拾起拾起13根根,谁拾起最后一根火柴谁输谁拾起最后一根火柴谁输,如果你如果你先选择先选择,如何保证你能赢得游戏?如何保证你能赢得游戏?29252117139
20、51动态规划与倒推求解动态规划与倒推求解:第20页,讲稿共82张,创作于星期日21动态规划是解决动态规划是解决多阶段决策问题多阶段决策问题的一种方法。所谓多阶段的一种方法。所谓多阶段决策问题是指这样的决策问题:其过程可分为若干个相互联决策问题是指这样的决策问题:其过程可分为若干个相互联系的阶段,每一阶段都对应着一组可供选择的决策,每一决系的阶段,每一阶段都对应着一组可供选择的决策,每一决策的选定即依赖于当前面临的状态,又影响以后总体的效果。策的选定即依赖于当前面临的状态,又影响以后总体的效果。ABCDE状态A状态B状态C状态D状态E状态F决策A决策D决策E当每一阶段的决策选定以后,就构成一个决
21、策序列,称为一个当每一阶段的决策选定以后,就构成一个决策序列,称为一个决策B决策C策略策略,它对应着一个确定的效果。它对应着一个确定的效果。多阶段决策问题就是寻找使多阶段决策问题就是寻找使此效果最好的策略。此效果最好的策略。第21页,讲稿共82张,创作于星期日22动态规划问题实例动态规划问题实例例例 给定一个线路网络,给定一个线路网络,AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143要从要从A向向F铺设一条输油管道,铺设一条输油管道,各点间连线上的数字表示距离,问应选择什么路线,可使总各点间连线上的数字表示距离,问应选择什么路线,可使总距离最短?
22、距离最短?第22页,讲稿共82张,创作于星期日239.2 动态规划的基本概念和基本原理动态规划的基本概念和基本原理一、基本概念一、基本概念阶段阶段:是指问题需要做出决策的步数。阶段总数常记为:是指问题需要做出决策的步数。阶段总数常记为n,相,相应的是应的是n个阶段的决策问题。阶段的序号常记为个阶段的决策问题。阶段的序号常记为k,称为,称为阶段阶段变量变量,k=1,2,n.k即可以是顺序编号也可以是逆序编号,即可以是顺序编号也可以是逆序编号,常用顺序编号。常用顺序编号。全过程全过程;后部子过程后部子过程。状态状态:各阶段开始时的客观条件,第:各阶段开始时的客观条件,第k阶段的状态常用阶段的状态常
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 基本原理 基本 应用 精选 PPT
限制150内