第二次课动态规划PPT讲稿.ppt
《第二次课动态规划PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第二次课动态规划PPT讲稿.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二次课动态规划第1页,共84页,编辑于2022年,星期二本周POJ上做题:动态规划n1037 A decorative fence1037 A decorative fence、1050 To the Max1050 To the Max、1088 1088 滑雪、滑雪、1125 Stockbroker Grapevine1125 Stockbroker Grapevine、1141 Brackets Sequence1141 Brackets Sequence、1159 Palindrome1159 Palindrome、1160 Post Office1160 Post Office、1
2、163 The Triangle1163 The Triangle、1458 Common Subsequence1458 Common Subsequence、1579 Function Run Fun1579 Function Run Fun、1887 Testing the CATCHER1887 Testing the CATCHER、1953 World Cup Noise1953 World Cup Noise、2386 Lake Counting2386 Lake Counting第2页,共84页,编辑于2022年,星期二 动动态态规规划划是是19511951年年由由美美国国数数
3、学学家家贝贝尔尔曼曼(Richard Richard Bellman)Bellman)提提出出,它是解决一类多阶段决策问题的优化方法,也是考察问题的一种途径。它是解决一类多阶段决策问题的优化方法,也是考察问题的一种途径。动动态态规规划划方方法法是是现现代代企企业业管管理理中中的的一一种种重重要要决决策策方方法法。如如果果一一个个问问题题可可将将其其过过程程划划分分为为若若干干个个相相互互联联系系的的阶阶段段问问题题,且且它它的的每每一一阶阶段段都都需需进进行行决决策策,则则这这类类问问题题均均可可用用动动态态规规划划方方法法进进行求解。行求解。根根据据多多阶阶段段决决策策过过程程的的时时序序和
4、和决决策策过过程程的的演演变变,动动态态规规划划方方法法有有以以下下四四种种类类型型:离离散散确确定定型型、离离散散随随机机型型、连连续续确确定定型型和和连续随机型连续随机型。第3页,共84页,编辑于2022年,星期二几类算法的经典名言n n动态规划:不做重复的事;动态规划:不做重复的事;动态规划:不做重复的事;动态规划:不做重复的事;n n贪心法:只选最好的;贪心法:只选最好的;n n分支定界法:没戏的就杀掉;分支定界法:没戏的就杀掉;n n回溯法:碰壁就回头。回溯法:碰壁就回头。作人生规划要善于利用动态规划;作人生规划要善于利用动态规划;找女朋友要善于利用好贪心算法;找女朋友要善于利用好贪
5、心算法;人生重大决策要活学活用回溯法;人生重大决策要活学活用回溯法;第4页,共84页,编辑于2022年,星期二算法总体思想n动态规划算法与分治法类似,其基本思想也是将待求解问题分动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题解成若干个子问题nT(n/2)T(n/2)T(n/2)T(n/2)T(n/2)T(n/2)T(n/2)T(n/2)T(n)=第5页,共84页,编辑于2022年,星期二为什么动态规划比递归算法有效?n但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。在用分治法求解
6、时,有些子问题被重复计算了许多次,只有多项式量级。在用分治法求解时,有些子问题被重复计算了许多次,因此利用递归算法得到的算法往往是指数复杂度的算法。因此利用递归算法得到的算法往往是指数复杂度的算法。n如果能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,就可以避免如果能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,就可以避免大量重复计算,从而得到多项式时间算法。大量重复计算,从而得到多项式时间算法。n=n/2T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)n/2n/2T(n/4)T(n/4)T(n/4)T(n/4)n/2T(
7、n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n/4)T(n)第6页,共84页,编辑于2022年,星期二POJ 2753 Fibonacci数列例子:n确定确定Fibonacci sequence fnFibonacci sequence fn项的值项的值:n考虑考虑Fibonacci sequenceFibonacci sequence的递归定义的递归定义:n我们将得到如下的递归算法我们将得到如下的递归算法:在POJ上递交之后,返回的结果是:Time Limited。而不是可爱的ACWhy?第7页,共84页,编辑于2022年,星期
8、二子问题的重叠性 n将上述递归算法展开将上述递归算法展开:n可以看出可以看出 f(n-1)f(n-1)被调用被调用 1 1次次,f(n-2),f(n-2)被调用被调用 2 2次次,等等等等.n这将导致大量的调用这将导致大量的调用 n最终解为:最终解为:第8页,共84页,编辑于2022年,星期二树形递归计算过程中存在冗余计算过程中存在冗余计算,为了除去冗余计算,为了除去冗余计算,可以从已知条计算,可以从已知条件开始计算,并记录件开始计算,并记录计算过程中的中间结计算过程中的中间结果。果。f(5)f(3)f(2)f(1)f(2)f(4)f(0)f(1)f(0)f(3)f(2)f(1)f(1)f(0
9、)f(1)11001010冗余计算冗余计算第9页,共84页,编辑于2022年,星期二动态规划n例:例:POJ 2753 FibonacciPOJ 2753 Fibonacci数列数列int fn+1;int fn+1;f1=f2=1;f1=f2=1;int I;int I;for(i=3;i=n;i+)for(i=3;i=n;i+)fi=fi-1+fi-2;fi=fi-1+fi-2;cout fn endl;cout fn endl;用空间换时间用空间换时间第10页,共84页,编辑于2022年,星期二动态规划算法的基本要素一、最优子结构一、最优子结构一个最优化策略具有这样的性质,不论过去状态和
10、决策如何,对前面的决一个最优化策略具有这样的性质,不论过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其为最优化策略的子策略总是最优的。一个问题满足最优化原理又称其为最优最优子结构性质子结构性质。同一个问题可以有多种方式刻划它的最优子结构,有些表示方法的求解速度更快(空间占用小,问题的维度低)例如:最短路径问题。a b c在分析问题的最优子结构性质时,所用的方法具有普遍性:首先假设在分析问题的最优子结构性质时,所用的方法具有普遍性
11、:首先假设由问题的最优解导出的子问题的解不是最优的,然后再设法说明在这个由问题的最优解导出的子问题的解不是最优的,然后再设法说明在这个假设下可构造出比原问题最优解更好的解,从而导致矛盾。假设下可构造出比原问题最优解更好的解,从而导致矛盾。第11页,共84页,编辑于2022年,星期二动态规划算法的基本要素二、重叠子问题二、重叠子问题递归算法求解问题时,每次产生的子问题并不总是新问题,有些子问递归算法求解问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算多次。这种性质称为题被反复计算多次。这种性质称为子问题的重叠性质子问题的重叠性质。动态规划算法,对每一个子问题只解一次,而后将其解保存在
12、一动态规划算法,对每一个子问题只解一次,而后将其解保存在一个表格中,当再次需要解此子问题时,只是简单地用常数时间查个表格中,当再次需要解此子问题时,只是简单地用常数时间查看一下结果。看一下结果。通常不同的子问题个数随问题的大小呈多项式增长。因此用动态规通常不同的子问题个数随问题的大小呈多项式增长。因此用动态规划算法只需要多项式时间,从而获得较高的解题效率。划算法只需要多项式时间,从而获得较高的解题效率。第12页,共84页,编辑于2022年,星期二一、例子(最短路问题)一、例子(最短路问题)假如上图是一个线路网络,两点之间连线上的数字表示两点间的假如上图是一个线路网络,两点之间连线上的数字表示两
13、点间的距离(或费用),我们的问题是要将货物从距离(或费用),我们的问题是要将货物从A A地运往地运往E E地,中间通地,中间通过过B B、C C、D D三个区域,在区域内有多条路径可走,现求一条由三个区域,在区域内有多条路径可走,现求一条由A A到到E E的线路,使总距离最短(或总费用最小)。的线路,使总距离最短(或总费用最小)。AB1B2B3C1C2C3D1D2E24374632426534633334第13页,共84页,编辑于2022年,星期二将该问题划分为将该问题划分为4 4个阶段的决策问题个阶段的决策问题第一阶段为从第一阶段为从A A到到B Bj j(j=1j=1,2 2,3 3),有
14、三种决策方案可供选择;),有三种决策方案可供选择;第二阶段为从第二阶段为从B Bj j到到C Cj j(j=1,2,3j=1,2,3),也有三种方案可供选择;),也有三种方案可供选择;第第三三阶阶段段为为从从C Cj j到到D Dj j(j=1,2)(j=1,2),有有两两种种方方案案可可供供选选择择;第第四四阶阶段段为为从从D Dj j到到E E,只有一种方案选择。,只有一种方案选择。AB1B2B3C1C2C3D1D2E24374632426534633334第14页,共84页,编辑于2022年,星期二如如果果用用完完全全枚枚举举法法,则则可可供供选选择择的的路路线线有有3321=18332
15、1=18(条条),将其一一比较才可找出最短路线:,将其一一比较才可找出最短路线:ABAB1 1CC2 2DD3 3EE其长度为其长度为1212。AB1B2B3C1C2C3D1D2E24374632426534633334第15页,共84页,编辑于2022年,星期二n显然,这种方法是不经济的,特别是当阶段数很多,各显然,这种方法是不经济的,特别是当阶段数很多,各阶段可供的选择也很多时,这种解法甚至在计算机上完阶段可供的选择也很多时,这种解法甚至在计算机上完成也是不现实的。成也是不现实的。n由于我们考虑的是从全局上解决求由于我们考虑的是从全局上解决求A A到到E E的最短路问题,的最短路问题,而不
16、是就某一阶段解决最短路线,因此可考虑从最后一而不是就某一阶段解决最短路线,因此可考虑从最后一阶段开始计算,由后向前逐步推至阶段开始计算,由后向前逐步推至A A点:点:第16页,共84页,编辑于2022年,星期二第四阶段,由第四阶段,由D D1 1到到E E只有一条路线,其长度只有一条路线,其长度f f4 4(D D1 1)=3=3,同理同理f f4 4(D D2 2)=4=4。第三阶段,由第三阶段,由C Cj j到到D Di i分别均有两种选择,即分别均有两种选择,即,决策点为D1AB1B2B3C1C2C3D1D2E24374632426534633334第17页,共84页,编辑于2022年,
17、星期二,决 策 点 为D1,决策点为D2AB1B2B3C1C2C3D1D2E24374632426534633334第18页,共84页,编辑于2022年,星期二第二阶段,由Bj到Cj分别均有三种选择,即:决策点为C2 AB1B2B3C1C2C3D1D2E24374632426534633334第19页,共84页,编辑于2022年,星期二决策点为C1或C2决策点为C2 AB1B2B3C1C2C3D1D2E24374632426534633334第20页,共84页,编辑于2022年,星期二第一阶段,由A到B,有三种选择,即:决策点为B3f1(A)=15说明从A到E的最短距离为12,最短路线的确定可
18、按计算顺序反推而得。即AB3C2D2E上述最短路线问题的计算过程,也可借助于图形直观的表示出来:AB1B2B3C1C2C3D1D2E24374632426534633334第21页,共84页,编辑于2022年,星期二图图中中各各点点上上方方框框的的数数,表表示示该该点点到到E E的的最最短短距距离离。图图中中红红箭箭线线表表示示从从A A到到E E的最短路线。的最短路线。从引例的求解过程可以得到以下启示:从引例的求解过程可以得到以下启示:对对一一个个问问题题是是否否用用上上述述方方法法求求解解,其其关关键键在在于于能能否否将将问问题题转转化为相互联系的决策过程相同的多个阶段决策问题。化为相互联
19、系的决策过程相同的多个阶段决策问题。AB1B2B3C1C2C3D1D2E2437463242653463333434676991112第22页,共84页,编辑于2022年,星期二所所谓谓多多阶阶段段决决策策问问题题是是:把把一一个个问问题题看看作作是是一一个个前前后后关关联联具具有有链链状状结结构的多阶段过程,也称为序贯决策过程。如下图所示:构的多阶段过程,也称为序贯决策过程。如下图所示:在在处处理理各各阶阶段段决决策策的的选选取取上上,不不仅仅只只依依赖赖于于当当前前面面临临的的状状态态,而而且且还还要要注注意意对对以以后后的的发发展展。即即是是从从全全局局考考虑虑解解决决局局部部(阶阶段段
20、)的的问问题。题。各各阶阶段段选选取取的的决决策策,一一般般与与“时时序序”有有关关,决决策策依依赖赖于于当当前前的的状状态态,又又随随即即引引起起状状态态的的转转移移,整整个个决决策策序序列列就就是是在在变变化化的的状状态态中中产产生生出出来来,故有故有“动态动态”含义。因此,把这种方法称为动态规划方法。含义。因此,把这种方法称为动态规划方法。决策过程是与阶段发展过程逆向而行。决策过程是与阶段发展过程逆向而行。第23页,共84页,编辑于2022年,星期二拦截导弹(poj1887)n某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任
21、意的高度,但是以后每一发炮弹都不能高于前一发的高度。某天,雷达捕捉到敌国的导弹来袭。由于该系统还在试用阶段,所以只有一套系统,因此有可能不能拦截所有的导弹。第24页,共84页,编辑于2022年,星期二n输入输入数据为导弹依次飞来的高度,所有高度值均为不大于30000的正整数。n输出输出只有一行是这套系统最多能拦截的导弹数。第25页,共84页,编辑于2022年,星期二n输入样例389 207 155 300 299 170 158 65n输入样例6第26页,共84页,编辑于2022年,星期二题目分析n因为只有一套导弹拦截系统,并且这套系统除了第一发炮弹能到达任意高度外,以后的每一发炮弹都不能高于
22、前一发炮弹的高度;所以,被拦截的导弹应该按飞来的高度组成一个非递增序列。n题目要求我们计算这套系统最多能拦截的导弹数,并依次输出被拦截导弹的高度,实际上就是要求我们在导弹依次飞来的高度序列中寻找一个最长非递增子序列。第27页,共84页,编辑于2022年,星期二n设X=x1,x2,xn为依次飞来的导弹序列,Y=y1,y2,yk为问题的最优解(即X的最长非递增子序列),s为问题的状态(表示导弹拦截系统当前发送炮弹能够到达的最大高度,初值为s=第一发炮弹能够到达任意的高度)。第28页,共84页,编辑于2022年,星期二n如果y1=x1,即飞来的第一枚导弹被成功拦截。那么,根据题意“每一发炮弹都不能高
23、于前一发的高度”,问题的状态将由s=变成sx1(x1为第一枚导弹的高度);第29页,共84页,编辑于2022年,星期二n在当前状态下,序列Y1=y2,yk也应该是序列X1=x2,xn的最长非递增子序列(大家用反证法很容易证明)。n也就是说,在当前状态sx1下,问题的最优解Y所包含的子问题(序列X1)的解(序列Y1)也是最优的。这就是拦截导弹问题的最优子结构性质。第30页,共84页,编辑于2022年,星期二n设D(i)为第i枚导弹被拦截之后,这套系统最多还能拦截的导弹数(包含被拦截的第i枚)。n我们可以设想,当系统拦截了第k枚导弹xk,而xk又是序列X=x1,x2,xn中的最小值,即第k枚导弹为
24、所有飞来的导弹中高度最低的,则有D(k)=1;当系统拦截了最后一枚导弹xn,那么,系统最多也只能拦截这一枚导弹了,即D(n)=1;其它情况下,也应该有D(i)1。第31页,共84页,编辑于2022年,星期二n根据以上分析,可归纳出问题的动态规划递归方程为:第32页,共84页,编辑于2022年,星期二n假设系统最多能拦截的导弹数为dmax(即问题的最优值),则 ndmax (i为被系统拦截的第一枚导弹的顺序号)第33页,共84页,编辑于2022年,星期二n所以,要计算问题的最优值dmax,需要分别计算出D(1)、D(2)、D(n)的值,然后将它们进行比较,找出其中的最大值。第34页,共84页,编
25、辑于2022年,星期二n根据上面分析出来的递归方程,我们完全可以设计一个递归函数,采用自顶向下的方法计算D(i)的值。然后,对i从1到n分别调用这个递归函数,就可以计算出D(1)、D(2)、D(n)。第35页,共84页,编辑于2022年,星期二n但这样将会有大量的子问题被重复计算。比如在调用递归函数计算D(1)的时候,可能需要先计算D(5)的值;之后在分别调用递归函数计算D(2)、D(3)、D(4)的时候,都有可能需要先计算D(5)的值。如此一来,在整个问题的求解过程中,D(5)可能会被重复计算很多次,从而造成了冗余,降低了程序的效率。第36页,共84页,编辑于2022年,星期二n其实,通过以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二次 动态 规划 PPT 讲稿
限制150内