第9章第1-2节动态规划基础(C++版).ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第9章第1-2节动态规划基础(C++版).ppt》由会员分享,可在线阅读,更多相关《第9章第1-2节动态规划基础(C++版).ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 动态规划动态规划第一节第一节 动态规划的基本模型动态规划的基本模型第二节第二节 动态规划与递推动态规划与递推第三节第三节 背包问题背包问题第四节第四节 动态题动态题 动态规划程序设计是对解最优化问题的一种途径、一种方法,而不是一种特殊算法。不象前面所述的那些搜索或数值计算那样,具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划算法,可以解决各类最优化问题。因此读者在学习时,除了要对基本概念和方法正确理解外,必
2、须具体问题具体分析处理,以丰富的想象力去建立模型,用创造性的技巧去求解。我们也可以通过对若干有代表性的问题的动态规划算法进行分析、讨论,逐渐学会并掌握这一设计方法。第一节第一节 动态规划的基本模型动态规划的基本模型w多阶段决策过程的最优化问题多阶段决策过程的最优化问题 在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。当然,各个阶段决策的选取不是任意确定的,它依赖于当前面临的状态,又影响以后的发展,当各个阶段决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条活动路线,这种把一个问题看作是一
3、个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题就称为多阶段决策问题。如下图所示: 多阶段决策过程,是指这样的一类特殊的活动过程,问题可以按时间顺序分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列。【例【例1】最短路径问题。最短路径问题。下图给出了一个地图,地图中的每个顶点代表一个城市,两个城市间的一条连线代表道路,连线上的数值代表道路的长度。现在想从城市A到达城市E,怎样走路程最短?最短路程的长度是多少?【算法分析】【算法分析】 把A到E的全过程分成四个阶段,用K表示阶段变量,第1阶段有一个初始状态A,有两条可供选择的支路A-B1、A-B2;第
4、2阶段有两个初始状态B1、B2,B1有三条可供选择的支路,B2有两条可供选择的支路。用DK(XI,X+1J)表示在第K阶段由初始状态XI到下阶段的初始状态X+1J的路径距离,FK(XI)表示从第K阶段的XI到终点E的最短距离,利用倒推的方法,求解A到E的最短距离。 具体计算过程如下:S1: K = 4 有 F4(D1)= 3, F4(D2)= 4, F4(D3)= 3;S2: K = 3 有 F3(C1)= MIN D3(C1,D1)+ F4(D1),D3(C1,D2)+ F4(D2) = MIN 5+3,6+4 = 8 F3(C2)= D3(C2,D1)+ F4(D1)= 5+3 = 8 F
5、3(C3)= D3(C3,D3)+ F4(D3)= 8+3 = 11 F3(C4)= D3(C4,D3)+ F4(D3)= 3+3 = 6S3: K = 2 有 F2(B1)= MIN D2(B1,C1)+ F3(C1),D2(B1,C2)+ F3(C2), D2(B1,C3)+ F3(C3) = MIN 1+8,6+8,3+11 = 9 F2(B2)= MIN D2(B2,C2)+ F3(C2),D2(B2,C4)+ F3(C4) = MIN 8+8,4+6 = 10S4: K = 1 有 F1(A)= MIN D1(A,B1)+ F2(B1),D1(A,B2)+ F2(B2) = MIN
6、5+9,3+10 = 13 因此由A点到E点的全过程最短路径为AB2C4D3E;最短路程长度为13。 从以上过程可以看出,每个阶段中,都求出本阶段的各个初始状态到终点E的最短距离,当逆序倒推到过程起点A时,便得到了全过程的最短路径和最短距离。 在上例的多阶段决策问题中,各个阶段采取的决策,一般来说是与阶段有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有“动态”的含义,我们称这种解决多阶段决策最优化的过程为动态规划程序设计方法。w动态规划的基本概念和基本模型构成动态规划的基本概念和基本模型构成 现在我们来介绍动态规划的基本概念。1. 阶段和阶段变量
7、: 用动态规划求解一个问题时,需要将问题的全过程恰当地分成若干个相互联系的阶段,以便按一定的次序去求解。描述阶段的变量称为阶段变量,通常用K表示,阶段的划分一般是根据时间和空间的自然特征来划分,同时阶段的划分要便于把问题转化成多阶段决策过程,如例题1中,可将其划分成4个阶段,即K = 1,2,3,4。2. 状态和状态变量: 某一阶段的出发位置称为状态,通常一个阶段包含若干状态。一般地,状态可由变量来描述,用来描述状态的变量称为状态变量。如例题1中,C3是一个状态变量。3. 决策、决策变量和决策允许集合: 在对问题的处理中作出的每种选择性的行动就是决策。即从该阶段的每一个状态出发,通过一次选择性
8、的行动转移至下一阶段的相应状态。一个实际问题可能要有多次决策和多个决策点,在每一个阶段的每一个状态中都需要有一次决策,决策也可以用变量来描述,称这种变量为决策变量。在实际问题中,决策变量的取值往往限制在某一个范围之内,此范围称为允许决策集合。如例题1中,F3(C3)就是一个决策变量。4策略和最优策略: 所有阶段依次排列构成问题的全过程。全过程中各阶段决策变量所组成的有序总体称为策略。在实际问题中,从决策允许集合中找出最优效果的策略成为最优策略。5. 状态转移方程 前一阶段的终点就是后一阶段的起点,对前一阶段的状态作出某种决策,产生后一阶段的状态,这种关系描述了由k阶段到k+1阶段状态的演变规律
9、,称为状态转移方程。w最优化原理与无后效性最优化原理与无后效性 上面已经介绍了动态规划模型的基本组成,现在需要解决的问题是:什么样的“多阶段决策问题”才可以采用动态规划的方法求解。 一般来说,能够采用动态规划方法求解的问题,必须满足最优化原理和无后效性原则: 1、动态规划的最优化原理。作为整个过程的最优策略具有:无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略的性质。也可以通俗地理解为子问题的局部最优将导致整个问题的全局最优,即问题具有最优子结构的性质,也就是说一个问题的最优解只取决于其子问题的最优解,而非最优解对问题的求解没有影响。在例题1最短路径问题中,
10、A到E的最优路径上的任一点到终点E的路径,也必然是该点到终点E的一条最优路径,即整体优化可以分解为若干个局部优化。 2、动态规划的无后效性原则。所谓无后效性原则,指的是这样一种性质:某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整的总结,此前的历史只能通过当前的状态去影响过程未来的演变。在例题1最短路径问题中,问题被划分成各个阶段之后,阶段K中的状态只能由阶段K+1中的状态通过状态转移方程得来,与其它状态没有关系,特别与未发生的状态没有关系,例如从Ci到E的最短路径,只与Ci的位置有关,它是由Di中的状态通过状态转
11、移方程得来,与E状态,特别是A到Ci的路径选择无关,这就是无后效性。 由此可见,对于不能划分阶段的问题,不能运用动态规划来解;对于能划分阶段,但不符合最优化原理的,也不能用动态规划来解;既能划分阶段,又符合最优化原理的,但不具备无后效性原则,还是不能用动态规划来解;误用动态规划程序设计方法求解会导致错误的结果。w动态规划设计方法的一般模式动态规划设计方法的一般模式 动态规划所处理的问题是一个多阶段决策问题,一般由初始状态开始,通过对中间阶段决策的选择,达到结束状态;或倒过来,从结束状态开始,通过对中间阶段决策的选择,达到初始状态。这些决策形成一个决策序列,同时确定了完成整个过程的一条活动路线,
12、通常是求最优活动路线。动态规划的设计都有着一定的模式,一般要经历以下几个步骤:1、划分阶段 按照问题的时间或空间特征,把问题划分为若干个阶段。在划分阶段时,注意划分后的阶段一定是有序的或者是可排序的,否则问题就无法求解。2、确定状态和状态变量 将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。3、确定决策并写出状态转移方程 因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策,状态转移方程也就可以写出。但事实上常常是反过来做,根据相邻两段的各个状态之间的关系来确定决策。4、寻找边界条件 给出的
13、状态转移方程是一个递推式,需要一个递推的终止条件或边界条件。【例1】对应的C+程序如下:#include#includeusing namespace std;int main() long d555,f1010; memset(d,42,sizeof(d); /有些路径是不通的,赋值为较大值,用于判断 d111=5;d112=3;d211=1; /以下给可通路径赋正常值 d212=6;d213=3;d222=8 d224=4;d311=5;d312=6; d321=5;d333=8;d343=3; d411=3;d421=4;d431=3; for (int i=0;i=9;+i) for
14、(int j=0;j=1;-i) for (int j=1;j=4;+j) for (int k=1;kdijk+fi+1k) /即使走非法路径,也不影响答案 fij=dijk+fi+1k; coutf11endl;第二节第二节 动态规划与递推动态规划与递推 动态规划是最优化算法动态规划是最优化算法 由于动态规划的“名气”如此之大,以至于很多人甚至一些资料书上都往往把一种与动态规划十分相似的算法,当作是动态规划。这种算法就是递推。实际上,这两种算法还是很容易区分的。 按解题的目标来分,信息学试题主要分四类:判定性问题、构造性问题、计数问题和最优化问题。我们在竞赛中碰到的大多是最优化问题,而动态
15、规划正是解决最优化问题的有力武器,因此动态规划在竞赛中的地位日益提高。而递推法在处理判定性问题和计数问题方面也是一把利器。下面分别就两个例子,谈一下递推法和动态规划在这两个方面的联系。【例例2】数塔问题(数塔问题(IOI94)有形如图所示的数塔,从顶部出发,在每一结点可以选择向左走或是向右走,一起走到底层,要求找出一条路径,使路径上的值最大。 这道题如果用枚举法,在数塔层数稍大的情况下(如40),则需要列举出的路径条数将是一个非常庞大的数目。如果用贪心法又往往得不到最优解。在用动态规划考虑数塔问题时可以自顶向下的分析,自底向上的计算。从顶点出发时到底向左走还是向右走应取决于是从左走能取到最大值
16、还是从右走能取到最大值,只要左右两道路径上的最大值求出来了才能作出决策。同样的道理下一层的走向又要取决于再下一层上的最大值是否已经求出才能决策。这样一层一层推下去,直到倒数第二层时就非常明了。所以实际求解时,可从底层开始,层层递进,最后得到最大值。 一般说来,很多最优化问题都有着对应的计数问题;反过来,很多计数问题也有着对应的最优化问题。因此,我们在遇到这两类问题时,不妨多联系、多发展,举一反三,从比较中更深入地理解动态规划的思想。 其实递推和动态规划这两种方法的思想本来就很相似,也不必说是谁借用了谁的思想。关键在于我们要掌握这种思想,这样我们无论在用动态规划法解最优化问题,或是在用递推法解判
17、定型、计数问题时,都能得心应手、游刃有余了。【解法一】(逆推法)【解法一】(逆推法)【算法分析】【算法分析】 贪心法往往得不到最优解:本题若采用贪心法则:13-11-12-14-13,其和为63,但存在另一条路:13-8-26-15-24,其和为86。 贪心法问题所在:眼光短浅。 动态规划求解:动态规划求解问题的过程归纳为:自顶向下的分析,自底向上计算。 其基本方法是: 划分阶段:按三角形的行,划分阶段,若有n行,则有n-1个阶段。 A从根结点13出发,选取它的两个方向中的一条支路,当到倒数第二层时,每个结点其后继仅有两个结点,可以直接比较,选择最大值为前进方向,从而求得从根结点开始到底端的最
18、大路径。 B自底向上计算:(给出递推式和终止条件) 从底层开始,本身数即为最大数; 倒数第二层的计算,取决于底层的数据:12+6=18,13+14=27,24+15=39,24+8=32; 倒数第三层的计算,取决于底二层计算的数据:27+12=39,39+7=46,39+26=65 倒数第四层的计算,取决于底三层计算的数据:46+11=57,65+8=73 最后的路径:138261524 C数据结构及算法设计 图形转化:直角三角形,便于搜索:向下、向右 用三维数组表示数塔:ax,y,1表示行、列及结点本身数据,ax,y,2能够取得最大值,ax,y,3表示前进的方向0向下,1向右; 算法: 数组
19、初始化,输入每个结点值及初始的最大路径、前进方向为0; 从倒数第二层开始向上一层求最大路径,共循环N-1次; 从顶向下,输出路径:究竟向下还是向右取决于列的值,若列的值比原先多1则向右,否则向下。 参考程序参考程序#include#includeusing namespace std;int main()int n,x,y;int a51513;coutn;memset(a,0,sizeof(0);for (x=1;x=n;x+) /输入数塔的初始值输入数塔的初始值 for (y=1;yaxy1;axy2=axy1;axy3=0; /路径走向,默认向下路径走向,默认向下 for (x=n-1;
20、x=1;x-) for (y=1;yax+1y+12) /选择路径,保留最大路径值选择路径,保留最大路径值 axy2=axy2+ax+1y2; axy3=0; else axy2=axy2+ax+1y+12; axy3=1; coutmax=a112endl; /输出数塔最大值输出数塔最大值 y=1; for (x=1;x=n-1;x+) /输出数塔最大值的路径输出数塔最大值的路径 coutaxy1; y=y+axy3; /下一行的列数下一行的列数 coutany18-26-15-24【解法二】(顺推法)【解法二】(顺推法)【算法分析】【算法分析】 此题贪心法往往得不到最优解,例如13-11-
21、12-14-13其路径的值为63,但这不是最优解。 穷举搜索往往是不可能的,当层数N = 100时,路径条数P = 299这是一个非常大的数,即使用世界上最快的电子计算机,也不能在规定时间内计算出来。 对这道题唯一正确的方法是动态规划。如果得到一条由顶到底的某处的一条最佳路径,那么对于该路径上的每一个中间点来说,由顶点至该中间点的路径所经过的数字和也为最大。因此本题是一个典型的多阶段决策最优化问题。在本题中仅要求输出最优解,为此我们设置了数组Ai,j保存三角形数塔,Bi,j保存状态值,按从上往下方式进行求解。 阶段i:以层数来划分阶段,由从上往下方式计算;因此可通过第一重循环: for (in
22、t i=1;i=n;i+) 枚举每一阶段; 状态Bij:由于每个阶段中有多个状态,因此可通过第二重循环: for (int j=1;j=i;j+)求出每个阶段的每个状态的最优解Bij; 决 策:每个状态最多由上一层的两个结点连接过来,因此不需要做循环。 【参考程序】【参考程序】#include#includeusing namespace std;int main()int n,i,j,a200200,b200200,maxx; cinn; memset(a,0,sizeof(a); memset(b,0,sizeof(b); for (i=1;i=n;+i)for (j=1;jaij; bi
23、j=aij; for (i=2;i=n;+i) /选择路径,保留最大路径值 for (j=1;jbi-1j) bij=bij+bi-1j-1; else bij=bij+bi-1j; maxx=0; for (j=1;jmaxx) /在第n行中找出数塔最大值 maxx=bnj; coutMax=maxxendl; /输出数塔最大值 【例【例3】求最长不下降序列】求最长不下降序列问题描述: 设有由n个不相同的整数组成的数列,记为:b(1)、b(2)、b(n)且b(i)b(j) (ij),若存在i1i2i3 ie 且有b(i1)b(i2) b(ie)则称为长度为e的不下降序列。程序要求,当原数列出
24、之后,求出最长的不下降序列。 例如13,7,9,16,38,24,37,18,44,19,21,22,63,15。例中13,16,18,19,21,22,63就是一个长度为7的不下降序列,同时也有7 ,9,16,18,19,21,22,63长度为8的不下降序列。算法分析: 根据动态规划的原理,由后往前进行搜索(当然从前往后也一样)。 1对b(n)来说,由于它是最后一个数,所以当从b(n)开始查找时,只存在长度为1的不下降序列; 2若从b(n-1)开始查找,则存在下面的两种可能性: 若b(n-1)b(n)则存在长度为1的不下降序列b(n-1)或b(n)。 3一般若从b(i)开始,此时最长不下降序
25、列应该按下列方法求出:在b(i+1),b(i+2),b(n)中,找出一个比b(i)大的且最长的不下降序列,作为它的后继。数据结构: 为算法上的需要,定义一个整数类型二维数组b(N,3) 1b(I,1)表示第I个数的数值本身; 2b(I,2)表示从I位置到达N的最长不下降序列长度 3b(I,3)表示从I位置开始最长不下降序列的下一个位置,若bI,3=0则表示后面没有连接项。 求解过程: 从倒数第二项开始计算,后面仅有1项,比较一次,因6315,不符合要求,长度仍为1。 从倒数第三项开始其后有2项,需做两次比较,得到目前最长的不下降序列为2,如下表:111213141112131422631521
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 基础 C+
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内