第12章回溯法精.ppt
第12章回溯法1第1页,本讲稿共31页学习要点学习要点理解回溯法的深度优先搜索策略。理解回溯法的深度优先搜索策略。掌握用回溯法解题的算法框架掌握用回溯法解题的算法框架递归回溯递归回溯迭代回溯迭代回溯子集树算法框架子集树算法框架排列树算法框架排列树算法框架通过应用范例学习回溯法的设计策略。通过应用范例学习回溯法的设计策略。回溯算法回溯算法2第2页,本讲稿共31页n有许多问题,当需要找出它的解集或者要求回答什么解是满足有许多问题,当需要找出它的解集或者要求回答什么解是满足某些约束条件的最佳解时,往往要使用回溯法。某些约束条件的最佳解时,往往要使用回溯法。n回溯法的基本做法是搜索,或是一种组织得井井有条的,能避免不回溯法的基本做法是搜索,或是一种组织得井井有条的,能避免不必要搜索的穷举式搜索法。这种方法适用于解一些组合数相当大的必要搜索的穷举式搜索法。这种方法适用于解一些组合数相当大的问题。问题。n回溯法在问题的解空间树中,按深度优先策略,从根结点出发搜索解空回溯法在问题的解空间树中,按深度优先策略,从根结点出发搜索解空间树。算法搜索至解空间树的任意一点时,先判断该结点是否包含问题间树。算法搜索至解空间树的任意一点时,先判断该结点是否包含问题的解。如果肯定不包含,则跳过对该结点为根的子树的搜索,逐层向其的解。如果肯定不包含,则跳过对该结点为根的子树的搜索,逐层向其祖先结点回溯;否则,进入该子树,继续按深度优先策略搜索。祖先结点回溯;否则,进入该子树,继续按深度优先策略搜索。回溯法回溯法3第3页,本讲稿共31页问题的解空间问题的解空间问题的解向量:回溯法希望一个问题的解能够表示成一个问题的解向量:回溯法希望一个问题的解能够表示成一个n n元式元式(x1,x2,(x1,x2,xn),xn)的形式。的形式。显约束:对分量显约束:对分量xixi的取值限定。的取值限定。隐约束:为满足问题的解而对不同分量之间施加的约束。隐约束:为满足问题的解而对不同分量之间施加的约束。解空间:对于问题的一个实例,解向量满足显式约束条件的所有多元组,构成了该实解空间:对于问题的一个实例,解向量满足显式约束条件的所有多元组,构成了该实例的一个解空间。例的一个解空间。注意:同一个问题可以有多种表示,有些表示方法更简单,所需表示的状态注意:同一个问题可以有多种表示,有些表示方法更简单,所需表示的状态空间更小(存储量少,搜索方法简单)。空间更小(存储量少,搜索方法简单)。n=3n=3时的时的0-10-1背包问题用完全二叉树表示的解空间背包问题用完全二叉树表示的解空间4第4页,本讲稿共31页生成问题状态的基本方法生成问题状态的基本方法n扩展结点扩展结点:一个正在产生儿子的结点称为扩展结点一个正在产生儿子的结点称为扩展结点n活结点活结点:一个自身已生成但其儿子还没有全部生成的节点称做活结点一个自身已生成但其儿子还没有全部生成的节点称做活结点n死结点死结点:一个所有儿子已经产生的结点称做死结点一个所有儿子已经产生的结点称做死结点n深度优先的问题状态生成法:如果对一个扩展结点深度优先的问题状态生成法:如果对一个扩展结点R R,一旦产生了它的一个儿子,一旦产生了它的一个儿子C C,就把,就把C C当做新的扩展结点。在完成对子树当做新的扩展结点。在完成对子树C C(以(以C C为根的子树)的穷尽搜索之后,将为根的子树)的穷尽搜索之后,将R R重新变成重新变成扩展结点,继续生成扩展结点,继续生成R R的下一个儿子(如果存在)的下一个儿子(如果存在)n宽度优先的问题状态生成法:在一个扩展结点变成死结点之前,它一直是扩展结点宽度优先的问题状态生成法:在一个扩展结点变成死结点之前,它一直是扩展结点n回溯法:为了避免生成那些不可能产生最佳解的问题状态,要不断地利用限界回溯法:为了避免生成那些不可能产生最佳解的问题状态,要不断地利用限界函数函数(bounding function)(bounding function)来处死那些实际上不可能产生所需解的活结点,以减来处死那些实际上不可能产生所需解的活结点,以减少问题的计算量。少问题的计算量。具有限界函数的深度优先生成法称为回溯法具有限界函数的深度优先生成法称为回溯法5第5页,本讲稿共31页回溯法的基本思想回溯法的基本思想(1)(1)针对所给问题,定义问题的解空间;针对所给问题,定义问题的解空间;(2)(2)确定易于搜索的解空间结构;确定易于搜索的解空间结构;(3)(3)以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索。无效搜索。常用剪枝函数:常用剪枝函数:用约束函数在扩展结点处剪去不满足约束的子树;用约束函数在扩展结点处剪去不满足约束的子树;用限界函数剪去得不到最优解的子树。用限界函数剪去得不到最优解的子树。用回溯法解题的一个显著特征是在搜索过程中动态产生问题的解空间。在任何时刻,算法只用回溯法解题的一个显著特征是在搜索过程中动态产生问题的解空间。在任何时刻,算法只保存从根结点到当前扩展结点的路径。如果解空间树中从根结点到叶结点的最长路径的长度为保存从根结点到当前扩展结点的路径。如果解空间树中从根结点到叶结点的最长路径的长度为h(n)h(n),则回溯法所需的计算空间通常为,则回溯法所需的计算空间通常为O(h(n)O(h(n)。而显式地存储整个解空间则需要。而显式地存储整个解空间则需要O(2O(2h(n)h(n)或或O(h(n)!)O(h(n)!)内存空间。内存空间。6第6页,本讲稿共31页递归回溯递归回溯 回溯法对解空间作深度优先搜索,因此,在一般情况下用递归方回溯法对解空间作深度优先搜索,因此,在一般情况下用递归方法实现回溯法。法实现回溯法。void backtrack(int t)if(tn)output(x);else for(int i=f(n,t);i0)if(f(n,t)=g(n,t)for(int i=f(n,t);in)output(x);else for(int i=0;in)output(x);else for(int i=t;i n)/到达叶结点到达叶结点 更新最优解更新最优解bestx,bestw;return;r-=wi;if(cw+wi bestw)xi=0;/搜索右子树搜索右子树 backtrack(i+1);r+=wi;11第11页,本讲稿共31页批处理作业调度批处理作业调度 给定给定n n个作业的集合个作业的集合JJ1 1,J,J2 2,J,Jn n。每个作业必须先由机器。每个作业必须先由机器1 1处理,然后由机器处理,然后由机器2 2处理。作业处理。作业J Ji i需要机器需要机器j j的处理时间为的处理时间为t tjiji。对于一个确定的作业调度,设。对于一个确定的作业调度,设F Fjiji是作是作业业i i在机器在机器j j上完成处理的时间。所有作业在机器上完成处理的时间。所有作业在机器2 2上完成处理的时间和称为该作上完成处理的时间和称为该作业调度的完成时间和。业调度的完成时间和。批处理作业调度问题要求对于给定的批处理作业调度问题要求对于给定的n n个作业,制定最佳作业调度方案,使其完成个作业,制定最佳作业调度方案,使其完成时间和达到最小。时间和达到最小。tji机器机器1 1机器机器2 2作业作业1 12 21 1作业作业2 23 31 1作业作业3 32 23 3这这3 3个作业的个作业的6 6种可能的调度方案是种可能的调度方案是1,2,31,2,3;1,3,21,3,2;2,1,32,1,3;2,3,12,3,1;3,1,23,1,2;3,2,13,2,1;它们;它们所相应的完成时间和分别是所相应的完成时间和分别是1919,1818,2020,2121,1919,1919。易见,最佳调度方案是。易见,最佳调度方案是1,3,21,3,2,其完成时间和为其完成时间和为1818。12第12页,本讲稿共31页批处理作业调度批处理作业调度解空间:排列树解空间:排列树void Flowshop:Backtrack(int i)if(i n)for(int j=1;j=n;j+)bestxj=xj;bestf=f;else for(int j=i;j f1)?f2i-1:f1)+Mxj2;f+=f2i;if(f half)|(t*(t-1)/2-counthalf)return;if(tn)sum+;else for(int i=0;i2;i+)p1t=i;count+=i;for(int j=2;j=t;j+)pjt-j+1=pj-1t-j+1pj-1t-j+2;count+=pjt-j+1;Backtrack(t+1);for(int j=2;j=t;j+)count-=pjt-j+1;count-=i;+-+-+-+-+-+-+-+复杂度分析复杂度分析 计算可行性约束需要计算可行性约束需要O(n)O(n)时间,在最坏情况时间,在最坏情况下有下有 O(2O(2n n)个结点需要个结点需要计算可行性约束,故解计算可行性约束,故解符号三角形问题的回溯符号三角形问题的回溯算法所需的计算时间为算法所需的计算时间为O(n2O(n2n n)。15第15页,本讲稿共31页n n后问题后问题 在在nnnn格的棋盘上放置彼此不受攻击的格的棋盘上放置彼此不受攻击的n n个皇后。按照国际象棋个皇后。按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。n n后问题等价于在后问题等价于在nnnn格的棋盘上放置格的棋盘上放置n n个皇后,任何个皇后,任何2 2个皇后不放在个皇后不放在同一行或同一列或同一斜线上。同一行或同一列或同一斜线上。1 2 3 4 5 6 7 812345678QQQQQQQQ16第16页,本讲稿共31页解向量:解向量:(x(x1 1,x,x2 2,x,xn n)显约束:显约束:x xi i=1,2,=1,2,n,n隐约束:隐约束:1)1)不同列:不同列:x xi i x xj j 2)2)不处于同一正、反不处于同一正、反对角线:对角线:|i-j|i-j|x|xi i-x-xj j|n n后问题后问题bool Queen:Place(int k)for(int j=1;jn)sum+;else for(int i=1;i=n;i+)xt=i;if(Place(t)Backtrack(t+1);17第17页,本讲稿共31页0-10-1背包问题背包问题解空间:子集树解空间:子集树可行性约束函数:可行性约束函数:上界函数:上界函数:templateTypep Knap:Bound(int i)/计算上界计算上界 Typew cleft=c-cw;/剩余容量剩余容量 Typep b=cp;/以物品单位重量价值递减序装入物品以物品单位重量价值递减序装入物品 while(i=n&wi=cleft)cleft-=wi;b+=pi;i+;/装满背包装满背包 if(i n)/到达叶结点到达叶结点 for(int j=1;j=n;j+)bestxj=xj;bestn=cn;return;/检查顶点检查顶点 i 与当前团的连接与当前团的连接 int OK=1;for(int j=1;j bestn)/进入右子树进入右子树 xi=0;Backtrack(i+1);复杂度分析复杂度分析最大团问题的回溯算法最大团问题的回溯算法backtrackbacktrack所需的计算时间显然所需的计算时间显然为为O(n2O(n2n n)。1245320第20页,本讲稿共31页进一步改进进一步改进 选择合适的搜索顺序,可以使得上界函数更有效的发挥作用。例选择合适的搜索顺序,可以使得上界函数更有效的发挥作用。例如在搜索之前可以将顶点按度从小到大排序。这在某种意义上相如在搜索之前可以将顶点按度从小到大排序。这在某种意义上相当于给回溯法加入了启发性。当于给回溯法加入了启发性。定义定义Si=vSi=vi i,v,vi+1i+1,.,v,.,vn n,依次求出,依次求出S Sn n,S,Sn-1n-1,.,S,.,S1 1的解。从而得的解。从而得到一个更精确的上界函数,若到一个更精确的上界函数,若cn+Scn+Si i=maxn)sum+;for(int i=1;i=n;i+)cout xi ;cout endl;else for(int i=1;i=m;i+)xt=i;if(Ok(t)Backtrack(t+1);bool Color:Ok(int k)/检查颜色可用性检查颜色可用性 for(int j=1;j=n;j+)if(akj=1)&(xj=xk)return false;return true;复杂度分析复杂度分析图图m m可着色问题的解空间树中内结点个数是可着色问题的解空间树中内结点个数是对于每一个内结点,在最坏情况下,用对于每一个内结点,在最坏情况下,用okok检查当前扩检查当前扩展结点的每一个儿子所相应的颜色可用性需耗时展结点的每一个儿子所相应的颜色可用性需耗时O(mn)O(mn)。因此,回溯法总的时间耗费是。因此,回溯法总的时间耗费是23第23页,本讲稿共31页旅行售货员问题旅行售货员问题问题描述问题描述 某售货员要到若干城市去推销商品,已知各城市之间的路程某售货员要到若干城市去推销商品,已知各城市之间的路程(或旅费或旅费)。他要选定一条从驻地出发,经过每个城市一次,最后回到驻地的路线,。他要选定一条从驻地出发,经过每个城市一次,最后回到驻地的路线,使总的路程使总的路程(或总旅费或总旅费)最小。最小。路线是一个带权图。图中各边的费用(权)为正数。图的一条周游路线是一个带权图。图中各边的费用(权)为正数。图的一条周游路线是包括路线是包括V V中的每个顶点在内的一条回路。周游路线的费用是这条中的每个顶点在内的一条回路。周游路线的费用是这条路线上所有边的费用之和。路线上所有边的费用之和。旅行售货员问题的解空间可以组织成一棵树,从树的根结点到任一旅行售货员问题的解空间可以组织成一棵树,从树的根结点到任一叶结点的路径定义了图的一条周游路线。旅行售货员问题要在图叶结点的路径定义了图的一条周游路线。旅行售货员问题要在图G G中找出中找出费用最小的周游路线。费用最小的周游路线。24第24页,本讲稿共31页旅行售货员问题旅行售货员问题解空间:排列树解空间:排列树templatevoid Traveling:Backtrack(int i)if(i=n)if(axn-1xn!=NoEdge&axn1!=NoEdge&(cc+axn-1xn+axn1 bestc|bestc=NoEdge)for(int j=1;j=n;j+)bestxj=xj;bestc=cc+axn-1xn+axn1;else for(int j=i;j=n;j+)/是否可进入是否可进入xj子树子树?if(axi-1xj!=NoEdge&(cc+axi-1xi bestc|bestc=NoEdge)/搜索子树搜索子树 Swap(xi,xj);cc+=axi-1xi;Backtrack(i+1);cc-=axi-1xi;Swap(xi,xj);复杂度分析复杂度分析算法算法backtrackbacktrack在最坏情况下可能需要更新当前最优解在最坏情况下可能需要更新当前最优解O(n-1)!)O(n-1)!)次,每次更新次,每次更新bestxbestx需计算时间需计算时间O(n)O(n),从而整,从而整个算法的计算时间复杂性为个算法的计算时间复杂性为O(n!)O(n!)。25第25页,本讲稿共31页圆排列问题圆排列问题 给定给定n n个大小不等的圆个大小不等的圆c1,c2,c1,c2,cn,cn,现要将这,现要将这n n个圆排进一个矩形个圆排进一个矩形框中,且要求各圆与矩形框的底边相切。圆排列问题要求从框中,且要求各圆与矩形框的底边相切。圆排列问题要求从n n个圆的所有个圆的所有排列中找出有最小长度的圆排列。例如,当排列中找出有最小长度的圆排列。例如,当n=3n=3,且所给的,且所给的3 3个圆的半径分个圆的半径分别为别为1 1,1 1,2 2时,这时,这3 3个圆的最小长度的圆排列如图所示。其最小长个圆的最小长度的圆排列如图所示。其最小长度为度为26第26页,本讲稿共31页圆排列问题圆排列问题float Circle:Center(int t)/计算当前所选择圆的圆心横坐标 float temp=0;for(int j=1;jtemp)temp=valuex;return temp;void Circle:Compute(void)/计算当前圆排列的长度 float low=0,high=0;for(int i=1;i=n;i+)if(xi-rihigh)high=xi+ri;if(high-lown)Compute();else for(int j=t;j=n;j+)Swap(rt,rj);float centerx=Center(t);if(centerx+rt+r1min)/下界约束下界约束 xt=centerx;Backtrack(t+1);Swap(rt,rj);复杂度分析复杂度分析由于算法backtrack在最坏情况下可能需要计算O(n!)次当前圆排列长度,每次计算需O(n)计算时间,从而整个算法的计算时间复杂性为O(n+1)!)上述算法尚有许多改进的余地。例如,象上述算法尚有许多改进的余地。例如,象1,2,1,2,n-1,n,n-1,n和和n,n-1,n,n-1,2,1,2,1这种互为镜像的排列具有相同的圆排列长度,只计算一个这种互为镜像的排列具有相同的圆排列长度,只计算一个就够了,可减少约一半的计算量。另一方面,如果所给的就够了,可减少约一半的计算量。另一方面,如果所给的n n个圆个圆中有中有k k个圆有相同的半径,则这个圆有相同的半径,则这k k个圆产生的个圆产生的k!k!个完全相同的圆排列,个完全相同的圆排列,只计算一个就够了。只计算一个就够了。27第27页,本讲稿共31页连续邮资问题连续邮资问题 假设国家发行了假设国家发行了n n种不同面值的邮票,并且规定种不同面值的邮票,并且规定每张信封上最多只允许贴每张信封上最多只允许贴m m张邮票。连续邮资问题要张邮票。连续邮资问题要求对于给定的求对于给定的n n和和m m的值,给出邮票面值的最佳设计,的值,给出邮票面值的最佳设计,在在1 1张信封上可贴出从邮资张信封上可贴出从邮资1 1开始,增量为开始,增量为1 1的最大连的最大连续邮资区间。续邮资区间。例如,当例如,当n=5n=5和和m=4m=4时,面值为时,面值为(1,3,11,15,32)(1,3,11,15,32)的的5 5种种邮票可以贴出邮资的最大连续邮资区间是邮票可以贴出邮资的最大连续邮资区间是1 1到到7070。28第28页,本讲稿共31页连续邮资问题连续邮资问题解向量:用解向量:用n n元组元组x1:nx1:n表示表示n n种不同的邮票面值,并约定它们从小种不同的邮票面值,并约定它们从小到大排列。到大排列。x1=1x1=1是唯一的选择。是唯一的选择。可行性约束函数:已选定可行性约束函数:已选定x1:i-1x1:i-1,最大连续邮资区间是,最大连续邮资区间是1:r1:r,接下,接下来来xixi的可取值范围是的可取值范围是xi-1+1:r+1xi-1+1:r+1。如何确定如何确定r r的值?的值?计算计算X1:iX1:i的最大连续邮资区间在本算法中被频繁使用到,因此势必要找到一个高的最大连续邮资区间在本算法中被频繁使用到,因此势必要找到一个高效的方法。考虑到直接递归的求解复杂度太高,我们不妨尝试计算用不超过效的方法。考虑到直接递归的求解复杂度太高,我们不妨尝试计算用不超过m m张面值张面值为为x1:ix1:i的邮票贴出邮资的邮票贴出邮资k k所需的最少邮票数所需的最少邮票数ykyk。通过。通过ykyk可以很快推出可以很快推出r r的值。事实的值。事实上,上,ykyk可以通过递推在可以通过递推在O(n)O(n)时间内解决:时间内解决:for(int j=0;j=xi-2*(m-1);j+)if(yjm)for(int k=1;k=m-yj;k+)if(yj+kyj+xi-1*k)yj+xi-1*k=yj+k;while(yrmaxint)r+;29第29页,本讲稿共31页回溯法效率分析回溯法效率分析 通过前面具体实例的讨论容易看出,回溯算法的效通过前面具体实例的讨论容易看出,回溯算法的效率在很大程度上依赖于以下因素:率在很大程度上依赖于以下因素:(1)(1)产生产生xkxk的时间;的时间;(2)(2)满足显约束的满足显约束的xkxk值的个数;值的个数;(3)(3)计算约束函数计算约束函数constraintconstraint的时间;的时间;(4)(4)计算上界函数计算上界函数boundbound的时间;的时间;(5)(5)满足约束函数和上界函数约束的所有满足约束函数和上界函数约束的所有xkxk的个数。的个数。好的约束函数能显著地减少所生成的结点数。但这好的约束函数能显著地减少所生成的结点数。但这样的约束函数往往计算量较大。因此,在选择约束函样的约束函数往往计算量较大。因此,在选择约束函数时通常存在生成结点数与约束函数计算量之间的折数时通常存在生成结点数与约束函数计算量之间的折衷。衷。30第30页,本讲稿共31页重排原理重排原理 对于许多问题而言,在搜索试探时选取对于许多问题而言,在搜索试探时选取xixi的值顺序是任意的。的值顺序是任意的。在其在其它条件相当的前提下,让可取值最少的它条件相当的前提下,让可取值最少的xixi优先优先。从图中关于同一问。从图中关于同一问题的题的2 2棵不同解空间树,可以体会到这种策略的潜力。棵不同解空间树,可以体会到这种策略的潜力。图图(a)(a)中,从第中,从第1 1层剪去层剪去1 1棵子树,则从所有应当考虑的棵子树,则从所有应当考虑的3 3元组中一次元组中一次消去消去1212个个3 3元组。对于图元组。对于图(b)(b),虽然同样从第,虽然同样从第1 1层剪去层剪去1 1棵子树,却只从棵子树,却只从应当考虑的应当考虑的3 3元组中消去元组中消去8 8个个3 3元组。前者的效果明显比后者好。元组。前者的效果明显比后者好。(a)(b)31第31页,本讲稿共31页