计算机算法分析与设计 第4章.ppt
《计算机算法分析与设计 第4章.ppt》由会员分享,可在线阅读,更多相关《计算机算法分析与设计 第4章.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 贪心算法1学习要点学习要点理解贪心算法的概念。掌握贪心算法的基本要素(1)最优子结构性质(2)贪心选择性质理解贪心算法与动态规划算法的差异理解贪心算法的一般理论通过应用范例学习贪心设计策略。(1)活动安排问题;(2)最优装载问题;(3)哈夫曼编码;(4)单源最短路径;(5)最小生成树;(6)多机调度问题。2一个找硬币的例子假设有四种硬币:二角五分、一角、五分和一分。现要找给顾客六角三分。显然,会拿出2个二角五分、1个一角和3个一分的硬币交给顾客。贪心方法思路:首先选出一个面值不超过六角三分的最大硬币,即二角五分,然后在剩余数中再选最大面值的硬币,依此类推,得到其解。3 若硬币面值改为:
2、一角一分、五分和一分,而要找给顾客一角五分钱。用贪心算法将找给1个一角一分和4个一分的硬币。然而,3个五分硬币是最好的找法。此时,贪心算法没有得到整体最优解。但通常可得到最优解的很好近似。4p贪心算法总是作出在当前看来最好的选择。p贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优局部最优选择。p希望贪心算法得到的最终结果也是整体最优的。p虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。p在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。5贪心算法的一般框架贪心算法的一般框架GreedyAlgorithm(paramet
3、ers)初始化;初始化;重复执行以下的操作重复执行以下的操作:选择当前可以选择的最优解;选择当前可以选择的最优解;将所选择的当前解加入到问题的解中去;将所选择的当前解加入到问题的解中去;直至满足问题求解的结束条件直至满足问题求解的结束条件。64.1 活动安排问题p活动安排问题:在所给的活动集合中选出最大的相容活动子集合。p该问题要求高效地安排一系列争用某一公共资源的活动。p贪心算法使得尽可能多的活动能兼容地使用公共资源。7设有n个活动的集合E=1,2,n,其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。每个活动i都有一个要求使用该资源的起始时间si和一个
4、结束时间fi,且si fi。如果选择了活动i,则它在si,fi)内占用资源。若si,fi)与sj,fj)不相交,则称活动i与j是相容的。即当sifj或sjfi时,活动i与活动j相容。活动安排问题就是求活动安排问题就是求E E的最大相容活动子集的最大相容活动子集。8活动安排问题的描述活动安排问题的描述用用数组数组A分别存放所有活动的起始时间、结束时分别存放所有活动的起始时间、结束时间以及是否予以安排的标记间以及是否予以安排的标记。某项活动结束时间愈早,安排其它活动的剩余区某项活动结束时间愈早,安排其它活动的剩余区间愈大。间愈大。贪心策略为尽量选择结束时间早的活动来安排贪心策略为尽量选择结束时间早
5、的活动来安排。为此,将数组中的活动按结束时间的为此,将数组中的活动按结束时间的非减非减顺序排顺序排序,即序,即f1f2fn。显然排序需要的时间为显然排序需要的时间为O(nlogn)。9templatevoid GreedySelector(int n,Type s,Type f,bool A)A1=true;int j=1;for(int i=2;i=fj)Ai=true;j=i;else Ai=false;下面给出解活动安排问题的贪心算法GreedySelectorGreedySelector:各活动的起始时间和结各活动的起始时间和结束时间存储于数组束时间存储于数组s s和和f f中且按结束
6、时间的非减中且按结束时间的非减序排列序排列 10u由于输入的活动以其完成时间的非减序非减序排列,所以算法greedySelector每次总是选择具有最具有最早完成时间早完成时间的相容活动加入集合A中。u算法贪心选择的意义是使剩余的可安排时间使剩余的可安排时间段极大化段极大化,以便安排尽可能多的相容活动。u当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。u如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。11 例例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:i1234567891011Si130
7、535688212fi4567891011121314124.1 活动安排问题 算法算法greedySelectorgreedySelector 的的计算过程计算过程如左图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。时间时间 13l若被检查的活动i的开始时间si小于最近选择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。l贪心算法并不总能求得问题的整体最优解整体最优解。但对于活动安排问题,greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用
8、数学归纳法证明。14贪心算法也能获得最优解贪心算法也能获得最优解n设活动集合设活动集合E=1,2,n已经按结束时间的非减已经按结束时间的非减顺序排列,活动顺序排列,活动1具有最早结束时间。具有最早结束时间。n首先,必定有一个最优解包含活动首先,必定有一个最优解包含活动1。不然设不然设A E是最优解且是最优解且A中最早结束的活动中最早结束的活动是是k。若。若k=1,则最优解包含活动,则最优解包含活动1。若。若k1,则活动,则活动1必与必与A中除中除k以外的活动相容。令以外的活动相容。令B=(Ak)1,则,则B也是一个最优解。也是一个最优解。n其次,若其次,若A是原问题的包含活动是原问题的包含活动
9、1的最优解,则的最优解,则A=A1是活动集合是活动集合E=iE:sif1的一的一个最优解。个最优解。不然设不然设B 是是E 的解且的解且|B|A|,则,则B 1是是E的解且的解且|B|+1|A|。此与。此与A是是最优解矛盾。最优解矛盾。n对贪心选择次数用数学归纳法即知,贪心算法对贪心选择次数用数学归纳法即知,贪心算法最终产生原问题的最优解。最终产生原问题的最优解。154.2 贪心算法的基本要素考察用贪心算法求解的问题的一般特征 对于一个具体问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。从许多用贪心算法求解的问题中看到,这类问题一般具有2个重要性
10、质:贪心选择性贪心选择性质质和最优子结构性质最优子结构性质。164.2.14.2.1、贪心选择性质、贪心选择性质l贪心选择性质贪心选择性质是指所求问题的整体最优解整体最优解可以通过一系列局部最优局部最优的选择(即贪心选择)来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。l动态规划算法通常以自底向上自底向上的方式解各子问题l贪心算法则通常以自顶向下自顶向下的方式进行,以迭代方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。l对具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。17p当一个问题的最
11、优解包含其子问题的最优解时,称此问题具有最优子结构性质最优子结构性质。p问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。4.2.24.2.2、最优子结构性质、最优子结构性质18共同点:贪心算法和动态规划算法都要求问题具有最优子结构性质。具有最优子结构最优子结构的问题应该选用贪心算法,还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?下面研究2个经典的组合优化问题组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。4.2.3、贪心算法与动态规划算法的差异194.2.3、贪心算法与动态规划算法的差异0-1背包问题背包问题:给定n种物品和一个背包。物
12、品i的重量是wi,其价值为vi,背包的容量为c。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?在选择装入背包的物品时,对每种物品在选择装入背包的物品时,对每种物品i只有只有2种选择,即种选择,即装入背包或不装入背包。不能将物品装入背包或不装入背包。不能将物品i装入背包多次,也装入背包多次,也不能只装入部分的物品不能只装入部分的物品i。204.2.3、贪心算法与动态规划算法的差异背包问题:背包问题:与0-1背包问题类似,所不同的是在选择物品i装入背包时,可以选择物品可以选择物品i i的一部分的一部分,而不一定要全部装入背包,1in。这2类问题都具有最优子结构最优子结构性质,极为相似,
13、但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。21计算每种物品单位重量的价值vi/wi依贪心选择策略,将尽可能多的单位重量价单位重量价值最高值最高的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并尽可能多地装入背包。依此策略一直地进行下去,直到背包装满为止。具体算法可描述如下:用贪心算法解背包问题的基本步骤:224.2.3、贪心算法与动态规划算法的差异void Knapsack(int n,float M,float v,float w,float x)Sort(n,v,w);int i;for(i=1;i=n;i+)x
14、i=0;float c=M;for(i=1;ic)break;xi=1;c-=wi;if(i=n)xi=c/wi;算法算法knapsack的的主要计算时间在于将主要计算时间在于将各种物品依其单位重各种物品依其单位重量的价值从大到小排量的价值从大到小排序。因此,算法的计序。因此,算法的计算时间上界为算时间上界为O(nlogn)。)。为了证明算法的正确为了证明算法的正确性,还必须证明背包性,还必须证明背包问题具有贪心选择性问题具有贪心选择性质质。230-10-1背包问题不适用贪心算法背包问题不适用贪心算法背包容量为背包容量为50kg,物品,物品1,2和和3的容量和价值分别的容量和价值分别为为(10
15、kg,$60),(20kg,$100)和和(30kg,$120)。单位重量价值最高的为物品单位重量价值最高的为物品1,6$/kg。但是依照。但是依照贪心算法首选物品贪心算法首选物品1却不能获得最优解:却不能获得最优解:物品物品1物品物品2物品物品1物品物品3物品物品2物品物品3总价总价值为值为$160,空余空余20kg总价总价值为值为$180,空余空余10kg总价值总价值为为$220,没有空没有空余。余。24对于0-1背包问题背包问题,贪心选择之所以不能得到最优解,是因为在这种情况下,无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。在考虑0-1背包问题时,应比较选择该
16、物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此导出许多互相重叠的子问题。这正是该问题可用动态规划算法动态规划算法求解的另一重要特征。25贪心选择与最优子结构贪心选择与最优子结构满足贪心选择性质必满足最优子结构性质。满足贪心选择性质必满足最优子结构性质。若原问题若原问题E的最优解的最优解A是经过有限次贪心选择是经过有限次贪心选择后获得的,则并必定包含了贪心选择后获得的,则并必定包含了贪心选择1。实际。实际上在选择了贪心选择上在选择了贪心选择1后,就将原问题分解为后,就将原问题分解为子问题子问题E和和E”,贪心选择,贪心选择1显然是显然是E的最优的最优解,而解,而A1必定是必定是E”
17、的最优解。否则将导的最优解。否则将导出出A不是最优解的矛盾。因此原问题的最优不是最优解的矛盾。因此原问题的最优解是由子问题的最优解组成的。用归纳法可解是由子问题的最优解组成的。用归纳法可证明其后的贪心选择同样保持最优子结构性证明其后的贪心选择同样保持最优子结构性质。质。n但是满足最优子结构性质却未必满足贪心选择但是满足最优子结构性质却未必满足贪心选择性质。性质。因为原问题因为原问题E尽管满足最优子结构性质,尽管满足最优子结构性质,即它的最优解即它的最优解A是由两个子问题的最优解是由两个子问题的最优解B1和和B2所构成的,但所构成的,但B1和和B2都不是用贪心选择可以都不是用贪心选择可以做出的。
18、例如在矩阵连乘积问题中:做出的。例如在矩阵连乘积问题中:mij=minikjmik+mk+1j+pi1pkpj这个断点这个断点k就不是用贪心选择可以做出来的。就不是用贪心选择可以做出来的。n因此能够应用动态规划法的不一定能够应用贪因此能够应用动态规划法的不一定能够应用贪心算法。心算法。n虽然能够应用贪心算法一定能够应用动态规划虽然能够应用贪心算法一定能够应用动态规划法,但是一般来说,贪心算法的效率高于动态法,但是一般来说,贪心算法的效率高于动态规划法,因而还是应用贪心算法。规划法,因而还是应用贪心算法。264.3 最优装载p有一批集装箱,要装上一艘载重量为c的轮船。其中集装箱i的重量为wi。p
19、最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。p算法描述算法描述p最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可产生最优装载问题的最优解。274.3 最优装载Template void Loading(int x,Type w,Type c,int n)int*t=new int n+1;Sort(w,t,n);for(int i=1;i=n;i+)xi=0;for(int i=1;i=n&wti 1时,取y1=1,yk=0,yi=xi,1in,ik,则l故(y1,y2,yn)是所给最优装载问题的一个可行解.l而由(y1+y2+yn)=(x1+
20、x2+xn)知,(y1,y2,yn)是一个满足贪心选择性质的最优解.l最优装载问题具有贪心选择性质。x1=0,xk=1 29 3、最优子结构性质、最优子结构性质p若(x1,x2,xn)是最优装载问题的一个满足贪心选择性质的最优解,则有x1=1。p(x2,xn)是轮船载重量为c-w1且待装集装箱为2,3,n时,相应最优装载问题的一个最优解.p最优装载问题具有最优子结构性质。p由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法loading的正确性。p算法loading的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为 O(nlogn)。304.4 4.4 电脑里的数据压
21、缩电脑里的数据压缩 哈夫曼编码哈夫曼编码第一,可以节省空间第一,可以节省空间第二,可以减少对带宽的占用第二,可以减少对带宽的占用如果没有如果没有数据压缩技术数据压缩技术:没法用没法用WinRAR为为Email中的附件瘦身;中的附件瘦身;数码录音笔就只能记录不到数码录音笔就只能记录不到20分钟的语音;分钟的语音;从从Internet上下载一部电影要花太长的时间上下载一部电影要花太长的时间;31n严格意义上的数据压缩起源于人们对概率的认识严格意义上的数据压缩起源于人们对概率的认识n当对文字信息进行编码时,当对文字信息进行编码时,如果为出现概率较高的如果为出现概率较高的字母赋予较短的编码字母赋予较短
22、的编码,为出现概率较低的字母赋予,为出现概率较低的字母赋予较长的编码,较长的编码,总的编码长度就能缩短不少总的编码长度就能缩短不少。n远在计算机出现之前,著名的远在计算机出现之前,著名的Morse(摩尔斯式)(摩尔斯式)电电码就已经成功地实践了这一准则。码就已经成功地实践了这一准则。n在在Morse码表中,码表中,每个字母都对应于一个唯一的每个字母都对应于一个唯一的点划组合点划组合,出现概率最高的字母,出现概率最高的字母e被编码为一个点被编码为一个点“.”,而出现概率较低的字母,而出现概率较低的字母z则被编码为则被编码为“-.”。显然,这可以有效缩短最终的电码长度。显然,这可以有效缩短最终的电
23、码长度。32u设计具体的压缩算法的过程设计具体的压缩算法的过程通常更像是一场数学通常更像是一场数学游戏游戏。u要寻找一种要寻找一种能尽量精确地统计或估计信息中符号能尽量精确地统计或估计信息中符号出现概率的方法出现概率的方法u还要设计一套用最短的代码还要设计一套用最短的代码,描述每个符号的编描述每个符号的编码规则码规则u统计学知识对于前一项工作相当有效,已经陆续统计学知识对于前一项工作相当有效,已经陆续实现了实现了静态模型、半静态模型、自适应模型、静态模型、半静态模型、自适应模型、Markov Markov 模型、部分匹配预测模型模型、部分匹配预测模型等等概率统计模型概率统计模型。u相对而言,编
24、码方法的发展历程更为曲折一些。相对而言,编码方法的发展历程更为曲折一些。33p第一个实用的编码方法第一个实用的编码方法是由是由D.A.Huffman在在1952年的论文年的论文“最小冗余度代码的构造方法(最小冗余度代码的构造方法(AMethodfortheConstructionofMinimumRedundancyCodes)”中提出的。中提出的。p直到今天,许多直到今天,许多数据结构数据结构教材教材,在讨论二叉树在讨论二叉树时时,仍要提及这种称为仍要提及这种称为Huffman编码编码的方法。的方法。pHuffman编码在计算机界是如此著名,以至于连编码在计算机界是如此著名,以至于连编码的发
25、明过程本身也成了人们津津乐道的话题。编码的发明过程本身也成了人们津津乐道的话题。p据说,据说,1952年时,年轻的年时,年轻的Huffman还是还是麻省理工麻省理工学院的一名学生学院的一名学生,他为了向老师证明自己可以不参加,他为了向老师证明自己可以不参加某门功课的期末考试,才设计了这个看似简单,但却某门功课的期末考试,才设计了这个看似简单,但却影响深远的编码方法影响深远的编码方法.34lHuffman编码效率高,运算速度快,实现方式灵活编码效率高,运算速度快,实现方式灵活,从,从20世纪世纪60年代至今,在数据压缩领域得到了广泛的应用。年代至今,在数据压缩领域得到了广泛的应用。l早期早期UN
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机算法分析与设计 第4章 计算机 算法 分析 设计
限制150内