动态程序设计.ppt
《动态程序设计.ppt》由会员分享,可在线阅读,更多相关《动态程序设计.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、动态程序设计动态程序设计基本原理1、多阶段最优化决策:、多阶段最优化决策:即由初始状态开始,通过对中间阶段决策的选择,达到结束状态。这些决策形成了一个决策序列,同时确定了完成整个过程的一条最优的活动路线。带权有向的多段图 上一阶段的状态下一阶段的状态决策概念w 状态状态(State):表示事物的性质,是描述“动态规划”中的“单元”的量。亦是每一阶段求解过程的出发点。w 阶段阶段(Stage):阶段是一些性质相近,可以同时处理同时处理的状态集合,或者说,阶段只是标识那些处理方法相同、处理顺序无关的状态。w 决策决策(Decision):每个阶段做出的某种选择性的行动,是程序所需要完成的选择。w
2、状态转移方程:状态转移方程:是前一个阶段的状态转移到后一个的状态的演变规律,是关于两个相邻阶段状态变化的方程,是“动态规划”的中心。设设 fk(i)k阶段状态i的最优权值,即初始状态至状态i的最优代价 fk+1(i)=minxk(j)+u(i,j) 基本原理w 最优性原理作为整个过程的最优策略,它满足:相对前面决策所形成的状态而言,余下的子策略必然构成“最优子策略”。无后效性原则给定某一阶段的状态,则在这一阶段以后过程的发展不受这阶段以前各段状态的影响,所有各阶段都确定时,整个过程也就确定了。这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展,这个性质称为无后效性。机器分配 w 总
3、公司拥有高效生产设备M台,准备分给下属的N个公司。各分公司若获得这些设备,可以为国家提供一定的盈利。问:如何分配这M台设备才能使国家得到的盈利最大?求出最大盈利值。其中M=15,N=10。分配原则:每个公司有权获得任意数目的设备,但总台数不得超过总设备数M。w 数据文件格式为:第一行保存两个数,第一个数是设备台数M,第二个数是分公司数N。接下来是一个M*N的矩阵,表明了第I个公司分配J台机器的盈利。 分析w 用机器数来做状态,数组FI,J表示前I个公司分配J台机器的最大盈利。则状态转移方程为:w FI,J=MaxFI-1,K + ValueI,J-K (1=I=N,1=J=M,0=K=J )w
4、 初始值: F(0,0)=0w 时间复杂度O(N*M2)最长不下降序列 w 设有整数序列b1,b2,b3,bm,若存在下标i1i2i3 in,且bi1bi2bi3 bin,则称 b1,b2,b3,bm中有长度为n的不下降序列bi1 , bi2 ,bi3 ,bin 。w 求序列b1,b2,b3,bm中所有长度(n)最大不下降子序列w 输入:整数序列。w 输出:最大长度n和所有长度为n的序列个数。分析(1)设f(i)为前i个数中的最大不下降序列长度 , 则w f(i)=maxf(j)+1 (1=ji=m, bjbi)w 边界为F(1)=1(2)设t(i)为前i个数中最长不下降序列的个数,则w t(
5、i)=t(j) (1=ji=m , bjbi, f(j)=f(i)-1) w 初始为t(i)=1w 当f(i)=n时,将t(i)累加w 举例: 1 2 3 4 6 5 8 10 9 f: 1 2 3 4 5 5 6 7 7 t: 1 1 1 1 1 1 2 2 2答案:f=7时,边界为t=4进一步(3)求本质不同的最长不下降序列个数有多少个? 如:1 2 3 4 6 5 8 10 9 有, 1 2 3 4 6 8 10 , 1 2 3 4 5 8 10, 1 2 3 4 6 8 9 ,1 2 3 4 5 8 9 都是本质不同的。 但对于 1 2 2 3 3 5 4 f 1 2 2 3 3 5
6、4 t 1 1 1 2 2 4 4 答案有8个,其中4个1 2 3 5 ,4个1 2 3 4改进算法w 上例显然对于相两个相同的数,重复算了多次因此,我们对算法进行改进:w 对原序列按b从小到大(当bi=bj时按F从大到小)排序,增设Order(i)记录新序列中的i个数在原序列中的位置。可见,w 求t(i)时,当f(j)=f(j+1),b(j)=b(j+1)且Order(j+1)Order(i)时,便不累加t(j)。这样就避免了重复。w 上述算法的时间复杂度为O(n2) 凸多边形三角划分 w 给定一个具有N(N50)个顶点(从1到N编号)的凸多边形,每个顶点的权均已知。问如何把这个凸多边形划分
7、成N-2个互不相交的三角形,使得这些三角形顶点的权的乘积之和最小?w 输入文件:第一行 顶点数Nw 第二行 N个顶点(从1到N)的权值w 输出格式:最小的和的值w 各三角形组成的方式w 输入示例:5w 121 122 123 245 231 w 输出示例:The minimum is :12214884w The formation of 3 triangle:w 3 4 5, 1 5 3, 1 2 3 分析w 设FI,J(IJ)表示从顶点I到顶点J的凸多边形三角剖分后所得到的最大乘积,我们可以得到下面的动态转移方程:w FI,J=MinFI,K+FK,J+SI*SJ*SK (0IKJ=N)w
8、 初始条件:F1,2=0w 目标状态:F1,Nw 但我们可以发现,由于这里为乘积之和,在输入数据较大时有可能超过长整形范围,所以还需用高精度计算 系统可靠性 w 一个系统由若干部件串联而成,只要有一个部件故障,系统就不能正常运行,为提高系统的可靠性,每一部件都装有备用件,一旦原部件故障,备用件就自动进入系统。显然备用件越多,系统可靠性越高,但费用也越大,那么在一定总费用限制下,系统的最高可靠性等于多少?w 给定一些系统备用件的单价Ck,以及当用Mk个此备用件时部件的正常工作概率Pk(Mk),总费用上限C。求系统可能的最高可靠性。 w 输入文件格式:第一行:n C第二行:C1 P1(0) P1(
9、1) P1(X1) (0=X1=C/Ck) 第 n 行:Cn Pn(0) Pn(1) Pn(Xn) (0=Xn=C/Cn)分析w 例:输入:2 20 3 0 .6 0.65 0.7 0.75 0.8 0.85 0.9 5 0.7 0.75 0.8 0.8 0.9 0.95 输出:0.6375w 设FI,money表示将money的资金用到前I项备用件中去的最大可靠性,则有w FI,money = maxFI-1 ,moneyk*CostI w (0=I=n,0=K= money div Cost(I) )w 初始: F0,0=0w 目标: Fn,C=0快餐问题 w Peter最近在R市开了一家
10、快餐店,为了招揽顾客,该快餐店准备推出一种套餐,该套餐由A个汉堡,B个薯条和C个饮料组成。价格便宜。为了提高产量,Peter从著名的麦当劳公司引进了N条生产线。所有的生产线都可以生产汉堡,薯条和饮料,由于每条生产线每天所能提供的生产时间是有限的、不同的,而汉堡,薯条和饮料的单位生产时间又不同。这使得Peter很为难,不知道如何安排生产才能使一天中生产的套餐产量最大。请你编一程序,计算一天中套餐的最大生产量。为简单起见,假设汉堡、薯条和饮料的日产量不超过100个。w 输入:第一行为三个不超过100的正整数A、B、C中间以一个空格分开。第二行为3个不超过100的正整数p1,p2,p3分别为汉堡,薯
11、条和饮料的单位生产耗时。中间以一个空格分开。第三行为N(0=0=10),第四行为N个不超过10000的正整数,分别为各条生产流水线每天提供的生产时间,中间以一个空格分开。w 输出:每天套餐的最大产量。 分析w 本题是一个非常典型的资源分配问题。由于每条生产线的生产是相互独立,不互相影响的,所以此题可以以生产线为阶段用动态规划求解。w 状态表示:用pi,j,k表示前i条生产线生产j个汉堡,k个薯条的情况下最多可生产饮料的个数。w 用ri,j,k表示第i条生产线生产j个汉堡,k个薯条的情况下最多可生产饮料的个数。w 态转移方程 : pi,j,k = Maxpi-1,j1,k1+ri,j-j1,k-
12、k1 ( 0=j1=j=100,0=k1=k=100, 且(j-j1)*p1+(k-k1)*p2=Ti-第i条生产线的生产时间 )w ri,j-j1,k-k1=(Ti-(j-j1)*p1+(k-k1)*p2) div p3 ;w 此算法的时间复杂度为O(N*1004), 优化w 在本题中,可以在动态规划方法中加入了贪心算法思想:即首先计算出每天生产套数的上限值(由A,B,C计算,即min100 div A,100 div B,100 div c),接着,用贪心法计算出这N条流水线可以生产的套数,并与上限比较,大于则输出上限值并退出,否则再调用动态规划;同时,在运行动态规划的过程中,也可以每完成
13、一阶段工作便与上限值进行比较,这样以来,便可望在动态规划完成前提前结束程序。其算法设计为:w S1:读入数据。w S2:贪心求上限并计算出一可行解,判断是否需进行下一步。w S3:动态规划求解。w S4:输出。其他优化方法w 1.存储结构:由于每一阶段状态只与上一阶段状态有关,所以我们可以只用两个100*100的数组滚动实现。但考虑到滚动是有大量的赋值,可以改进为动态数组,每次交换时只需交换指针即可,这样比原来数组间赋值要快。w 2.减少循环次数:在计算每一阶段状态过程中无疑要用到4重循环,我们可以这样修改每一重循环的起始值和终数,其中q1,q2为A,B上限值。w 原起始值 改进后的起始值wf
14、or i:=1 to n do for i:=1 to n do wfor j:=0 to toti div p1 do for j:=0 to min(q1,toti div p1) dowfor k:=0 to (toti-p1*j) div p2 do for k:=0 to min(q2,(toti-p1*j)div p2) dowfor j1:=0 to j do for j1 := max(0,j-ti div p1) to min(j,toti-1 div p1) dow for k1 := 0 to k do for k1:=max(0,k-(ti-(j-j1)*p1) div
15、 p2) to min(k,(toti-1-p1*j1)div p2) do 石子合并 w 在一园形操场四周摆放N堆石子(N100),现要将石子有次序地合并成一堆.规定每次只能选相临的两堆合并成一堆,并将新的一堆的石子数,记为该次合并的得分。编一程序,由文件读入堆数N及每堆石子数(20),(1)选择一种合并石子的方案,使得做N-1次合并,得分的总和最少 (2) 选择一种合并石子的方案,使得做N-1次合并,得分的总和最大w 输入数据: 第一行为石子堆数N; 第二行为每堆石子数,每两个数之间用一空格分隔.w 输出数据 :从第1至第N行为得分最小的合并方案. 第N+1行为空行.从N+2到2N+1行是
16、得分最大的合并方案. 示例贪心法 N=5 石子数分别为3 4 6 5 4 2。用贪心法的合并过程如下:第一次 3 4 6 5 4 2得分 5第二次 5 4 6 5 4得分9第三次 9 6 5 4得分9第四次 9 6 9得分15第五次 15 9得分24第六次24总分:62然而仔细琢磨后,发现更好的方案:第一次3 4 6 5 4 2得分 7第二次7 6 5 4 2得分13第三次13 5 4 2得分6第四次13 5 6得分11第五次 13 11得分24第六次24总分:61显然,贪心法是错误的。 动态规划 w 用datai,j表示将从第i颗石子开始的接下来j颗石子合并所得的分值,w maxi,j表示将
17、从第i颗石子开始的接下来j颗石子合并可能的最大值,那么:w maxi,j = max(maxi, k + maxi + k, j k + datai,k + datai+k, jk) (2=k=j)w maxi,1 = 0w 同样的,我们用mini,j表示将第从第i颗石子开始的接下来j颗石子合并所得的最小值,可以得到类似的方程:w mini,j = min(mini, k + mini + k, j k + datai,k + datai+k, j k) (0=k=j)w mini,0 = 0w 这样,我们完美地解决了这道题。时间复杂度也是O(n2)。积木游戏 w 一种积木游戏,游戏者有N块编
18、号依次为1,2,N的长方体积木。第I块积木通过同一顶点三条边的长度分别为ai,bi,ci(i=1,2,N),1 从N块积木中选出若干块,并将他们摞成M(1= M = N)根柱子,编号依次为1,2,M,要求第k根柱子的任意一块积木的编号都必须大于第K-1根柱子任意一块积木的编号(2=K=n),x,y是上面一块积木接触面的两条边(x=y),则一定满足m.=x和n=y;w 下面的积木的编号要小于上面的积木的编号。w 请你编一程序,寻找一种游戏方案,使得所有能摞成的M根柱子的高度之和最大。积木游戏w 输入数据:w 文件的第一行是两个正整数N和M(1= M = N =100),分别表示积木总数和要求摞成
19、的柱子数。这两个数之间用一个空格符隔开。接下来的N行是编号从1到N个积木的尺寸,每行有三个1至500之间的整数,分别表示该积木三条边的长度。同一行相邻两个数之间用一个空格符隔开。w 输出数据:w 文件只有一行,是一个整数,表示所求得的游戏方案中M根柱子的高度之和 分析w 设(1) fi,j,k表示以第i块积木的第k面为第j根柱子的顶面的最优方案的高度总和; (2)blocki,k 记录每个积木的三条边信息(blocki,4:=blocki,1; blocki,5:=blocki,2)。其中blocki,j+2表示当把第i块积木的第j面朝上时所对应的高,即所增加的高度;(3)cani,k,p,k
20、c表示第I块积木以其第k面朝上,第p块积木以第kc面朝上时,能否将积木I放在积木p的上面。1表示能,0表示不能。对于fi,j,k, 有两种可能: 1. 除去第I块积木,第j根柱子的最上面的积木为编号为p的,若第p块积木以第kc面朝上,必须保证当第I块积木以k面朝上时能够被放在上面,即cani,k,p,kc=1; 2. 第i块积木是第j根柱子的第一块积木,第j-1根柱子的最上面为第p块积木,则此时第p块积木可以以任意一面朝上。则有:动态规划)31, 11 (2, 1,max) 1, 31 , 11 (2,maxmax,kcipjiblockkcjpfkcpkicankcipjiblockkcjp
21、fkjif且w 边界条件:w f1,1,1:=block1,1,3; f1,1,2:=block1,1,4; f1,1,3:=block1,1,5;w fi,0,k:=0; (1= i = n, 1= k = 3);w 时间复杂度为O(n2*m) 免费馅饼 w SERKOI最新推出了一种叫做“免费馅饼”的游戏。w 游戏在一个舞台上进行。舞台的宽度为W格,天幕的高度为H格,游戏者占一格。开始时,游戏者站在舞台的正中央正中央,手里拿着一个托盘。w 游戏开始后,从舞台天幕顶端的格子中不断出现馅饼并垂直下落。游戏者左右移动去接馅饼。游戏者每秒可以向左或右移动一格或两格,也可以站在愿地不动。w 馅饼有很
22、多种,游戏者事先根据自己的口味,对各种馅饼依次打了分。同时在8-308电脑的遥控下,各种馅饼下落的速度也是不一样的,下落速度以格/秒为单位。当馅饼在某一秒末恰好恰好到达游戏者所在的格子中,游戏者就收集到了这块馅饼。w 写一个程序,帮助我们的游戏者收集馅饼,使得收集的馅饼的分数之和最大。免费馅饼w 输入数据:输入文件的第一行是用空格分开的两个正整数,分别给出了舞台的宽度W(199之间的奇数)和高度H(1 100之间的整数)。w 接下来依馅饼的初始下落时间顺序给出了一块馅饼信息。由四个正整数组成,分别表示了馅饼的初始下落时刻(0 1000秒),水平位置、下落速度(1 100)以及分值。游戏开始时刻
23、为0。从1开始自左向右依次对水平方向的每格编号。w 输出数据:输出文件的第一行给出了一个正整数,表示你的程序所收集到的最大分数之和。分析w 我们将问题中的馅饼信息用一个表格存储。表格的第I行第J列表示的是游戏者在第I秒到达第J列所能取得的分值。那么问题便变成了一个类似数字三角形的问题:从表格的第一行开始往下走,每次只能向左或右移动一格或两格,或不移动走到下一行。怎样走才能得到最大的分值。w 因此,我们很容易想到用动态规划求解。w FI,J表示游戏进行到第表示游戏进行到第I秒,这时游戏者站在第秒,这时游戏者站在第J列时列时所能得到的最大分值。那么动态转移方程为:所能得到的最大分值。那么动态转移方
24、程为: FI,J = Max FI-1,K + 馅饼的分值馅饼的分值 ( J-2=K=J+2 )w 有一个三角形木板,竖直立放,上面钉着n(n+1)/2颗钉子,还有(n+1)个格子(当n=5时如图1)。每颗钉子和周围的钉子的距离都等于d,每个格子的宽度也都等于d,且除了最左端和最右端的格子外每个格子都正对着最下面一排钉子的间隙。w 让一个直径略小于d的小球中心正对着最上面的钉子在板上自由滚落,小球每碰到一个钉子都可能落向左边或右边(概率各1/2),且球的中心还会正对着下一颗将要碰上的钉子。例如图2就是小球一条可能的路径。w 我们知道小球落在第i个格子中的概率概率pi= ,其中i为格子的编号,从
25、左至右依次为0,1,.,n。w 现在的问题是计算拔掉某些钉子后,小球落在编号为m的格子中的概率pm。假定最下面一排钉子不会被拔掉。例如图3是某些钉子被拔掉后小球一条可能的路径。钉子和小球 钉子和小球 w 输入:第1行为整数n(2=n=50)和m(0=m=n)。以下n行依次为木板上从上至下n行钉子的信息,每行中*表示钉子还在,.表示钉子被拔去,注意在这n行中空格符可能出现在任何位置。w 输出:仅一行,是一个既约分数(0写成0/1),为小球落在编号为m的格子中的概率pm分析w 设三角形有n行,第i行(1=i=n)有i个铁钉位置,其编号为0.i-1;第n+1行有n+1个铁钉位置,排成n+1个格子,编
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 程序设计
限制150内