《动态规划法求解生产与存储问题(共20页).doc》由会员分享,可在线阅读,更多相关《动态规划法求解生产与存储问题(共20页).doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上 动态规划一动态规划法的发展及其研究内容动态规划是运筹学的一个分支,是求解决策过程最优化的数学方法。20世纪50年代初美国数学家R.E.BELLMAN等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理,把多阶段问题转化为一系列的单阶段问题,逐个求解创立了解决这类过程优化问题的新方法动态规划。1957年出版的他的名著Dynamic Proggramming,这是该领域的第一本著作。 动态规划问世以来,在经济管理生产调度工程技术和最优控制等方面得到了广泛的应用。例如最短路线库存管理资源分配设备更新组合排序装载等问题,采用动态规划法求解比用其他方法更为简便。二动态
2、规划法基本概念 一个多阶段决策过程最优化问题的动态规划模型通常包括以下几个要素:1 阶段 阶段(stage)是对整个过程的自然划分。通常根据时间顺序或是空间特征来划分阶段,对于与时间,空间无关的“静态”优化问题,可以根据其自然特征,人为的赋予“时段”概念,将静态问题动态化,以便按阶段的顺序解优化问题。阶段变量一般用k=1.2.n.表示。1. 状态状态(state)是我们所研究的问题(也叫系统)在过个阶段的初始状态或客观条件。它应能描述过程的特征并且具有无后效性,即当某阶段的状态给定时,这个阶段以后的过程的演变与该阶段以前各阶段的状态无关。通常还要求状态是可以直接或者是间接可以观测的。描述状态的
3、变量称为状态变量(State Virable)用s 表示,状态变量的取值集合称为状态集合,用S表示。变量允许取值的范围称为允许状态集合(set of admissble states).用x(k)表示第k阶段的状态变量,它可以是一个数或者是一个向量。用X(k)表示第k阶段的允许状态集合。n 个阶段的决策过程有n+1个状态变量,x(n+1)是x(n)的演变的结果。根据演变过程的具体情况,状态变量可以是离散的或是连续的。为了计算方便有时将连续变量离散化,为了分析的方便有时又将离散的变量视为连续的。2 决策当一个阶段的状态确定后,可以做出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(d
4、ecision),在最优控制问题中也称为控制(control)描述决策的变量称为决策变量(decision virable)。变量允许取值的范围称为允许决策集合(set of admissble decisions)。用表示第k阶段处于阶段x(k)的决策变量,它是x(k)的函数,用表示x(k)的允许决策集合决策变量简称决策。4.策略决策组成的系列称为策略(policy)。由初始状态x1开始的全过程的策略记作.由第k阶段的状态x(k)开始到终止状态的后部子过程的策略,;k=2,n-1.可供选择的策略有一定的范围,称为允许策略集合(set of admissble polices),用, 等表示。
5、5.状态转移方程在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态偏完全可以确定。用状态转移方程(state transfer equations)表示这种演变规律,写作:6.阶段指标函数对于k阶段的状态x(k),当执行了决策时,除带来系统状态的转移之外,还产生第k阶段的局部利益,它是总效益的一部分,称为阶段指标函数(stage effective fuction),记作.7.过程指标函数用来衡量策略或者是子策略执行效果的数量指标称为过程指标函数(process effective fuction),它定义在所有k后部子过程上,常用用表示,即k=1,2,n.当k=1时,就是全过程指标函
6、数。如果状态x(k)和子策略给定,那么也就被确定了,所以是x(k)和的函数,记为:常见的过程指标函数是连和形式或连积形式:8.最优指标函数过程指标函数的最优值称为最优指标函数(optimum effective fuction),记为f(x(k).它表示,采取了最优子策略之后,后部子过程所获得的总效益,表示为:式中opt是optimization的缩写,意为最优化,可以根据具体问题去max或min三动态规划法的最优性原理和基本函数方程在动态规划中起核心作用的是最优性原理:“作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,相对于前面决策所形成的状态而言,余下的决策系列必须构成最优
7、子策略。”动态规划解法的关键在于给出一种递推关系,一般把这种关系称为基本函数方程,注意到无后效性,最优指标函数为 当k=n时,由于x(n+1)是整个决策过程的终止状态,以后不再做出决策,因此,这样就得到了可以用来递推的基本函数方程:f(x(n+1)=0.类似的,可以得到乘法形式的基本函数方程:f(x(n+1)=1.四建立动态规划模型的基本步骤1. 阶段;2. 状态变量及可能状态集合;3. 决策变量及允许决策集合;4. 状态转移方程;5. 阶段指数函数;6. 基本函数方程;建立动态规划模型基本上是上面6个步骤,按上述顺序逐步确定16的内容。五动态规划法的递推方向及求解形式1. 递推解法基本方程:
8、f(x(n+1)=0状态转移方程为计算步骤是,利用终端条件从k=n开始由后向前递推基本方程,求得各阶段的最优决策和最优函数,最后算出f(x(1)时就得到了最优决策系列再按照状态转移方程从k=1开始确定,k=1,2,n为最优轨迹线,为最优策略。2. 顺推解法使用顺推解法时,一些概念的含义须做相应调整。状态变量x(k)表示第k阶段末系统的形态状况,最优值函数f(x(k)表示从第一阶段到第k阶段总效益的最优值,状态转移方程为基本函数方程为f(x(0)=0或13. 求解形式求解动态规划问题,一般有两种形式:解析形式和表格形式,解析形式是利用函数的解析表达式,在每个阶段用经典求极值的方法得到最优解。表格
9、形式是指各阶段的计算过程均在表格中进行,这种形式便于分析和比较,操作过程直观且简练,适用于没有解析表达式的离散型问题。4.动态规划的适用条件适用动态规划的问题通常应满足如下3点:最优化原理(最优子结构性质)。如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构性质,即满足最优化原理。由于对于有些问题的某些递归式来讲并不一定能保证最优化原则,因此在求解问题时有必要对它进行验证。若不能保持最优原则,则不可以应用动态规划法求解。在得到最优解的递归式之后,需要执行回溯以构造最优解。无后效性。应用动态规划法的一个重要条件就是将各阶段按照一定的次序排好,阶段i的状态只能由阶段i+1的状态
10、来确定,与其他状态没有关系,尤其是于未发生的状态没有关系。换言之,每个状态都是“过去历史的一个完整总结”。这就是无后效性。子问题的重叠性。子问题的重叠性是指在利用递归算法自顶向下对问题进行求解时,每次产生的问题并不总是新问题,有些子问题可能会被重复计算多次。动态规划法正是利用子问题的这种重叠性质,对每一个问题只计算一次,然后将其计算结果保持起来,当再次需要计算已经计算过的子问题时,只要简单的查看一下以往的计算结果,从而获得较高的解题效率。子问题的的重叠性并不是动态规划适用的必要条件,但是如果该性质无法满足,动态规划算法同其他算法相比就无优势可言了。5.解决问题的步骤利用动态规划法求解问题的算法
11、通常包含如下几个步骤。分析。对原始的问题进行分析,找到问题的最优解的结构特征。分解。将所给问题按时间或空间特征分解成相互关联的阶段,并确定出计算局部最优解的递推关系,这是利用动态规划法解决问题的关键和难点所在。需要注意的是,分解后的各个阶段一定是有序的或者是可以排序的,即无后向性。否则问题就无法用动态规划求解。阶段之间相互联系方式是通过状态和状态转移体现的。每个阶段通常包含若干个状态,可以描述问题发展到这个阶段时所处在的一种客观情况。每个阶段的状态都由以前阶段的状态以某种方式“变化”来的,这样的“变化”称为状态转移。状态转移是导出状态的途径,也是联系各阶段的方式。解决。对于每个阶段通过自底向上
12、的方法求得局部最优解。由于这一步骤通常是通过递推实现的,因此,需要递推终止条件或边界条件。合并。将各个阶段求出的解合并为原问题的解,即构造一个最优解。动态规划的主要难点在于理论的设计,特别是递推关系的建立,一旦设计完成,实现部分就会非常简单。整个求解过程就可以使用一个最优决策表的二维数组来描述,其中行表示决策的阶段,列表示问题状态,表格需要填写的数据一般对应此问题的在某阶段某个状态下的最优值,如最短路径,最长公共子序列,最大价值等。填表的过程就是根据递推关系从1行1列开始,以行或者列优先的顺序,依次填写表格。最后根据整个表格的数据通过简单的取舍或者运算求得问题的最优解。总之,动态规划算法的关键
13、在于解决冗余,是一个以空间换时间的技术,所以它的空间复杂度要大于其他的算法。六动态规划问题在问题中的具体实现例如:动态规划规划在生产存储中的运用生产 存储问题是生产活动中经常遇到的问题。大批量生产可以降低成本,但当产量大于销量时就会造成产品积压而增加库存费用;单纯按市场要求安排生产也会因为开工不足或加班加点造成生产成本增加。因此合理利用存贮资源调节产量,满足要求是十分有意义的。生产与存贮问题是一个生产部门如何在已知生产成本,存贮费用和各阶段市场要求的条件下,决定各个生产阶段的产量,使得计划期内的费用之和最小。现设有一个生产部门,生产计划周期为n个阶段,已知最初库存量为x1,阶段需求量为dk,单
14、位产品的消耗费用是lk,单位产品的阶段库存费用为hk,仓库容量为mk,阶段生产能力为bk,生产固定成本为问如何安排现阶段的产量,使计划期内的费用综合为最小?该问题本身就是一个多阶段决策问题,设状态变量为xk为k阶段初的库存量,由于计划期初的库存量x1已知,计划期末的库存量通常也是给定的,为简单起见,假定x(n+1)=0,于是状态变量xk的约束条件是:决策变量uk选为阶段k的产量,它满足的约束条件是:状态转移方程为,它满足无后效性的要求。阶段效用由两阶段组成,一部分为生产费用,另一部分为存贮费用,即:动态规划基本方程为:七设计题目:某机床厂根据合同,在一至四月份为客户生产某种机床。工厂每月的生产
15、能力为10台,机床可以库存,存储费用为每台每月0.2万元,每月需要的数量及每台机床的生产成本如下表。试确定每月的生产量,要求既能满足每月的需求,又能使生产成本和存储费用之和达到最小。 表 需求量及生产成本月份1234需求(台)67126生产成本(万元/台)77.287.61. 构造动态规划模型阶段变量k把每个月作为一个阶段,k=1,2,3,4状态变量选择每个阶段的库存量为状态变量,可满足无后效性,由已知条件可知:x1=x5=0,单位为台决策变量设每个阶段的生产量为决策变量,由已知条件得010台,状态转移方程状态转移方程为:=+-(是第k阶段的市场需求量)阶段指标第k阶段的指标费用:(,)=0.
16、2+y(i)(0)i=1,2,3,4.或(,)=0.2+0 (=0)其中y1=7,y2=7.2,y3=8,y4=7.6,单位为万元2. 建立基本方程设最优值函数是从第k阶段的状态出发到过程终结的最小费用,按动态规划方法的逆序解基本方程又:(,)+ (k=4,3,2,1)F5(x5)=03. 逆序逆推计算k=4时按照问题的各种约束条件,确定状态变量x4的取值范围。按穷举法的思路,在量化的精度内,确定状态变量x4的全部可能取值。状态转移方程 x5=x4+u4-d4又x5=0,d4=6 所以有x4+u4=6又因为每个月的最大生产能力为10台。第1,2,3月的需求量为6,7,12台,故x4=0,1,2
17、,3,4,4台对x4的的确定取值,分别求出决策变量u4的取值范围当x4=0,u4=6;x4=3,u4=3x4=1, u4=5; x4=4, u4=2x4=2, u4=4; x4=5, u4=1由此可知x4与u4是一一对应的,即对于每个确定的状态,只有一种决策,故这唯一决策的结果是最优的。利用第四阶段的基本方程进行计算:F4(x4)=minv4(x4,u4)+f5(x5)=minv4(x4,u4)=v4(x4,u4)=0.2x4+7.6u4 (u40)或=0.2x4 (u4=0)计算结果列表1表1 k=4时+06045.6045.615038.2038.224030.8030.833023.40
18、23.4420160165108.608.6k=3时因为d3=12,d4=6,x1=x5=0,d1=7.每月的最大生产能力为10台,故2x37当x3=2,u3=10x3=3,u3=10,9x3=4,u3=10,9,8x3=5,u3=10,9,8,7x3=6,u3=10,9,8,7,6x3=7,u3=10,9,8,7,6,5状态变量x3的一个取值,对应决策变量u3的六个可能取值,要求分别计算出各个u3取值相应的指标函数值,再挑选其中的最小值为这个状态的最优指标函数值,f3(0).下面利用第三阶段的基本方程进行计算。F3(x3)=min【v3(x3,u3)+f4(x4)】其中v3(x3,u3)=0
19、.2x3+8u3 (u30)或v3(x3,u3)=0.2x3 (u3=0)状态转移方程x4=x3+u3-12 计算结果位于表2表2表2 k=3时+210080.445.6126310180.638.2118.89072.645.6118.2410280.830.8111.69172.838.21118064.845.6110.451038123.4104.4927330.8103.8816538.2103.2705745.6102.6610481.21697.29373.223.496.68265.230.8967157.238.295.46049.245.694.8710581.48.690
20、9473.41689.48365.423.488.87257.430.888.26149.438.287.65041.445.687k=2时确定x2的取值范围因为x1=0,0u110,且d1=6,且x32因此0x24 即x2=0,1,2,3,4.对于x2的每个确定值,分别求出u2的可能取值X2=0时,u2=10,9X2=1时,u2=10,9,8X2=2时,u2=10,9,8,7X2=3时,u2=10,9,8,7,6X2=4时,u2=10,9,8,7,6,5基本方程f2(x2)=minv2(x2,u2)+f3(x3)其中v2(x2,u2)=0.2x2+7.2u2 (u20)或v2(x2,u2)=
21、0.2x2 (u2=0)状态方程x3=x2+u2-3注:对上面的u2取值解释。本来 x2=0时,u2可取值为10,9,8,7.但由于每个月的最大生产能力为10台且d3=12,所以x3必须大于2台,因此u2取值只能为10,9.同理对于x3取其他可能值,也应考虑到x3必须大于2台,计算结果如下表3.表3 k=2+010372118.2190.29264.8126190.8110472.2110.4182.69365118.2183.28257.8126183.6210572.4102.61759465.2110.4175.68358118.2176.27250.8126176.8310672.69
22、4.8167.49565.4102.61688458.2110.4168.67351118.2169.26243.8126169.8410772.887159.89665.694.8160.48558.4102.61617451.2110.4161.66344118.2162.25236.8126162.8k=1时确定x1的取值范围X1=0确定u1的取值范围因为d1=6,x1=0。故6u110所以u1=10,9,8,7,6基本方程f1(x1)=minv1(x1,u1)+f2(x2)其中v1(x1,u1)=x1+7u1 (u10)或v1(x1,u1)=x1 (u1=0)状态转移方程:x2=x1+
23、u1-6计算结果列于下表4中:表4 k=1+010470159.8229.809363167.4230.40825617523107149182.6231.606042190.2232.2求全过程最优指标函数与最优化策略由k=1.可以求出其全过程最优指标函数f1(x1);由k=1至k=4各表,可以依次求出第1,2,3,4各阶段的最优策略,进而得到最优策略。由表1可知。在年初无库存的情况下,四个月的最小费用f1(0)为229.8万元。且第一阶段的最优决策u1=10台,第一阶段末即第二阶段初的最优库存x2=4台。根据x2=4台查表3可知,第二阶段的最优决策u2=10台,因此库存x3=7台。根据x3=7台,查表2得,第三阶段的最优决策u3=5台,因此x4=0台,查表1得u4=6台。这样到最后一个月恰好无库存,即x5=0。综上所述,该生产与存储问题的最优化安排是:第1个月生产10台,费用为70万元;第2个月生产10台,费用为72.8万元;第3个月生产5台,费用为41.4万元;第4个月生产6台,费用为45.6万元。一至四月的生产与存储费用最小为229.8万元。 学习心得经过这次的学习对运筹学里的动态规划法有了一定的了解,获益良多。在解决生产与存储问题中的最优化安排进一步的了解动态规划在最优化问题中的作用。专心-专注-专业
限制150内