毕业论文浅谈动态规划的原理及其应用—动态规划在工业领域的应用.doc
《毕业论文浅谈动态规划的原理及其应用—动态规划在工业领域的应用.doc》由会员分享,可在线阅读,更多相关《毕业论文浅谈动态规划的原理及其应用—动态规划在工业领域的应用.doc(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、毕业论文毕业论文浅谈动态规划的原理及其应用浅谈动态规划的原理及其应用动态规划在工业领域的应用动态规划在工业领域的应用专业名称:数学与应用数学毕业论文I摘摘要要动态规划是运筹学的一个分支,它是解决多阶段决策过程最优化的一种数学方法。所谓“动态”,指的是在问题的多阶段决策中,按某一顺序,根据每一步所选决策的不同,将随即引起状态的转移,最终在变化的状态中产生一个决策序列。动态规划就是为了使产生的决策序列在符合某种条件下达到最优。动态规划的方法,在工程技术、企业管理、工农业生产及军事等部门中都有广泛的应用,并且获得了显著的效果。在企业管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问
2、题、库存问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等,所以它是现代管理中的一种重要的决策方法。它的应用也越来越受人重视。本文主要运用动态规划的思想设计出有效的数学模型来解决生产领域中遇到的一些问题,对资源进行优化配置,并规划出最优或可行方案。本文首先对“动态规划”的理论基础进行了讨论。给出了动态规划的基本理论和基本方程,其次给出了最优性定理,并加以证明,最后以工业中最典型的两个问题为例,阐述了动态规划思想基本原理的应用。关键词动态规划;最优性原理;生产计划;设备更新;毕业论文IIABSTRACTThe dynamic programming is a branch that
3、 it is multi-stagedecision-making process of solving a mathematical optimization method.The so-called dynamic refers to the multi-stage in the decision-making,according to a particular sequence,every step of the decision-making choice,the state will immediately cause the transfer of the final change
4、s in the statehave a decision-making sequence.Dynamic programming is to make thedecision,subject to certain conditions,the optimal sequence.DynamicProgramming methods in engineering technology,enterprise management,industrial and agricultural production and have a wide range of sectors suchas milita
5、ry applications.and the effect was remarkable.In businessmanagement,dynamic programming can be used to solve the optimal path,resource allocation,production scheduling,inventory loading,scheduling,and the upgrading of equipment,optimal control problems in the productionprocess.So it is an important
6、decision in modern management methods.Ithas been increasing emphasis on the application.In this paper,dynamic programming,the design of effective ideas tosolve the mathematical model produced some of the problems encounteredin the field.optimize the allocation of resources and planning the optimal o
7、roptions.This article of the dynamic planning theoretical basis for thediscussion.Given the basic theory and the dynamic programming equation,followed by the optimal theorem and prove it.Finally,the two industriesmost typical example to explain the basic tenets of the DynamicProgramming.KeywordsDyna
8、mic programming;Optimal principle;Productionplanning;Updating equipment;大学毕业论文III目目录录一、引言1二、动 态 规 划 的 基 本 概 念 和 基 本 方 程 1(一)基 本 特 征 1(二)基 本 概 念 2(三)基 本 思 想 3(四)动态规划模型的分类及方法3(五)动态规划的优缺点5三、动 态 规 划 的 最 优 性 原 理 和 最 优 性 定 理 6(一)最优性原理的概念及证明6(二)动态规划的无后效性原理7四、动 态 规 划 在 工 业 中 的 应 用 8(一)生产计划问题(production plan
9、ning problem)8(二)设备更新问题(equipment replacing problem)11五、结论18参 考 文献20河北经贸大学毕业论文1浅谈动态规划的原理及其应用动态规划在工业领域的应用一、引言动 态 规 划 大 约 产 生 于 50 年 代。1951 年 美 国 数 学 家 贝 尔 曼(R.Bellman)等人,根据一类多阶段决策问题的特点,然后逐个加以解决。与此同时,他提出了解决这类问题的“最优性原理”,研究了许多实际问题,从而创建了解决最优化问题的一种新的方法动态规划。许多问题用动态规划的方法去处理,常比线性规划或非线性规划更有成效。特别对于离散性问题,由于解析数学
10、无法施展其术,而动态规划的方法就成为非常有用的工具。应指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而它不像线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体的分析处理。因此在解题时应以丰富的想象力去建立模型,用创造性的技巧去求解。二、动态规划的基本概念和基本方程(一)基本特征动态规划问题具有以下基本特征:1、问题具有多阶段决策的特征。阶段可以按时间划分,也可以按空间划分。2、每一阶段都有相应的“状态”与之对应,描述状态的量称为“状态变量”。3、每一阶段都面临一个决策,选择不同的决策将会导致下一阶段不同
11、的状态,同时,不同的决策将会导致这一阶段不同的目标函数值。4、每一阶段的最优解问题可以递归地归结为下一阶段各个可能状态的最优解问题,各子问题与原问题具有完全相同的结构。能否构造这样的递推归结,是解决动态规划问题的关键。这种递推归结的过程,称河北经贸大学毕业论文2为“不变嵌入”。为了将以上特征形式化,我们提出以下动态规划的基本概念。(二)基本概念1阶段:把所给问题的过程,恰当的分成几个相互联系的有顺序的环节,这些环节即称为阶段。描述阶段的变量成为阶段变量,常用 k表示。阶段的划分一般是根据时间和空间的自然特征来划分。2.状态:即每个阶段开始所处的自然状态或客观条件,他描述了研究问题过程的状况,又
12、称不可控因素。用ks表示第 k 阶段的状态变量。这里所说的状态应具有无后效性(即马尔科夫性)。3.决策:决策是当过程处于某阶段的某个状态时可做出的选择或决定。决策变量可用)(kksu表示,ku表示第 k 阶段当状态处于ks时的决策变量。在实际问题中,决策变量的取值往往限制在某一范围之内,此范围称为允许决策集合。常用)(kksD表示第 k 阶段从状态ks出发的允许策略集合。有)()(kkkksDsu.4.策略:策略是一个按顺序排列的决策组成的集合。由每段的决策按顺序排列组成的决策函数序列)(,),(nnkksusu成为 k 字过程策略,简称子策略,即为,()k nkps.即)(,),(),()(
13、11,nnkkkkknksusususp当 k=1时,此 决 策 函 数 序 列 成 为 全 过 程 的 一 个 策 略,简 称 策 略,记)(,),(),()(22111,1nnnsusususp。5.状态转移方程:此方程是确定过程由一状态到另一状态的演变过程。若给定第 k 阶段状态变量ks的值,如果该阶段的决策变量ku一经确定,第 k+1 阶段的状态变量1ks的值也就确定,即1ks的值随ks和ku的值变化而变化。用方程式表示为),(1kkkusFs,它描述了由 k 阶段到k+1 阶段的状态转移规律。6.指标函数和最优指标函数:指标函数包括阶段的指标函数和过程的指标函数。阶段指标函数指对应某
14、一阶段和从该阶段出发的一个阶段决策的某种效益量,用),(kkkusV表示。过程指标函数指从状态ks出发至过程最终,当采取某种子策略时,按预定标准得到的效益值。这个值河北经贸大学毕业论文3既与ks的状态值有关,又与ks以后所选策略有关,它是两者的函数值),(11,nnkkkknkusususV。最优指标函数,指对某一确定状态选取最优策略后得到的指标函数值,也是对应某一最优子策略的效益值nkkkOPTVsf,)(。(三)基本思想1.动态规划方法的关键在于正确写出基本的递推关系式和恰当的边界条件,即从边界条件开始逐段递推寻优,在每个子问题求解中均利用了它前面子问题的最优化结果,依次进行,最后一个子问
15、题所得的最优解就是整个问题的最优解。2.决策过程中,动态规划方法是把当前段和未来各段分开,同时又把当前效益与未来效益结合起来考虑的最优化方法,因此每段决策是从全局考虑的,与各段的最优选择答案一般不同。3.在求整个问题的最优策略时,由于初始状态已知,而每段的决策都是该段状态的函数,故最优策略所经过的各段状态便可逐次变换得到,从而确定了最优策略。(四)动态规划模型的分类及方法根据多阶段决策过程的时间变量是离散的还是连续的变量,过程分为离散决策过程和连续决策过程。根据决策过程的演变是确定性的还是随机性的,过程又可分为确定性决策过程和随机性决策过程。组合起来就有离散确定性、离散随机性、连续确定性、连续
16、随机性四种决策过程模型。动态规划的方法:动态规划方法有逆序解法和顺序解法之分,那么,他们的动态规划基本方程应如下表述:设指标函数是取各阶段指标的和的形式,既,(,)nk niiii kVV s u河北经贸大学毕业论文4其中),(iiiusV表示第 i 阶段的指标。他显然是满足指标函数三个性质的。所以上式可写成,),(11,1,nknkkkknkssVusvV。当初始状态给定时,过程的策略就被确定,则指标函数就被确定了。因此,指标函数最初状态和策略的函数,可记为)(,knkknksPsV故上面递推关系又可写为,1,11,(,),k nkk nkkkknkknVspv s uVsp其子策略有决策)
17、(,knksp可看成是由决策)(kksu和)(1,1knksp组合而成。即,1,1(),()k nkkknkpusps如果用)(,knksp表示初始状态为ks的后部子过程所有子策略中的最优子策略。则最优值函数为,,*,.,(),(),()k nkkk nkk nkk nkk nkpfsVsPsoptVsps而),(),(),(,11,1,1,nkknkkkkpunkknkppsVusVoptpsVoptnkknk但),()(,11,111,1nkknkpkkpsVoptsfnk所以)(),()(11)(kkkkksDukksfusVoptsfkk1,1,nnk边界条件为11()0nnfs。上述
18、即为动态规划逆序解法的基本方程,根据边界条件,从nk 开始,由后向前逆推,从而逐步可求得各段的最优决策和相应的最优值,最后求出)(11sf时,即得到整个问题的最优解。动态规划顺序解法的基本方程:假定阶段序数 k 和状态变量ks的定义不变,而改变决策变量ku的定义,如取kkkssu)(1,这时的状态转移不是由kkus,去确定1ks,而反过来由kkus,1去确定ks,则状态转移方程一般形式为河北经贸大学毕业论文5),(1kkrkkusTs因而第 k 阶段的允许决策集合也应作相应的改变,记为)(1krksD。指标函数也应换成以1ks和ku的函数表示。于是可得动态规划顺序解法的基本方程为)(),()(
19、11)(111kkkkksDukksfusVoptsfkrkknk,2,1边界条件为0)(10sf式中),(1kkrkkusTs。其求解过程,根据边界条件,从1k开始,由前向后顺推,逐步可求得各段的最优决策和相应的最优值,最后求出)(1nnsf时,就得到整个问题的最优解。(五)动态规划的优缺点与穷举法相比,动态规划的方法有两个明显的优点:(1)大大减少了计算量(2)丰富了计算结果动态规划的最优化概念是在一定条件下,找到一种途径,在对各阶段的效益经过按问题具体性质所确定的运算以后,使得全过程的总效益达到最优。应用动态规划要注意阶段的划分是关键,必须依据题意分析,寻求合理的划分阶段(子问题)方法。
20、而每个子问题是一个比原问题简单得多的优化问题。而且每个子问题的求解中,均利用它的一个后部子问题的最优化结果,直到最后一个子问题所得最优解,它就是原问题的最优解。动态规划方法也有不足之处:到目前为止,还没有一个统一的标准模型可以应用。由于实际问题不同,其动态规划模型就有差异,虽然理论上说可以把某些静态规划的问题转化为动态规划模型来求解,但这种转化优势变得非常困难,需要丰富的想象力和灵活的技巧性。应用的局限性。由于构造静态规划模型时,状态变量必须满足“无后效性”条件,这条件不仅依赖于状态转移规律,还依赖于允许决策集河北经贸大学毕业论文6合和指标函数的结构是一个相当强的条件。不少实际问题在取其自然特
21、征作为状态变量往往不能满足这条件,这就降低了动态规划的通用性。在数值求解时,存在“维数障碍”,在内存限制下,超过三维的动态规划通常是不可取的。对一个实际问题建立动态规划模型时,必须做到下面五点:(一)将问题过程化成适当的阶段;(二)正确选择变量ks,使他既能描述过程的演变,又要满足无后效性;(三)确定决策变量ku及每阶段的允许决策集合)(kksD;(四)正确写出状态转移方程;(五)正确写出指标函数nkV,的关系,他应满足下面三个性质:是定义在全过程和所有后部子过程上的数量函数;要具有可分离性,并满足递推关系,即),(,),(111,11,nkknkkkknkknksusVussksV函数),(
22、,1 nkkkkVus对于变量nkV,1要严格单调。以上五点是构造动态规划模型的基础,是正确写出动态规划基本方程的基本要素。三、动态规划的最优性原理和无后效性(一)最优性原理的概念及证明动态规划的最优性原理可描述为:作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略.简言之,一个最优策略的子策略总是最优的。最优性原理:设阶段数为 n 的多阶段决策过程,其阶段编号为1,1,0nk。河北经贸大学毕业论文7允许策略*0,101(,)nnpu uu是最优策略的充要条件,对任何一个 k,0kn-1 和0s0S有0,100,1*0,
23、100,10,10,1()()(,)(,)()knknnks npspfVspoptVsoptV0,k-1k,n-10,k-1k,n-1pppp式中1,11,1*111,1,1*11,.1,11,11(,),()(,)()(),()(),()(,)()0knkKkkkkkkniiii kk nkkknkkkk nkk nkknkknpnnsTsusTsuV s upuspsfsVsPsoptVspfs0,n-10,k-1k,n-1ppp,它是由给定的初始状态0s和子策略1,0kp所确定的 k 段状态。当 V 是效益函数时,opt 取max;当 V 是损失函数时,opt 取 min。推论:若允许
24、策略*0,1np是最优策略,则对任意的 k,0kn-1,它的子策略*,1k np对于*111(,)kkkksTsu为起点的 k 到 n-1 子过程来说必是最优策略(注意:k 段状态*ks是由0s和*0,1kp确定的)。上述定理是动态规划的理论基础。(二)动态规划的无后效性原则所谓无后效性原则,指的是这样一种性质:某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。具体地说,如果一个问题被划分各个阶段之后,阶段 I 中的状态只能由阶段 I+1 中的状态通过状态转移方
25、程得来,与其他状态没有关系,特别是与未发生的状态没有关河北经贸大学毕业论文8系,这就是无后效性。四、动态规划在工业中的应用(一)生产计划问题(production planning problem)对于一类生产计划问题,阶段按计划时间自然划分,状态定义为每阶段开始时的储存量ks,决策为每阶段的产量kx,即每个阶段的需求量(已知量)为kd,则状态转移方程为kkkkdxss1,0,1,2,kskn设每阶段开工的固定成本费为 a,生产单位数量产品的成本费为 b,每阶段单位数量产品的储存费为 c,阶段指标为阶段成本和储存费之和,即0,0,0,),(kkkkkkkuubuacxxsv指标函数nkV,为k
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 浅谈 动态 规划 原理 及其 应用 工业 领域
限制150内