第七章动态规划精选文档.ppt
《第七章动态规划精选文档.ppt》由会员分享,可在线阅读,更多相关《第七章动态规划精选文档.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章动态规划第七章动态规划本讲稿第一页,共六十一页Chapter 7 动态规划动态规划(Dynamic ProgrammingDynamic Programming)多阶段决策问题多阶段决策问题动态规划的基本概念动态规划的基本概念动态规划的求解步骤动态规划的求解步骤动态规划模型的建立动态规划模型的建立运用动态规划求解实际问题运用动态规划求解实际问题本章主要内容:本章主要内容:本章主要内容:本章主要内容:本讲稿第二页,共六十一页引言引言动态规划作为运筹学的一个重要分支是解决多阶段决策动态规划作为运筹学的一个重要分支是解决多阶段决策过程最优化的一种非常有效的方法。过程最优化的一种非常有效的方法。
2、1951年,美国数学家贝年,美国数学家贝尔曼(尔曼(R.Bellman)等人,根据一类多阶段决策问题的特)等人,根据一类多阶段决策问题的特点,把多阶段决策问题变换为一系列相互联系的单阶段决策点,把多阶段决策问题变换为一系列相互联系的单阶段决策问题,然后分阶段逐个加以解决。贝尔曼等人在研究和解决问题,然后分阶段逐个加以解决。贝尔曼等人在研究和解决了大量实际问题之后,提出了解决这类问题的了大量实际问题之后,提出了解决这类问题的所谓所谓“最最优性原理优性原理”,通常称为,通常称为“贝尔曼最优化原理贝尔曼最优化原理”,从而创建了,从而创建了解决最优化问题的一种新的方法解决最优化问题的一种新的方法 动态
3、规划动态规划(Dynamic Programming )。)。贝尔曼的名著动态规划贝尔曼的名著动态规划于于1957年出版,这成了动态规划的第一本著作。年出版,这成了动态规划的第一本著作。本讲稿第三页,共六十一页引言引言动态规划的方法,在工程技术、企业管理、工农业生产动态规划的方法,在工程技术、企业管理、工农业生产及军事等部门中有着广泛的应用,并且获得了显著的效果。及军事等部门中有着广泛的应用,并且获得了显著的效果。在经济管理方面,动态规划可以用来解决最优路径问题、资在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存问题、装载问题、排序问源分配问题、生产调度问题、
4、库存问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等,它是现代题、设备更新问题、生产过程最优控制问题等等,它是现代企业管理中的一种重要的决策方法。企业管理中的一种重要的决策方法。许多实际问题采用动态规划方法去处理,常比线性规划许多实际问题采用动态规划方法去处理,常比线性规划或非线性规划更加有效。特别对于离散性的问题,由于解析或非线性规划更加有效。特别对于离散性的问题,由于解析数学无法施展其术,而动态规划的方法就成为一种非常有效数学无法施展其术,而动态规划的方法就成为一种非常有效的工具。的工具。本讲稿第四页,共六十一页引言引言应特别指出的是,动态规划是解决某一类问题的一种方应特别
5、指出的是,动态规划是解决某一类问题的一种方法,是分析问题的一种途径,而不是一种特殊算法(如线性法,是分析问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习动态规划时,除了对基本概行具体分析处理。因此,在学习动态规划时,除了对基本概念和方法正确地理解外,应以丰富的想象力去建立模型,用念和方法正确地理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。正如贝尔曼本人所说
6、:创造性的技巧去求解。正如贝尔曼本人所说:“由于动态规由于动态规划的最优化原理仅仅是一种基本原理,正是它的某种不确定划的最优化原理仅仅是一种基本原理,正是它的某种不确定性为你提供了发挥你创造性思维的巨大空间性为你提供了发挥你创造性思维的巨大空间!本章我们在学习动态规划基本概念、理论和方法的基础本章我们在学习动态规划基本概念、理论和方法的基础上,在通过一些典型的应用问题来说明它的应用。上,在通过一些典型的应用问题来说明它的应用。本讲稿第五页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法多阶段决策过程多阶段决策过程整个决策过程可按时间或空间顺序分解成若干相互联系整个决策过程可
7、按时间或空间顺序分解成若干相互联系的阶段,每一阶段都需作出决策,全部过程的决策是一个决的阶段,每一阶段都需作出决策,全部过程的决策是一个决策序列。策序列。多阶段决策过程最优化的目标:多阶段决策过程最优化的目标:达到整个活动过程的达到整个活动过程的总体总体效果最优,而非各效果最优,而非各单个单个阶段最阶段最优的简单总和。优的简单总和。请看如下典型案例请看如下典型案例最短路线问题最短路线问题本讲稿第六页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法B1AC3F2F1E3E2E1D3D2D1C4C2C1B2G第一阶段第一阶段第二阶段第二阶段第三阶段第三阶段第四阶段第四阶段第五阶
8、段第五阶段第六阶段第六阶段531368766835342138223335526643437597681310912131618该点到G点的最短距离本讲稿第七页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法动态规划方法的基本术语:动态规划方法的基本术语:1、阶段和阶段变量阶段和阶段变量对整个决策过程的自然划分,通常根据对整个决策过程的自然划分,通常根据时间顺序或空间特征时间顺序或空间特征来划分阶段,以便按阶段的次序逐段解决整个过程的优化问题。来划分阶段,以便按阶段的次序逐段解决整个过程的优化问题。阶段变量通常用阶段变量通常用k表示(表示(k=1,2,3,n)。)。2、状态
9、与状态变量状态与状态变量每个阶段开始时过程所处的自然状况或客观条件成为该阶段每个阶段开始时过程所处的自然状况或客观条件成为该阶段的状态。每个阶段的初始状况又是前一个阶段的终止状况(第的状态。每个阶段的初始状况又是前一个阶段的终止状况(第一阶段除外)。因此,一旦各个阶段的状态确定之后,整个过一阶段除外)。因此,一旦各个阶段的状态确定之后,整个过程也完全确定。从这个意义上说,多阶段决策过程也是各个状程也完全确定。从这个意义上说,多阶段决策过程也是各个状态的演变过程。态的演变过程。本讲稿第八页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法状态具有状态具有“无后效性无后效性”,即
10、当前阶段状态给定时,这个,即当前阶段状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关。阶段以后过程的演变与该阶段以前各阶段的状态无关。一般把描述阶段状态的变量称为状态变量。通常用一般把描述阶段状态的变量称为状态变量。通常用sk表表示第示第k阶段的状态。第阶段的状态。第k阶段状态变量的允许取值范围称为阶阶段状态变量的允许取值范围称为阶段段k的状态集合。记作的状态集合。记作 Sk。3、决策与决策变量决策与决策变量当一个阶段的状态确定后,可以作出不同的当一个阶段的状态确定后,可以作出不同的决定或选择决定或选择,从而演变到下一阶段的某个状态,这种决定或选择称为决策。从而演变到下一阶段的某
11、个状态,这种决定或选择称为决策。描述决策的变量称为决策变量,通常用描述决策的变量称为决策变量,通常用uk表示,前面已经说表示,前面已经说过,决策要依据该阶段的状态,因此通常用过,决策要依据该阶段的状态,因此通常用uk(sk)表示第表示第k阶阶段处于状态段处于状态sk时的决策。决策变量的取值范围称为决策集合时的决策。决策变量的取值范围称为决策集合,表示为,表示为Dk(sk)。本讲稿第九页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法4、策略与子策略策略与子策略一组有序的一组有序的决策序列决策序列构成一个策略,从第构成一个策略,从第k阶段至第阶段至第n阶段的阶段的一个策略称为
12、后部子策略记为一个策略称为后部子策略记为 pk,n(uk,uk+1,un)。)。5、状态转移方程状态转移方程 在确定型多阶段决策过程中,一旦某阶段的状态和决策为已在确定型多阶段决策过程中,一旦某阶段的状态和决策为已知,下一阶段的状态便完全确定,用状态转移方程反映这种状知,下一阶段的状态便完全确定,用状态转移方程反映这种状态间的态间的演变规律演变规律,写作:,写作:(7.1)本讲稿第十页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法6、指标函数指标函数 衡量决策效果优劣的数量指标称为指标函数,具体可以是收衡量决策效果优劣的数量指标称为指标函数,具体可以是收益、成本、距离等指
13、标,可以分为益、成本、距离等指标,可以分为k阶段指标函数,子过程指标阶段指标函数,子过程指标函数和最优指标函数。函数和最优指标函数。从从k阶段状态阶段状态sk出发,做出决策出发,做出决策uk所所产生的第产生的第k阶段指标称为阶段指标称为k阶段指标函数,记为阶段指标函数,记为vk(sk,uk)。从。从k阶段状态阶段状态sk出发,选择决策出发,选择决策uk,uk+1,un所产生的过程指标,称为所产生的过程指标,称为k子过程指标函数或子过程指标函数或简记为过程指标函数,记为简记为过程指标函数,记为Vk(sk,uk,uk+1,un)或或Vk,n。从。从k阶段阶段状态状态sk出发,对所有的子策略,最优的
14、过程指标函数称为最优出发,对所有的子策略,最优的过程指标函数称为最优指标函数,记为指标函数,记为fk(sk),通常取,通常取Vk的最大值或最小值。的最大值或最小值。本讲稿第十一页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法通常要求动态规划的子过程指标满足递推关系通常要求动态规划的子过程指标满足递推关系常用的有连加和连乘的形式,分别为常用的有连加和连乘的形式,分别为(7.2)(7.3)本讲稿第十二页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法最有指标函数最有指标函数fk(sk)取式(取式(7.2)和()和(7.3)的最优值,分别为:)的最优值,分别
15、为:式(式(7.4)和()和(7.5)称为)称为动态规划的基本方程动态规划的基本方程。为了使递推方程。为了使递推方程有递推起点,需要确定最后一个状态有递推起点,需要确定最后一个状态sn的最优指标函数的最优指标函数fn(sn)的的值,称为值,称为终端条件终端条件。一般情况下,连和形式。一般情况下,连和形式fn(sn)=0,连乘形式,连乘形式fn(sn)=1。动态规划的数学模型由式动态规划的数学模型由式(8.4)或或(8.5),边界条件及状态转移,边界条件及状态转移方程构成,如连加形式的数学模型为:方程构成,如连加形式的数学模型为:(7.4)(7.5)本讲稿第十三页,共六十一页动态规划的基本概念和
16、基本方法动态规划的基本概念和基本方法由式由式(7.4)和使和使(7.5)的形式知,计算顺序是从最后一个阶段开始的形式知,计算顺序是从最后一个阶段开始到第一个阶段结束,这种方法称为到第一个阶段结束,这种方法称为逆序算法逆序算法。也可以将基本方程改。也可以将基本方程改为前向递推:为前向递推:这时计算顺序是从第一阶段开始到最后一个阶段结束,这种算法称为这时计算顺序是从第一阶段开始到最后一个阶段结束,这种算法称为顺序算法顺序算法。本讲稿第十四页,共六十一页动态规划的基本概念和基本方法动态规划的基本概念和基本方法总结总结在明确了动态规划的基本概念和基本思想之后,在解决一个在明确了动态规划的基本概念和基本
17、思想之后,在解决一个实际问题建立动态规划模型时,步骤如下:实际问题建立动态规划模型时,步骤如下:(1)将问题的过程划分为恰当的阶段;)将问题的过程划分为恰当的阶段;(2)正确选择状态变量)正确选择状态变量sk,使它既能描述过程的演变,又,使它既能描述过程的演变,又能满足无后效性;能满足无后效性;(3)正确写出决策变量)正确写出决策变量uk及每阶段的允许决策集合及每阶段的允许决策集合Dk(sk);(4)正确写出状态转移方程;)正确写出状态转移方程;(5)正确写出指标函数)正确写出指标函数Vk,n的关系,它满足下面三个性质:的关系,它满足下面三个性质:本讲稿第十五页,共六十一页动态规划的基本概念和
18、基本方法动态规划的基本概念和基本方法是定义在全过程和所有后部子过程上的数量函数;是定义在全过程和所有后部子过程上的数量函数;具有可分离性,并满足递推关系。即:具有可分离性,并满足递推关系。即:函数函数 对于变量对于变量Vk+1,n要严格单要严格单调。调。以上五点是构造动态规划模型的基础,是正确写出动态规划以上五点是构造动态规划模型的基础,是正确写出动态规划基本方程的基本要素。而一个问题的动态规划模型是否正确给基本方程的基本要素。而一个问题的动态规划模型是否正确给出,它集中反映在恰当地定义最优值函数和正确写出递推关系出,它集中反映在恰当地定义最优值函数和正确写出递推关系式及边界条件。简而言之,要
19、正确写出动态规划的基本方程。式及边界条件。简而言之,要正确写出动态规划的基本方程。本讲稿第十六页,共六十一页动态规划举例动态规划举例下面我们举一个动态规划的实际例子。下面我们举一个动态规划的实际例子。例7.1(基建投资问题)一家公司有三个工厂,每个工厂都需要进行扩建。公司用于扩建的资金总额为7万元。各工厂的投资方案及扩建后预期可得到的利润如下表:现在公司要确定对各厂投资多少,才能使公司的总利润达到最大?厂名方案1方案2方案3方案4投资数利润投资数利润投资数利润投资数利润一厂二厂三厂0000001125372338911344101113本讲稿第十七页,共六十一页动态规划举例动态规划举例解解.(
20、1)划分阶段:我们把每个工厂获得投资作为一个阶段,)划分阶段:我们把每个工厂获得投资作为一个阶段,k=1,2,3。(2)选择状态变量:选取第)选择状态变量:选取第k阶段可用的资金总额作为状态阶段可用的资金总额作为状态变量,记为变量,记为sk。(3)确定决策变量:选择分配给阶段)确定决策变量:选择分配给阶段k的投资数作为决策变的投资数作为决策变量,记为量,记为uk,决策集合记为,决策集合记为Dk。(4)状态转移方程:)状态转移方程:sk+1=sk-uk(5)定义定义 fk(sk):第:第k阶段投资时可用的资金为阶段投资时可用的资金为sk,第,第k阶段阶段至第至第3阶段按阶段按最优投资策略最优投资
21、策略分配所余的资金,第分配所余的资金,第k阶段至第阶段至第3阶段阶段所创造的所创造的利润总和利润总和。本讲稿第十八页,共六十一页动态规划举例动态规划举例(6)建立动态规划基本方程:(逆序递推方程)建立动态规划基本方程:(逆序递推方程)(7)用逆序递推求解动态规划方程。)用逆序递推求解动态规划方程。k=3,状态集合,状态集合S3=0,1,2,3,4,5,6,7s301234567u3000,20,2,30,2,3,40,2,3,40,2,3,40,2,3,4v3(u3)000,70,7,110,7,11,130,7,11,130,7,11,130,7,11,13f3(u3)000,70,7,11
22、0,7,11,130,6,11,130,6,11,130,6,11,13u*300 2 3 4 4 4 4本讲稿第十九页,共六十一页动态规划举例动态规划举例k=2,状态集合,状态集合S2=0,1,2,3,4,5,6,7k=1时,状态集合时,状态集合S1=7s201234567u200,10,10,1,30,1,3,40,1,3,40,1,3,40,1,3,4v2(u2)00,30,30,3,90,3,9,110,3,9,110,3,9,110,3,9,11S301,02,13,2,04,3,1,05,4,2,16,5,3,27,6,4,3f300,07,011,7,013,11,0,013,1
23、3,7,013,13,11,713,13,13,11f2(u2)00,37,311,10,913,14,9,1113,16,16,1113,16,20,1813,16,20,24u*30 100 1 1 3 3 4s17u10,1,2,3v1(u1)0,5,8,10S27,6,5,4f224,20,16,14f1(u1)24,25,24,24u*1 1请问最优投资方案是请问最优投资方案是什么?采用顺序算法什么?采用顺序算法如何求解?如何求解?本讲稿第二十页,共六十一页动态规划应用举例动态规划应用举例例例7.2 生产与存储问题生产与存储问题 一个工厂生产的某种产品,在一定的时期一个工厂生产的某种
24、产品,在一定的时期内,增大生产批量,能够降低产品的单位成本,但若超过市场内,增大生产批量,能够降低产品的单位成本,但若超过市场的需求量,就会造成产品的挤压而增加存储的费用。因此如何的需求量,就会造成产品的挤压而增加存储的费用。因此如何正确地制定生产计划,使得在整个计划期内,生产和存储的总正确地制定生产计划,使得在整个计划期内,生产和存储的总费用最小,这就是生产与存储问题。举例如下:费用最小,这就是生产与存储问题。举例如下:假设某厂生产的一种产品,以后四个月的订单如下表所示。假设某厂生产的一种产品,以后四个月的订单如下表所示。合同规定月底前交货,生产每批产品的固定成本为合同规定月底前交货,生产每
25、批产品的固定成本为3千元,每批千元,每批生产的产品件数不限。每件产品的可变成本为生产的产品件数不限。每件产品的可变成本为1千元,每批产品千元,每批产品的最大生产生产能力为的最大生产生产能力为5件。产品每月的存储费为件。产品每月的存储费为0.5千元。设千元。设1月初有库存产品月初有库存产品1件,四月底不再留下产品。试在满足需要的前件,四月底不再留下产品。试在满足需要的前提下,如何组织生产才能使总的成本费用最低。提下,如何组织生产才能使总的成本费用最低。本讲稿第二十一页,共六十一页动态规划应用举例动态规划应用举例解解 按时间将问题的过程划分为按时间将问题的过程划分为4个阶段,即个阶段,即k=1,2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 章动 规划 精选 文档
限制150内