第05章动态规划课件.pptx
《第05章动态规划课件.pptx》由会员分享,可在线阅读,更多相关《第05章动态规划课件.pptx(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、系统工程主讲人:第一PPT 联系方式:186 XXXX XXX高新学院高新学院 enter school name enter school name22:53第05章 动态规划 第第5章章 动态规划动态规划5.1 多阶段决策过程及实例5.2 动态规划的基本概念和基本方程5.3 动态规划的最优性原理和最优性定理5.4 动态规划和静态规划的关系22:53第05章 动态规划【知识点聚焦】【知识点聚焦】 本章主要介绍动态规划的状态转移方程状态转移方程、指标函数指标函数、最优值函数最优值函数、最优策略最优策略、最优轨线最优轨线等基本知识。重点要求学生掌握动态规划的顺序解法、逆序解法顺序解法、逆序解法;
2、最后,介绍最短路线、资源分配、生产计划、货物存储、可靠性问题、背包问题、推销最短路线、资源分配、生产计划、货物存储、可靠性问题、背包问题、推销商问题及其解法商问题及其解法等。并且简介多维动态规划降维方法多维动态规划降维方法、减少离散状态点数方法减少离散状态点数方法及随机性问题的动态规划求解方法随机性问题的动态规划求解方法。5.1 多阶段决策过程及实例 多目标问题最早是Franklin在1772年提出来的,1938年Cournot提出了多目标问题的经济学模型,1896年Pareto首次从数学的角度提出多目标最优化问题。当今,多目标规划也受到了人们的普遍重视。 在工农业生产中,常常需要考虑某些限制
3、条件下,多个目标的最优化问题。下面举例说明:22:53第05章 动态规划5.1 多阶段决策过程及实例多阶段决策:多阶段决策:将决策的全过程依据时间或空间划分为若干个互相联系的阶段;并做出方案的选择,称之为多阶段阶段决策决策。策略:策略:各个阶段所确定的决策就构成一个决策序列,常称之为策略策略。策略集合:策略集合:许多可供选择的策略集合,称之为允许策略集合允许策略集合(简称策略集合策略集合)。最优策略最优策略:在允许策略集合中,选择一个策略,使预定的目标达到最好的效果。称为最优策略最优策略。这类问题就称为多阶段决策问题多阶段决策问题。在多阶段决策问题中,各个阶段采取的决策一般来说是与时间有关的,
4、故有“动态动态”的含义,因此把处理这类问题的方法称为动态规划方法动态规划方法。但有一些与时间因素没有关系的所谓“静态问题静态问题”。只要人为地引进“时间时间”因素,也可以把它视为多阶段决策多阶段决策问题,而用动态规划方法去处理。22:53第05章 动态规划举例举例【例5-1】最短路径问题。图5-1中是一个城市分布地图,图中每个顶点代表一个城市,两个城市间的连线代表道路,连线上的数值代表道路的长度。现在,想从城市A到达城市E,怎样走路程最短,最短路程的长度是多少?图5-1 最短路径问题22:53第05章 动态规划【分析】把从A到E的全过程分成四个阶段,用k表示阶段变量,第1阶段有一个初始状态A,
5、两条可供选择的支路ABl、AB2;第2阶段有两个初始状态B1、B2,B1有三条可供选择的支路,B2有两条可供选择的支路。用 表示在第k阶段由初始状态 到下阶段的初始状态 的路径距离, 表示从第k阶段的 到终点E的最短距离,利用倒推方法求解A到E的最短距离。具体计算过程如下:8=min8,10=F4(d2)+D2)d3(C1,F4(D1),+D1)mind3(C1,=F3(C1):,3=K:S2有6=3+3=f4(D3)+D3)d3(C4,=F3(C4)11=3+8=f4(D3)+D3)d3(C3,=F3(C3)8=3+5=f4(D1)+D1)d3(C2,=F3(C2)3=F4(D3),4=F4
6、(D2),3=F4(D1):,有4=K:S122:53第05章 动态规划因此由A点到E点的全过程的最短路径为AB2C4D3E。最短路程长度为13。(4-1)9=4min9,12,1= F3(C3)+C3)d2(B1,f3(C2),+C2)d2(B1,F3(C1),+C1)mind2(B1,=F2(B1),有2=K:S213=min13,13=F2(B2)+B2)d1(A,F2(B1),+B1)mind1(A,=F1(A) :有1=k:S410=min16,10=F3(C4)+C4)d2(B2,f3(C2),+c2)mind2(B2,=F2(m),22:53第05章 动态规划因此由A点到E点的全
7、过程的最短路径为AB2C4D3E。最短路程长度为13。(4-1)9=4min9,12,1= F3(C3)+C3)d2(B1,f3(C2),+C2)d2(B1,F3(C1),+C1)mind2(B1,=F2(B1),有2=K:S213=min13,13=F2(B2)+B2)d1(A,F2(B1),+B1)mind1(A,=F1(A) :有1=k:S410=min16,10=F3(C4)+C4)d2(B2,f3(C2),+c2)mind2(B2,=F2(m),22:535.2动态规划的基本概念和基本方程5.2.1动态规划的基本概念第05章 动态规划 (1)阶段和阶段变量用动态规划求解一个问题时,需
8、要将问题的全过程恰当地划分成若干个相互联系的阶段,以便按一定的次序去求解。描述阶段的变量称为阶段变量,通常用K表示。阶段的划分一般是根据时间和空间的自然特征来定的,一般要便于把问题转化成多阶段决策的过程。22:5322:53 (2)状态和状态变量某一阶段的出发位置称为状态,通常一个阶段包含若干状态。状态通过一个变量来描述,这个变量称为状态变量。状态表示的是事物的性质。(3)决策、决策变量对问题的处理中做出某种选择性的行动就是决策。一个实际问题可能要有多次决策和多个决策点,在每一个阶段中都需要有一次决策。决策也可以用一个变量来描述,称为决策变量。在实际问题中,决策变量的取值往往限制在某一个范围之
9、内,此范围称为允许决策集合。第05章 动态规划22:53 (4)策略和最优策略所有阶段依次排列构成问题的全过程。全过程中各阶段决策变量所组成的有序总体称为策略。在实际问题中,从决策允许集合中找出最优效果的策略称为最优策略。(5)状态转移方程前一阶段的终点就是后一阶段的起点,前一阶段的决策变量就是后一阶段的状态变量,这种关系描述了由K阶段到K+1阶段状态的演变规律,是关于两个相邻阶段状态的方程,称为状态转移方程,是动态规划的核心。(6)指标函数和最优化概念用来衡量多阶段决策过程优劣的一种数量指标,称为指标函数。它应该在全过程和所有子过程中有定义、并且可度量。指标函数的最优值,称为最优值函数。第0
10、5章 动态规划22:53 1)动态规划的基本思想动态规划是一类解决多阶段决策问题的数学方法一类解决多阶段决策问题的数学方法。在工程技术、科学管理、工农业生产及军事等领域都有广泛的应用。在理论上,动态规划是求解这类问题全局最优解的一种有效方法,特别是对于实际中的某些非线性规划问题可能是最优解的唯一方法。然而,动态规划仅仅是解决多阶段决策问题的一种方法或者说是考动态规划仅仅是解决多阶段决策问题的一种方法或者说是考察问题的一种途径,而不是一种具体的算法察问题的一种途径,而不是一种具体的算法。就目前而言,动态规划没有统一的标准模型,其解法也没有标准算法,在实际应用中,需要具体问题具体分析。动态规划模型
11、的求解是影响动态规划理论和方法应用的关键问题所在,而子问题的求解和大量结果的存储、调用更是一个难点所在。然而,随着计算技术的快速发展,特别是内存容量和计算速度的增加,使求解较小规模的动态规划问题成为可能,从而使得动态规划的理论和方法在实际中的应用更加广泛。 5.2.2动态规划的基本思想和基本方程第05章 动态规划22:53 2)动态规划步骤动态规划算法的关键在于正确地写出基本的递推关系式和恰当的边界条件(简称基本方程)。要做到这一点,就必须将问题的过程分成几个相互联系的阶段,恰当的选取状态变量和决策变量及定义最优值函数,从而把一个大问题转化成一组同类型的子问题,然后逐个求解。即从边界条件开始,
12、逐步递推寻优,在每一个子问题的求解中,均利用了它前面的子问题的最优化结果,依次进行,最后一个子问题所得的最优解就是整个问题的最优解。第05章 动态规划22:53 3)动态规划的基本方程最短路问题例:给定一个线路网络,如图5-2所示,两点之间连线上的数字表示两点间的距离(或费用),试求一条由A到G的铺管路线,使总距离为最短(或总费用为最小)。图5-2铺管线路图第05章 动态规划22:53 最短路线有一个重要特征:如果由起点A经过P点和H点而到达终点G是一条最短路线,则由点P出发经过H点到达终点G的这条子路线,对于从点P出发到达终点的所有可能选择的不同路线来说,必定也是最短路线。例如,在最短路线问
13、题中,若找到了AB1C2D1E2F2G是由A到G的最短路线,则D1E2F2G应该是由D出发到G点的所有可能选择的不同路线中的最短路线。第05章 动态规划22:53 证明:(反证法) 如果不是这样,则从点P到G点有另一条距离更短的路线存在,把它和原来最短路线由A点到达P点的那部分连接起来,就会得到一条由A点到G点的新路线,它比原来那条最短路线的距离还要短些。这与假设矛盾,是不可能的。根据最短路线这一特性,寻找最短路线的方法就是从最后一段开始,用由后向前逐步递推的方法,求出各点到G点的最短路线,最后求得由A点到G点的最短路线。所以,动态规划的方法是从终点逐段向始点方向寻找最短路线。动态规划的方法是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第05章 动态规划课件 05 动态 规划 课件
限制150内