运筹学动态规划ppt课件.ppt
《运筹学动态规划ppt课件.ppt》由会员分享,可在线阅读,更多相关《运筹学动态规划ppt课件.ppt(191页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分动态规划2变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分引引 言言动态规划是解决动态规划是解决多阶段决策过程多阶段决策过程最优化的一种方法。最优化的一种方法。该方法是由美国数学家该方法是由美国数学家贝尔曼贝尔曼(R. E. Bellman)等人在)等人在20世世纪纪50年代初提出的。并成功地解决了生产管理、工程技术等方年代初提出的。并成功地解决了生产管理、工程技术等方面
2、的许多问题,从而建立了运筹学的一个新的分支,即动态规面的许多问题,从而建立了运筹学的一个新的分支,即动态规划。划。Bellman在在1957年出版了年出版了Dynamic Programming一一书,是动态规划领域中的第一本著作。书,是动态规划领域中的第一本著作。3变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分动态规划与其他规划方法的不同之处在于:动态规划与其他规划方法的不同之处在于: 动态规划是求解某类问题(动态规划是求解某类问题(多阶段决策问题多阶段决策问题)的一种方法,)的一种方法,是考察问题的一
3、种途径,而不是一种特定算法。是考察问题的一种途径,而不是一种特定算法。 因此,它不像线性规划那样有一个标准的数学表达式和明确因此,它不像线性规划那样有一个标准的数学表达式和明确定义的一组(算法)规则,而必须对具体问题进行具体分析处定义的一组(算法)规则,而必须对具体问题进行具体分析处理。因此,学习动态规划时,除对基本概念和基本方法正确理解理。因此,学习动态规划时,除对基本概念和基本方法正确理解外,还应在一定经验积累基础上,以丰富的想像力去建立模型,外,还应在一定经验积累基础上,以丰富的想像力去建立模型,用创造性的技巧去求解。用创造性的技巧去求解。4变电站电气主接线是指变电站的变压器、输电线路怎
4、样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分1 动态规划实例动态规划实例2 动态规划的基本概念动态规划的基本概念3 动态规划的基本思想与基本原理动态规划的基本思想与基本原理4 逆序解法与顺序解法逆序解法与顺序解法5变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分学习目标:学习目标:1 明确什么是明确什么是多阶段的决策问题多阶段的决策问题,特别要注意没有明显,特别要注意没有明显 的时段背景的问题如何化归为多阶段的决策问题。的时段背景的问题如何化归为多阶段的决策问题
5、。1 动态规划实例动态规划实例6变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分 例例 机器负荷分配问题(时间阶段问题)机器负荷分配问题(时间阶段问题)设有某种机器设备,用于完成两类工作设有某种机器设备,用于完成两类工作A和和B。若。若第第k年初完好年初完好机器的数量为机器的数量为 xk ,若以数量,若以数量 uk 用于用于A,余下的(,余下的(xkuk)用于)用于工作工作B,则该年的预期收入为,则该年的预期收入为 g( uk ) + h( xkuk )。这里。这里g( uk )和和 h( xkuk )是已
6、知函数,且是已知函数,且 g( 0 ) = h( 0 ) = 0。又机器设备在使用中会有损坏,设机器用于工作又机器设备在使用中会有损坏,设机器用于工作A时,一年后时,一年后能继续使用的完好机器数占年初投入量的能继续使用的完好机器数占年初投入量的70%;若用于工作;若用于工作B时,一年后能继续使用的完好机器数占年初投入量的时,一年后能继续使用的完好机器数占年初投入量的90%。则在。则在下一年初下一年初能继续用于能继续用于A、B工作的设备数为工作的设备数为 xk+1=0.7uk+0.9(xkuk)。设第设第1年初完好的机器总数为年初完好的机器总数为1000台,问在连续台,问在连续5年内每年应如年内
7、每年应如何分配用于何分配用于A、B两项工作的机器数,使两项工作的机器数,使5年的总收益为最大。年的总收益为最大。1 动态规划实例动态规划实例7变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分相应的问题称为相应的问题称为多阶段决策问题多阶段决策问题。这是一个这是一个多阶段决策过程多阶段决策过程。该过程可以分为相互联系的若干阶段,每一阶段都需作出决该过程可以分为相互联系的若干阶段,每一阶段都需作出决 策,从而形成全过程的决策。策,从而形成全过程的决策。第第1年年x1=1000u1第第2年年x2=0.7u1+ 0
8、.9(x1-u1)u2第第3年年x3=0.7u2+ 0.9(x2-u2)u3第第4年年u4第第5年年x5=0.7u4+ 0.9(x4-u4)u5x4=0.7u3+ 0.9(x3-u3)x6 例例 最短路线问题(空间阶段的例子)最短路线问题(空间阶段的例子) 设有一个旅行者从下图中的设有一个旅行者从下图中的A点出发,途中要经过点出发,途中要经过B、C、D等等处,最后到达终点处,最后到达终点E。从从A到到E有很多条路线可以选择有很多条路线可以选择,各点之间的距,各点之间的距离如图所示,问该旅行者应选择哪一条路线,使从离如图所示,问该旅行者应选择哪一条路线,使从A到达到达E的总的路程的总的路程为最短
9、。为最短。25375632455114633334C1C3D1AB1B3B2D2EC21234状态状态1决策决策1状态状态2状态状态3状态状态4状态状态5决策决策2决策决策3决策决策4可看成可看成 4阶段阶段 的决策的决策 问题。问题。9变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分从以上两个例子,可以知道从以上两个例子,可以知道 所谓所谓多阶段多阶段决策问题决策问题是指这样的决策问题:其过程可分为若是指这样的决策问题:其过程可分为若干个相互联系的阶段,每一阶段都对应着一组可供选择的决策,干个相互联系的阶
10、段,每一阶段都对应着一组可供选择的决策,每一决策的选定既依赖于当前面临的状态,又影响以后总体的效每一决策的选定既依赖于当前面临的状态,又影响以后总体的效果。果。 当每一阶段的决策选定以后,就构成一个决策序列,称为一当每一阶段的决策选定以后,就构成一个决策序列,称为一个个策略策略,它对应着一个确定的效果。它对应着一个确定的效果。多阶段决策问题就是寻找使多阶段决策问题就是寻找使此效果最好的策略。此效果最好的策略。10变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分多阶段决策过程的特点多阶段决策过程的特点1.各阶
11、段的决策相互关联各阶段的决策相互关联多阶段决策过程最优化的目的多阶段决策过程最优化的目的,是要达到整个活动过程的总体,是要达到整个活动过程的总体效果最优,而不是某个阶段效果最优,而不是某个阶段“局部局部”的效果最优。因此,的效果最优。因此,各个阶各个阶段段决策的选取不是任意确定的决策的选取不是任意确定的。前一个决策的选取决定了当前状态,当前状态进行决策后又影前一个决策的选取决定了当前状态,当前状态进行决策后又影响到下一阶段的状态和决策,以至于影响总体效果。所以决策者响到下一阶段的状态和决策,以至于影响总体效果。所以决策者在每个阶段决策时,不应仅考虑本阶段最优,还应考虑对最终目在每个阶段决策时,
12、不应仅考虑本阶段最优,还应考虑对最终目标的影响,从而做出对全局而言是最优的决策。标的影响,从而做出对全局而言是最优的决策。动态规划就是符合这一要求的一种最优化方法。动态规划就是符合这一要求的一种最优化方法。11变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分2.各个阶段的决策一般与各个阶段的决策一般与“时间时间”有关有关动态规划方法与动态规划方法与“时间时间”关系很密切,随着时间过程的发展而关系很密切,随着时间过程的发展而决决定各阶段的决策,从而产生一个决策序列,这就是定各阶段的决策,从而产生一个决策序列,
13、这就是“动态动态”的意的意思。思。但是,一些与时间无关的静态问题,只要在问题中但是,一些与时间无关的静态问题,只要在问题中人为引人为引入入“时间时间”因素因素,也可将其看成是多阶段的决策问题,用动态规,也可将其看成是多阶段的决策问题,用动态规划划方法去处理。方法去处理。12变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分学习目标:学习目标:1 准确、熟练地掌握动态规划的基本概念、特别是状态准确、熟练地掌握动态规划的基本概念、特别是状态 变量、决策变量、状态转移律、指标函数、基本方程变量、决策变量、状态转移律
14、、指标函数、基本方程 等。等。2 动态规划的基本概念动态规划的基本概念为了便于求解和表示决策及过程的发展顺序,而把所给问题恰为了便于求解和表示决策及过程的发展顺序,而把所给问题恰当地划分为若干个相互联系又有区别的子问题,称之为多段决策当地划分为若干个相互联系又有区别的子问题,称之为多段决策问题的问题的阶段阶段。一个阶段,就是需要作出一个决策的子问题一个阶段,就是需要作出一个决策的子问题。 通常,通常,阶段是按决策进行的阶段是按决策进行的时间或空间时间或空间上先后顺序划分的上先后顺序划分的。描述阶段的变量称为描述阶段的变量称为阶段变量阶段变量,常记为,常记为k,k=1,2, ,n。如本例可按空间
15、分为如本例可按空间分为4个个 阶段来求解,阶段来求解, k=1, 2, 3, 4。(1)阶段()阶段(stage)14变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分状态状态:每阶段初每阶段初的客观条件。描述各阶段状态的变量称为的客观条件。描述各阶段状态的变量称为状态状态变量变量,常用,常用xk表示第表示第k阶段的状态。阶段的状态。(2)状态()状态(state)例例1中,中,状态状态就是某就是某阶段的出发位置。阶段的出发位置。x1x2x3x4x5按状态变量的取值是连续还是离散,可将动态规划问题分为按状态变
16、量的取值是连续还是离散,可将动态规划问题分为离离 散型散型和和连续型连续型。15变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分动态规划中的动态规划中的状态应满足状态应满足无后效性(马尔科夫性)无后效性(马尔科夫性): 所谓所谓无后效性无后效性指系统到达某个状态前的过程的决策将不影响指系统到达某个状态前的过程的决策将不影响到该状态以后的决策。到该状态以后的决策。指系统从某个阶段往后的发展,仅由本指系统从某个阶段往后的发展,仅由本阶段所处的状态及其往后的决策所决定,与系统以前经历的状态阶段所处的状态及其往后的
17、决策所决定,与系统以前经历的状态和决策(历史)无关。和决策(历史)无关。过程的过去历史只能通过当前的状态去影过程的过去历史只能通过当前的状态去影响它未来的发展响它未来的发展例例1中,当某阶段的状态已选定某个点时,从这个点以后的路中,当某阶段的状态已选定某个点时,从这个点以后的路线只与该点有关,不受该点以前的路线的影响,所以满足状态的线只与该点有关,不受该点以前的路线的影响,所以满足状态的无后效性。无后效性。16变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分状态集合状态集合:状态变量:状态变量 xk 的取值
18、集合称为的取值集合称为状态集合状态集合,状态集合状态集合实际上是关于状态的约束条件。实际上是关于状态的约束条件。通常用通常用Sk表示状态集合表示状态集合,xk Sk。第第1阶段阶段 S1=A;第第2阶段具有阶段具有3个状个状态态B1、B2和和B3,故,故 S2=B1, B2, B3。x1x2x3x4x5(3)决策()决策(decision)当过程处于某一阶段的某状态时,可以做出不同的决定,从而当过程处于某一阶段的某状态时,可以做出不同的决定,从而确定下一阶段的状态确定下一阶段的状态,这种决定称为,这种决定称为决策决策。 描述决策的变量称为描述决策的变量称为决策变量决策变量,常用,常用uk( x
19、k )表示第表示第k阶段当状阶段当状态处于态处于xk时的时的决策变量,它是状态变量的函数。决策变量,它是状态变量的函数。例例1中,从第中,从第2阶段的阶段的状态状态B1出发,可以选择出发,可以选择下一阶段的下一阶段的C1、C2、C3。如我们决定选择如我们决定选择C1,则可表示为:则可表示为:u2( B1 ) = C1。B1C1C2C3x218变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分决策集合决策集合:第第k阶段当状态处于阶段当状态处于xk时决策变量时决策变量uk( xk )的取值范的取值范称为称为决策
20、集合决策集合,常用,常用Dk( xk ) 表示。表示。例例1中,从第中,从第2阶段的阶段的状态状态B1出发,可以选择出发,可以选择下一阶段的下一阶段的C1、C2、C3。即即 D2( B1 ) = C1、C2、C3 ;B1C1C2C3决策集合实际上是决策的约束条件,决策集合实际上是决策的约束条件,uk( xk ) Dk( xk ) 。19变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分小结小结 阶段阶段 k、 状态状态 xk、 状态集合状态集合 Sk、 决策决策 uk( xk )、 决策集合决策集合 Dk(
21、xk )。x1x2x3x4x520变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分(4)状态转移律(方程)状态转移律(方程)状态转移律状态转移律:从:从xk的某一状态值出发,当决策变量的某一状态值出发,当决策变量uk(xk) 的的取值决定后,下一阶段状态变量取值决定后,下一阶段状态变量xk+1的取值也随之确定。描述的取值也随之确定。描述从从 xk 转变为转变为 xk+1 的规律称为的规律称为状态转移规律(方程)状态转移规律(方程)。从第从第2阶段的状态阶段的状态B1出发,如我们决出发,如我们决定选择定选择C
22、2(也即确(也即确定了下一阶段的状定了下一阶段的状态)。态)。B1C2B1C2上例中,上例中, u2( B1 ) = C2状态转移律为:状态转移律为: xk+1 = uk( xk )一般来说,下一阶段状态变量一般来说,下一阶段状态变量xk+1的取值是上阶段的某一状态的取值是上阶段的某一状态变量变量xk和上阶段决策变量和上阶段决策变量uk(xk)的函数,记为的函数,记为 xk+1=Tk( xk, uk(xk) )12nx1u1x2u2x3xnunxn+1(5)策略()策略(policy)和子策略()和子策略(subpolicy)策略策略:由依次进行的由依次进行的n个阶段决策构成的个阶段决策构成的
23、决策序列决策序列就构成一个就构成一个 策略策略,用,用 p1n u1(x1), u2(x2), , un(xn) 表示。表示。25375632455114633334C1C3D1AB1B3B2D2EC2本例中,如本例中,如p14 u1(A)=B1, u2(B1) = C2, u3(C2) = D1, u4(D1) = E 表示其中一个表示其中一个策略,其总距离为策略,其总距离为2+5+6+3=16。23变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分策略集合:策略集合:在实际问题中,由于在各个阶段可供选择的
24、决策有在实际问题中,由于在各个阶段可供选择的决策有许多个,因此,它们的不同组合就构成了许多可供选择的决策序许多个,因此,它们的不同组合就构成了许多可供选择的决策序列(策略),由它们组成的集合,称为列(策略),由它们组成的集合,称为策略集合策略集合,记作,记作 P1n。从策略集合中,找出具有最优效果的策略称为从策略集合中,找出具有最优效果的策略称为最优策略最优策略。24变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分子策略:子策略:从从k阶段到第阶段到第n阶段,依次进行的阶段决策构成的阶段,依次进行的阶段决策
25、构成的决策序列称为决策序列称为k部子策略,表示为部子策略,表示为 pkn = uk(xk), uk+1(xk+1), , un(xn) 如从第如从第3阶段的阶段的C2状态开始的一个子策状态开始的一个子策略可表示:略可表示: p34=u3(C2) = D1, u4(D1) = E C225变电站电气主接线是指变电站的变压器、输电线路怎样与电力系统相连接,从而完成输配电任务。变电站的主接线是电力系统接线组成中一个重要组成部分(6)指标函数)指标函数用来衡量策略或子策略或决策的效果的某种用来衡量策略或子策略或决策的效果的某种数量指标数量指标,就称,就称为为指标函数指标函数。 它是定义在全过程或各子过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 动态 规划 ppt 课件
限制150内