西安电子科技大学数学建模讲义.pptx
《西安电子科技大学数学建模讲义.pptx》由会员分享,可在线阅读,更多相关《西安电子科技大学数学建模讲义.pptx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1西安电子科技大学数学建模讲义西安电子科技大学数学建模讲义动态规划动态规划 1 1 动态规划的基本概念和方法动态规划的基本概念和方法动态规划的基本概念和方法动态规划的基本概念和方法基本概念与名词解释基本概念与名词解释基本概念与名词解释基本概念与名词解释最优化原理与动态规划的基本方法最优化原理与动态规划的基本方法最优化原理与动态规划的基本方法最优化原理与动态规划的基本方法 2 2 动态规划模型的建立与求解步骤动态规划模型的建立与求解步骤动态规划模型的建立与求解步骤动态规划模型的建立与求解步骤 建立动态规划模型的基本要求建立动态规划模型的基本要求建立动态规划模型的基本要求建立动态规划模型的基
2、本要求动态规划的求解步骤动态规划的求解步骤动态规划的求解步骤动态规划的求解步骤 3 3 动态规划的应用举例动态规划的应用举例动态规划的应用举例动态规划的应用举例定价问题定价问题定价问题定价问题资源分配问题资源分配问题资源分配问题资源分配问题生产存储问题生产存储问题生产存储问题生产存储问题第1页/共56页第一节第一节 动态规划的基本概念与方法动态规划的基本概念与方法1 1 动态规划的基本概念动态规划的基本概念一、动态决策问题:一、动态决策问题:决决策策过过程程具具有有阶阶段段性性和和时时序序性性(与与时时间间有有关关)的的决决策问题。即决策过程可划分为明显的阶段。策问题。即决策过程可划分为明显的
3、阶段。二、什么叫动态规划二、什么叫动态规划(D.P.(D.P.Dynamic Program)Dynamic Program):多阶段决策问题最优化的一种方法。多阶段决策问题最优化的一种方法。广广泛泛应应用用于于工工业业技技术术、生生产产管管理理、企企业业管管理理、经经济、军事等领域。济、军事等领域。三、动态规划三、动态规划(D.P.)(D.P.)的起源:的起源:19511951年年,美美国国数数学学家家R.Bellman(R.Bellman(贝贝尔尔曼曼)等等人人提提出出最最优优化化原原理理,从从而而建建立立动动态态规规划划,他他的的名名著著动动态态规规划划于于19571957年出版。年出版
4、。第2页/共56页四、动态决策问题分类:四、动态决策问题分类:1 1、按数据给出的形式分为:、按数据给出的形式分为:离散型动态决策问题。离散型动态决策问题。连续型动态决策问题。连续型动态决策问题。2 2、按决策过程演变的性质、按决策过程演变的性质分为:分为:确定型动态决策问题。确定型动态决策问题。随机型动态决策问题。随机型动态决策问题。第3页/共56页名词解释名词解释名词解释名词解释n n例例例例1 1 某公司欲将一批货物从城市某公司欲将一批货物从城市某公司欲将一批货物从城市某公司欲将一批货物从城市A A运到城市运到城市运到城市运到城市E E去,去,去,去,如图所示,走哪条路线最好如图所示,走
5、哪条路线最好如图所示,走哪条路线最好如图所示,走哪条路线最好?第4页/共56页1、阶段、阶段(stage)k:把所给问题的过程,恰当地分成把所给问题的过程,恰当地分成若干个相互联系的阶段。描述阶段的变量称为阶段变若干个相互联系的阶段。描述阶段的变量称为阶段变量,常用量,常用k表示。表示。k=1、2、3、4。2、状态、状态(state)Sk:状态表示每个阶段开始所处的状:状态表示每个阶段开始所处的状态态,即是每一阶段的出发位置即是每一阶段的出发位置.阶段的起点阶段的起点.通常一个阶通常一个阶段有多个状态段有多个状态.记为记为Sk.S1=A,S2=B1,B2,B3,S3=C1,C2,C3,S4=D
6、1,D2。第5页/共56页3、决策、决策(decision)uk(sk):从一个阶段某状态演变到下一个阶段某状态的选择:从一个阶段某状态演变到下一个阶段某状态的选择.常用常用uk(sk)表示第表示第k阶段当状态处于阶段当状态处于sk时的决策变量时的决策变量.决策集用决策集用Dn(Sk)表示表示.就是就是阶段的终点阶段的终点.D1(S1)=u1(A)=B1,B2,B3=S2,D2(S2)=U2(B1),U2(B2),U2(B3)=C1,C2;C1,C2,C3;C2,C3 =C1,C2,C3=S3,D3(S3)=U3(C1),U3(C2),U3(C3)=D1,D2;D1,D2,D3;D1,D2,D
7、3 =D1,D2,D3=S4,D4(S4)=U4(D1),U4(D2),U4(D3)=E1,E2;E1,E2;E1,E2 =E1,E2=S5,D5(S5)=X5(E1),X5(E2)=F;F=F。第6页/共56页4 4、策略策略(policy):全过程中各个阶段的决策:全过程中各个阶段的决策Un组成的有序总体组成的有序总体 Un.如如 A B2 C1 D1 E 5、子策略、子策略(sub-policy):剩下的:剩下的M个阶段构成个阶段构成M子过程子过程,相应的相应的 决策系列叫决策系列叫M子策略子策略.如如 C1 D1 E6、状态转移方程:前一阶段的终点、状态转移方程:前一阶段的终点(决策决
8、策)是后前一阶段的起点是后前一阶段的起点 (状态状态).Uk=Sk+17、指标函数:各个阶段的数量指标、指标函数:各个阶段的数量指标,记为记为Vk,n(sk,Uk).如上例中如上例中,用用dk(sk,Uk)表示距离表示距离.d2(B3,C2)=8,d3(C2,D2)=2 等等.8、目标函数、目标函数:策略的数量指标值策略的数量指标值,记为记为 Z=optv1(s1,u1)*vn(sn,un).其中:其中:opt为为max或或min,*为运算符号为运算符号.如上例中,如上例中,Z=mind1(s1,u1)+dn(sn,un)=mind1+d2+dn第7页/共56页 一、一、一、一、R.Bellm
9、anR.Bellman最优化原理:最优化原理:最优化原理:最优化原理:作作作作为为为为整整整整个个个个过过过过程程程程的的的的最最最最优优优优策策策策略略略略,无无无无论论论论过过过过去去去去的的的的状状状状态态态态和和和和决决决决策策策策如如如如何何何何,对对对对前前前前面面面面的的的的决决决决策策策策形形形形成成成成状状状状态态态态而而而而言言言言,余下的诸决策必构成最优策略。余下的诸决策必构成最优策略。余下的诸决策必构成最优策略。余下的诸决策必构成最优策略。即即即即:若若若若MM是是是是从从从从A A到到到到B B最最最最优优优优路路路路线线线线上上上上的的的的任任任任一一一一点点点点,
10、则从则从则从则从MM到到到到B B的路线也是最优路线。的路线也是最优路线。的路线也是最优路线。的路线也是最优路线。A MB最优化原理最优化原理第8页/共56页二、指标递推方程:二、指标递推方程:fn*(Sn)=opt vn(sn,un)*vn(sn,un),xn Dn(Sn)如上例:如上例:fn*(Sn)=min vn(sn,un)+fn+1*(Sn+1),n=3、2、1 xn Dn(Sn)f4*(S4)=min v4(s4,u4)x4 D4(S4)三、求解过程:三、求解过程:用用反反向向嵌嵌套套递递推推法法:从从最最后后一一个个阶阶段段开开始始,依依次次对对各各子子过过程程寻寻优优,直直至至
11、获获得得全全过过程程的的最最优优,形成最优策略,获得最优策略指标值。形成最优策略,获得最优策略指标值。第9页/共56页一、建立动态规划模型的基本要求一、建立动态规划模型的基本要求一、建立动态规划模型的基本要求一、建立动态规划模型的基本要求n n将问题划分成若干阶段。有的问题的阶段将问题划分成若干阶段。有的问题的阶段将问题划分成若干阶段。有的问题的阶段将问题划分成若干阶段。有的问题的阶段性很明显,有的则不明显,需要分析后人性很明显,有的则不明显,需要分析后人性很明显,有的则不明显,需要分析后人性很明显,有的则不明显,需要分析后人为假设。为假设。为假设。为假设。n n确定各阶段的状态变量,并给出状
12、态转移确定各阶段的状态变量,并给出状态转移确定各阶段的状态变量,并给出状态转移确定各阶段的状态变量,并给出状态转移方程,状态转移方程的形式应当与递推顺方程,状态转移方程的形式应当与递推顺方程,状态转移方程的形式应当与递推顺方程,状态转移方程的形式应当与递推顺序一致。序一致。序一致。序一致。n n状态变量应当满足无后效性要求。状态变量应当满足无后效性要求。状态变量应当满足无后效性要求。状态变量应当满足无后效性要求。n n明确指标函数,给出最优函数递推方程,明确指标函数,给出最优函数递推方程,明确指标函数,给出最优函数递推方程,明确指标函数,给出最优函数递推方程,递推方程的形式应当与递推顺序一致。
13、递推方程的形式应当与递推顺序一致。递推方程的形式应当与递推顺序一致。递推方程的形式应当与递推顺序一致。第10页/共56页二、动态规划的求解步二、动态规划的求解步骤骤n n正确划分阶段。正确划分阶段。n n确定状态变量和决策变量,并确定状态变量和决策变量,并给出状态变量和决策变量的可给出状态变量和决策变量的可行集合。行集合。n n确定求解的递推顺序,给出状确定求解的递推顺序,给出状态转移方程。态转移方程。n n确定阶段、子过程确定阶段、子过程(子策略子策略)的指的指标函数,确定最优值函数的递标函数,确定最优值函数的递推方程和边界条件。推方程和边界条件。n n递推求解。递推求解。n n与递推过程反
14、向求出最优策略与递推过程反向求出最优策略(最优决策变量值系列最优决策变量值系列)和最优状和最优状态变化路线。态变化路线。第11页/共56页例例例例2 2 2 2:求下列图中:求下列图中:求下列图中:求下列图中A A A A到到到到F F F F的最短路线及最短路线值。的最短路线及最短路线值。的最短路线及最短路线值。的最短路线及最短路线值。AB1B2B3C1C2C3D1D2D3E1E2F35495435171584644222697514第12页/共56页AB1B2B3C1C2C3D1D2D3E1E2F354954351715846442226975141 1、阶段、阶段(stage)n(sta
15、ge)n:n=1n=1、2 2、3 3、4 4、5 5。2 2、状态、状态(state)S(state)Sn n:S S1 1=A=A,S S2 2=B=B1 1,B,B2 2,B,B3 3,S S3 3=C=C1 1,C,C2 2,C,C3 3,S S4 4=D=D1 1,D,D2 2,D,D3 3,S S5 5=E=E1 1,E,E2 2。3 3、决策、决策(decision)X(decision)Xn n:决策集:决策集D Dn n(S(Sn n)。D D1 1(S(S1 1)=X)=X1 1(A)=B(A)=B1 1,B,B2 2,B,B3 3=S=S2 2,D D2 2(S(S2 2
16、)=X)=X2 2(B(B1 1),X),X2 2(B(B2 2),X),X2 2(B(B3 3)=C)=C1 1,C,C2 2;C;C1 1,C,C2 2,C,C3 3;C;C2 2,C,C3 3 =C =C1 1,C,C2 2,C,C3 3=S=S3 3,D D3 3(S(S3 3)=X)=X3 3(C(C1 1),X),X3 3(C(C2 2),X),X3 3(C(C3 3)=D =D1 1,D,D2 2;D;D1 1,D,D2 2,D,D3 3;D;D1 1,D,D2 2,D,D3 3=D=D1 1,D,D2 2,D,D3 3=S=S4 4,D D4 4(S(S4 4)=X)=X4 4
17、(D(D1 1),X),X4 4(D(D2 2),X),X4 4(D(D3 3)=E)=E1 1,E,E2 2;E;E1 1,E,E2 2;E;E1 1,E,E2 2=E=E1 1,E,E2 2=S=S5 5,D D5 5(S(S5 5)=X)=X5 5(E(E1 1),X(E),X(E2 2)=F;F=F)=F;F=F。第13页/共56页AB1B2B3C1C2C3D1D2D3E1E2F354954351715846442226975144、状态转移方程:、状态转移方程:Xn=Sn+15、指标函数、指标函数(距离距离):dn(sn,xn).d2(B3,C2)=1,d3(C2,D3)=6 等。等
18、。6、指标递推方程:、指标递推方程:fn*(Sn)=min dn(sn,Xn)+fn+1*(Sn+1),n=4、3、2、1 Un Dn(Sn)f5*(S5)=min V5(s5,X5)X5 D5(S5)第14页/共56页AB1B2B3C1C2C3D1D2D3E1E2F3549543517158464422269751411F22F4+1=52+2=44 E26+1=79+2=117E17+1=85+2=77E2第15页/共56页AB1B2B3C1C2C3D1D2D3E1E2F354954351715846442226975141+4=55+7=12 /5D18+4=124+7=116+7=13
19、11D24+4=84+7=112+7=98D19+5=145+11=16 /14C14+5=93+11=145+8=139C1 /1+11=127+8=15 12C2第16页/共56页AB1B2B3C1C2C3D1D2D3E1E2F354954351715846442226975143+14=175+9=144+12=16 14B2最短路线值为:最短路线值为:f f1 1*(s(s1 1)=14)=14最短路线求解如下:最短路线求解如下:第17页/共56页11F22F4+1=52+2=44 E26+1=79+2=117E17+1=85+2=77E21+4=55+7=12 /5D18+4=124
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 西安电子科技大学 数学 建模 讲义
限制150内