运筹学动态规划新a管理资料.pptx
《运筹学动态规划新a管理资料.pptx》由会员分享,可在线阅读,更多相关《运筹学动态规划新a管理资料.pptx(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多阶段决策问题:可将问题分为若干个相互联系的阶段,在每一阶段分别对应着若干个可以选择的决策,当每个阶段的决策选定之后,也就确定了问题的一个决策过程。将各阶段的决策综合起来,就构成了一个决策序列,称为问题的一个策略。显然,决策不同,过程的策略也不同。对应于每一个策略,都有一个确定的效果(值)。一般情况下,策略不同,效果也不同。多阶段决策的目的就是在所有可采取的策略中选取一个最优策略,使在一定条件下取得最优的效果。第1页/共85页第2页/共85页第3页/共85页例三:将一个数c(c0)分为n个部分c1,c2,cn 之和 ,且ci0(i=1,2,n),问如何分割使其乘积 最大?第4页/共85页第二节
2、 最优化原理与动态规划数学模型2.1 基本思想 将多阶段问题转化为单阶段问题,按着目标要求和递推关系求出最优结果。(用逆序解法解例1)第5页/共85页 例1 最短路线问题。设有一个旅行者从图8-1中的A点出发,途中要经过B、C、D等处,最后到达终点E。从A到E有很多条路线可以选择,各点之间的距离如图中所示,问该旅行者应选择哪一条路线,使从A到达E的总路程为最短。第6页/共85页25375632455114633334C1C3D1AB1B3B2D2EC2第7页/共85页25375632455114633334C1C3D1AB1B3B2D2EC2f5(E)=0f4(D1)=3f4(D2)=4f3(
3、C1)=4f3(C2)=7f3(C3)=6f2(B1)=11f2(B2)=7f2(B3)=8f1(A)=11状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态 A,(A,B3),B3,(B3,C2),C2,(C2,D2),D2,(D2,E),E从A到E的最短路径为11,路线为AB3C2 D2 E。第8页/共85页第9页/共85页第10页/共85页第11页/共85页第12页/共85页2.2 动态规划的基本概念 阶段:问题需要做出决策的步数。阶段用k表示。通常,k=1,2,n。(逆序编号与顺序编号)。第13页/共85页2.状态:系统某阶段的出发位置或特征、状况。通常一个阶段包含有
4、若干个(设r个)状态。每一阶段所有状态的集合称为状态变量集合。用Sk=ski i=1,2,r表示。第k阶段的状态变量Sk应包含该阶段之前决策过程的全部信息,做到从该阶段后做出的决策只与该状态有关,与这之前的状态和决策相互独立。(无后效性)状态可以是一个数或一组数,也可能不是数;可以使离散的,也可以是连续的;可以是确定的,也可以是随机的。(维数障碍)第14页/共85页3.决策:当某阶段的状态给定以后,从该状态演变到下一阶段某种状态的选择。决策变量xk(sk)表示第k阶段状态为sk时对方案的选择。显然,它是状态的函数。决策变量的取值要受到一定的限制(约束条件),用Dk(sk)表示k阶段状态为sk时
5、的决策变量允许取值范围,称为允许决策集合,因而有 xk(sk)Dk(sk)。第15页/共85页4.策略和子策略:策略:动态规划问题各阶段决策组成的序列总体。子策略:从某一阶段开始到过程最终的决策序列称为问题的子过程策略。使问题达到最优效果的策略称为最优策略。第16页/共85页25375632455114633334C1C3D1AB1B3B2D2EC2f5(E)=0f4(D1)=3f4(D2)=4f3(C1)=4f3(C2)=7f3(C3)=6f2(B1)=11f2(B2)=7f2(B3)=8f1(A)=11状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态 A,(A,B3),
6、B3,(B3,C2),C2,(C2,D2),D2,(D2,E),E从A到E的最短路径为11,路线为AB3C2 D2 E。第17页/共85页5.状态转移方程:从sk的某一状态(值)出发,当决策变量xk(sk)的取值决定后,下一阶段状态变量sk+1(的取值)也就随之确定。这种从上一阶段的某一状态(值)到下一阶段某一状态(值)的转移规律称为状态转移率,也称状态转移方程。记为:第18页/共85页6.指标函数:(1)阶段指标函数:对应某一阶段状态和从该状态出发的一个决策的某种效益的度量。用 v k=(sk,xk)表示。第19页/共85页(2)过程指标函数Vk,n:从状态sk(k=1,2,n)出发至过程最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 动态 规划 管理 资料
限制150内