(7.2.1)--07_2_1动态规划的基本概念.pdf
《(7.2.1)--07_2_1动态规划的基本概念.pdf》由会员分享,可在线阅读,更多相关《(7.2.1)--07_2_1动态规划的基本概念.pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、动态规划的基本概念(一)、基本概念1、阶段:把一个问题的过程,恰当地分为若干个相互联系的阶段,以便于按一定的次序去求解。描述阶段的变量称为阶段变量,常用k表示。阶段的划分,一般是根据时间和空间的自然特征来进行的,但要便于问题转化为多阶段决策。年、月、路段2、状态:表示每个阶段开始所处的自然状况或客观条件。通常一个阶段有若干个状态,描述过程状态的变量称为状态变量,常用Sk表示。如:S2=B1;S3=C1状态变量的取值有一定的允许集合或范围,此集合称为状态允许集合。如:S2=B1,B2;S3=C1,C2,C3,C4注意:要明确每个阶段状态的集合或者范围。一个数、一组数、一个向量“状态”具有“无后效
2、性”(“马尔科夫性”):如果某阶段的状态给定后,当前的状态是以往历史的总结,则在这阶段以后过程的发展不受这阶段以前各阶段的影响。3、决策:表示当过程处于某一阶段的某个状态时,可以作出不同的决定,从而确定下一阶段的状态,这种决定称为决策。描述决策的变量,称为决策变量。决策变量是状态变量的函数。可用一个数、一组数或一向量(多维情形)来描述。Uk(Sk)表示第k阶段处于Sk状态时的决策变量。如:U2(B1)C2,表示处于第二阶段,以B1为始点选择C2作为第二阶段的终点。在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。Dk(Sk)表示第k阶段处于Sk状态时的允许决策集合。D2(B
3、1)C1,C2,C3。Uk(Sk)Dk(Sk)。4、策略:是一个按顺序排列的决策组成的集合。在实际问题中,可供选择的策略有一定的范围,称为允许策略集合,用P来表示。从允许策略集合中找出达到最优效果的策略称为最优策略。把从第一阶段开始到最后阶段终止的整个决策过程,称为问题的全过程;而把从第k阶段开始到最后阶段终止的决策过程,称为k子过程。在全过程上,各阶段的决策按顺序排列组成的决策序列p1,n u1,u2,un称为全过程策略,简称策略;而在k子过程上的决策序列pk,n uk,uk+1,un称为k子过程策略,也简称子策略。5、状态转移方程:若第k阶段的状态变量值为sk,当决策变量uk的取值决定后,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 7.2 07 _2_1 动态 规划 基本概念
限制150内