建立动态规划数学模型的步骤.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《建立动态规划数学模型的步骤.ppt》由会员分享,可在线阅读,更多相关《建立动态规划数学模型的步骤.ppt(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 运 筹 学动态规划动态规划 3 建立动态规划数学模型的步骤 “最优化原理”是动态规划的核心,所有动态规划问题的递推关系都是根据这个原理建立起来的,并且根据递推关系依次计算,最终可求得动态规划问题的解。一般来说,利用动态规划求解实际问题需先建立问题的动态模型,具体步骤如下:将问题按时间或空间次序划分成若干阶段。有些问题不具有时空次序,也可以人为地引进时空次序,划分阶段。正确选择状态变量xk。这一步是形成动态模型的关键,状态变量是动态规划模型中最重要的参数。一般来说,状态变量应具有以下三个特性:要能够用来描述决策过程的演变特征。要满足无后效性。即如果某阶段状态已给定后,则以后过程的进展不受以前各
2、状态的影响,也就是说,过去的历史只通过当前的状态去影响未来的发展。递推性。即由k阶段的状态变量xk及决策变量uk可以计算出k+1阶段的状态变量xk+1。确定决策变量uk及允许决策变量集合Dk(uk)。根据状态变量之间的递推关系,写出状态转移方程:xk+1=T(xk,uk(xk)建立指标函数。一般用rk(xk,uk)描写阶段效应,fk(xk)表示kn阶段的最优子策略函数。建立动态规划基本方程:fk(xk)=opt rk(xk,uk(xk)fk+1(xk+1)uk Dk(uk)fn+1(xn+1)=C k=n,n-1,1 以上是建立动态规划模型的过程,这个过程是正确求解动态规划的基础。在动态规划基
3、本方程中,rk(xk,uk),xk+1=T(xk,uk)都是已知函数,最优子策略fk(xk)与fk+1(xk+1)之间是递推关系,要求出fk(xk)及uk(xk),需要先求出fk+1(xk+1),这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。由后向前逐步计算,最终可以算出全过程的最优策略函数值及最优策略。另一方面,由于k+1阶段的状态xk+1=T(xk,uk)是由前面的状态xk和决策uk所形成的,在计算fk+1(xk+1)时还不能具体确定xk+1的值,所以,这就要求必须就k+1阶段的各个可能状态计算fk+1(xk+1),因此动态规划方法不但能求出整个问题的最优策略和最优目标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 建立 动态 规划 数学模型 步骤
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内