动态规划及其在数学模型中的应用教育文档.docx
《动态规划及其在数学模型中的应用教育文档.docx》由会员分享,可在线阅读,更多相关《动态规划及其在数学模型中的应用教育文档.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、动态规划及其在数学模型中应用1动态规划起源与开展 动态规划是解决多阶段决策过程最优化一种方法,大约产生于20世纪50年代。1951年,美国数学家理查德贝尔曼根据一类多阶段决策问题特点,把多阶段决策问题表示为一系列单阶段问题,即把一个N-变量问题作为一系列N个问题而逐个加以解决,提出了解决这类问题“最优化原理,并将其应用于很多实际问题研究,从而建立了运筹学一个分支-动态规划。1957年理查德贝尔曼在美国普林斯顿大学发表了第一本正式著作。随后理查德贝尔曼及其他科学工作者发表了一些列动态规划应用著作,包括动态规划在最正确控制论、资源理论、工业工程、经济学、管理科学、变分法和马尔柯夫过程中应用。动态规
2、划开展始终伴随着它广泛应用而不断臻善。 2动态规划优点与局限 动态规划核心思想是贝尔曼提出最优化原理,这个原理导致了分阶段决策方法。分阶段决策方法是建立在整体最优化根底上,在寻求某一阶段决策时,不仅要考虑局部利益,而且应考虑总体最优。 动态规划通过将一个N维变量复杂问题进展分阶段处理,把N维变量问题变成求解N个单变量问题,大大简化求解过程,节省巨大计算量,这是经典求解极值方法所做不到。 动态规划几乎超越了所有现在计算方法,特别是经典最优化方法,它能确定出绝对全局极大或极小,而不是相对局部极值,使得我们不再需要关心伤脑筋局部极大或极小问题。 动态规划另一特点是泛函方程“嵌入特性。动态规划方法求出
3、不仅是对整个过程某一特定状态一个解,而且也是对所有后部子过程所有可能出现状态一族解。 动态规划方法局限性表现有以下几个方面: 第一,到目前为止,动态规划还没有一个统一标准模型可供使用。实际问题不同,其动态规划模型可能各异,虽然理论上说可以把其他数学规划问题化为动态规划模型求解,但是这种转化过程对于复杂数学规划问题将变得十分困难。 第二,构造动态规划模型时,状态变量必须满足“无后效性条件,这是一个相当强条件。因为它不仅依赖于状态转移规律,还与允许决策集合和指标构造有关,不少实际问题在取自然特征作为状态变量时,往往不满足这个条件,减低了动态规划通用性,当然原那么上说,采用适当增多状态变量方法,总能
4、人为地把过程变为无后效,但动态规划还存在下述局限,所以这种作法实际意义不大。 第三,用动态规划方法进展数值求解时主要问题是所谓“维数障碍,这里状态变量与决策变量不是一回事。假设状态变量大于2或3,计算时涉及较大存储量和计算量。状态空间维数越高,即描述状态空间向量分量越多,所遇到计算困难将变得越大。 3动态规划术语 研究系统优化时,遇到系统可以是一个物理系统,也可能是可操作系统,也可以是一个概念系统。但是,使用动态规划来研究系统时,必须将系统现实而具体术语变为数学统一术语。 3.1 阶段 阶段是指系统需要做出决策步骤,即把系统顺序地向前开展划分为假设干个相互联系阶段,使能按阶段次序求解。描述阶段
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 及其 数学模型 中的 应用 教育 文档
限制150内