决策理论655416.pptx
《决策理论655416.pptx》由会员分享,可在线阅读,更多相关《决策理论655416.pptx(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 序贯决策分析序贯决策分析第一节第一节 多阶段决策多阶段决策一、多阶段决策问题一、多阶段决策问题 在经济活动中,常常遇到这样的决策问题,由于它的特殊性,需要将过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。当各个阶段决策确定后,就组成了一个决策序列,因而也就决定了整个过程的一条活动路线,这种把一个问题可看作是一个前后关联的具有链状结构的多阶段过程就称为多阶段决策过程。第一节第一节 多阶段决策多阶段决策二、多阶段决策方法二、多阶段决策方法 解决多阶段决策问题的主要方法是决策树方法和动态规划方法,决策树由节点和分支组成,每一条由树根通往树
2、梢的路线都表示一种决策方案及可能遇到的一种情况。进行决策分析时,要由树梢往树根依次计算。这种从后到前进行决策分析的方法叫做逆序归纳法。多阶段决策分析的步骤:(1)根据具体问题适当划分阶段;(2)确定各阶段的状态变量,寻找各阶段之间的联系;(3)由后到前用逆序归纳法进行决策分析。第一节第一节 多阶段决策多阶段决策三、应用举例三、应用举例 例例6-16-1 离散情况决策分析。某企业考虑是否花费4000元钱从某科研机关购买某项技术然后产销新产品。如果买技术,可以进行大批生产(a1),中批生产(a2),或小批生产(a3),可能出现的市场销售情况也分为畅销()一般()和滞销()三种。其收益(利润,元)矩
3、阵如表6-1 第一节第一节 多阶段决策多阶段决策表表6-1 6-1 某公司产销新产品的收益矩阵某公司产销新产品的收益矩阵第一节第一节 多阶段决策多阶段决策 为了更正确地了解市场情况,正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因,试销费需要600元。由于试销前未作广告,顾客对产品不太了解,加之试销量较小,试销结果不很准确。假设试销结果分为产品受欢迎(H1),一般(H2)和不受欢迎(H3)三种,其准确度(似然分布矩阵)见表6-2所示。第一节第一节 多阶段决策多阶段决策表表6-2 6-2 试销结果的准确度试销结果的准确度 第一节第一节 多阶段决策多阶段决策如不买此项技术,把这笔费用用
4、在其他方面,在同样的时期可获利8000元。那么,该公司应该如何决策?(1)是否买技术?(2)如果买技术,是否采取试销办法?(3)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动?第一节第一节 多阶段决策多阶段决策 例例6-26-2 连续情形的决策分析。某工厂现有10万元资金可供生产某种产品使用,生产过程有两个方案可供选择。方案1:每万元资金,每年可产生0.5万元的利润,年产量为2000吨。方案2:每万元资金,每年可产生0.2万元的利润,年产量为3000吨。每年可用一部分资金采取一种方案生产,另外一部分资金采取另一种方案进行生产,但一年内不变。假设前一年的
5、利润可作为下一年的资金在两个方案间再行分配,但一个方案前一年的资金不得在下一年向另一方案转移。那么,为使四年内的总产量最高,该厂在这四年中应该如何分配资金?第二节第二节 序贯决策序贯决策 有些决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接着又有一些新的情况,又需要进行新的决策。这样决策、情况、决策,就构成一个序列,这就是序列决策。解决序列问题的有利办法仍然是决策树。例例6-36-3 设有某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用每次30000元,钻井费用为10000元。若钻井后出油,这井队
6、可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图6-2上。问钻井队的决策者如何做出决策使收入的期望值为最大。第二节第二节 序贯决策序贯决策图图6-2 6-2 原决策树原决策树 第三节第三节 马尔可夫决策马尔可夫决策一、马尔可夫决策问题一、马尔可夫决策问题 决策问题采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际所处状态的影响。其中一种最简单、最基本的情形,是每一时期状态参数的概率分布只与这一时期的前一时期实际所处的状态有关,而与更早的状态无关,这就是所谓的马尔可夫链。利用
7、马氏过程分析系统当前状态并预测未来状态的决策方法,称为马尔可夫决策。第三节第三节 马尔可夫决策马尔可夫决策二、马尔可夫链与转移概率矩阵二、马尔可夫链与转移概率矩阵随机过程 如果对任意 都存在则称 具有马尔可夫性条件概率 称为转移概率,也称一步转移概率。第三节第三节 马尔可夫决策马尔可夫决策各状态之间的转移概率可记为其中 ,对所有i;且 ,对所有i,j,称P为一步转移概率矩阵。定义:如果随机过程 满足下述性质,则称 是一个有限状态的马尔可夫链(Markov)。第三节第三节 马尔可夫决策马尔可夫决策(1)具有有限种状态;(2)具有马尔可夫性;(3)转移概率具有平稳性。第三节第三节 马尔可夫决策马尔
8、可夫决策三、稳态概率三、稳态概率称 为稳态概率。且因此我们可以从n n步转移矩阵的 极限取得稳态概率分布第三节第三节 马尔可夫决策马尔可夫决策得记 ,则 ,且 此方程组为稳态方程第三节第三节 马尔可夫决策马尔可夫决策四、马尔可夫应用实例四、马尔可夫应用实例 例例6-66-6 某生产商标 为的产品的厂商为了与另外两个生产同类产品 和 的厂家竞争,有三种可供选择的措施:(1)发放有奖债券;(2)开展广告宣传;(3)优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是 第三节第三节 马尔可夫决策马尔可夫决策 已知三种商标的商品的月总销售量为一千万件,每件可获利1元
9、。另外,三种措施的成本费分别为150万,40万,30万。为长远利益考虑,生产商标为 的产品的厂商应该采取何种措施?第三节第三节 马尔可夫决策马尔可夫决策 例例6-76-7 我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别为如表6-5、表6-6所示。假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施?例例6-86-8 在上例中,如果每年是否采取广告措施可根据上一年的经营情况确定。那么,应该如何决策?第三节第三节
10、 马尔可夫决策马尔可夫决策畅销滞销畅销0.80.2滞销0.40.6畅销滞销畅销0.90.1滞销0.70.3表表6-3 6-3 不采取广告措施不采取广告措施 表表6-46-4采取广告措施采取广告措施第四节第四节 群决策简介群决策简介一、群决策概念一、群决策概念 在现实生活中,决策往往是群体行为,是由多人参加进行行动方案的选择活动。这些组织的成员、代表就是群体决策者中的一员。作为群体决策,其决策程序、决策评价标准与单个决策者的决策有很大的差异,在决策原则、方法、许多方面都有新的内容,因而应用单个决策者的决策方法进行群决策在许多方面都受到了限制。第四节第四节 群决策简介群决策简介 群体决策理论研究的
11、问题一般具有三个前提:自主性。决策者有独立选择机会,其行动不受较高层权利的支配,但不排除群体成员间相互影响。共存性。决策成员都在已知的共同条件下进行选择。共意性。群体做出的必然是所有参与者一致能够接受的方案。第四节第四节 群决策简介群决策简介 群体决策研究比个人决策研究要复杂很多。这主要由几个因素引起:优先度。集体中每个成员都有各自的目标和优先观念以及不同的效用函数。主观概率判断。群体中各成员由于信息的感受和处理方式不一样,对未来状态出现概率的估计也不同。沟通。集体决策可以在完全没有沟通信息的情况下进行,而更多的决策是在有相互沟通信息的情况下进行。第四节第四节 群决策简介群决策简介二、群体决策
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策 理论 655416
限制150内