运筹学课件第三节不确定型决策方法.ppt
《运筹学课件第三节不确定型决策方法.ppt》由会员分享,可在线阅读,更多相关《运筹学课件第三节不确定型决策方法.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹学教程第三节 不确定型决策方法不确定型决策问题须具备以下几个条件:有一个决策希望达到的目标(如收益最大或损失较小)。存在两个或两个以上的行动方案。存在两个或两个以上的自然状态,但是既不能确定未来和中自然状态必然发生,又无法得到各种自然状态在未来发身个概率。每个行动方案在不同自然状态下的益损值可以计算出来。对于不确定型决策问题,由一些常用的决策方法,或称为不确定型决策准则。对于具有不同心理状态、冒险精神的人,运筹学教程一、悲观准则(max-min 准则)悲观准则又称华尔德准则或保守准则,按悲观准则决策时,决策者是非常谨慎保守的,为了“保险”,从每个方案中选择最坏的结果,在从各个方案的最坏结果
2、中选择一个最好的结果,该结果所在的方案就是最优决策方案。例5 设某决策问题的决策收益表为 状态方案 42533547556636579 58542333运筹学教程所以 为最优方案。因二、乐观准则(max-max 准则)当决策者对客观状态的估计持乐观态度时,可采用这种方法。此时决策者的指导思想是不放过任何一个可能获得的最好结果的机会,因此这是一个充满冒险精神的决策者。一般的,悲观准则可用下式表示试按悲观准则确定其决策方案。运筹学教程一般的,乐观准则可用下式表示 状态方案 42533547556636579 58579785例5 设某决策问题的决策收益表为试按乐观准则确定其决策方案。运筹学教程所以
3、 为最优方案。因三、折衷准则折衷准则又称乐观系数准则或赫威斯准则,是介于悲观准则与乐观准则之间的一个准则。若决策者对客观情况的评价既不乐观也不悲观,主张将乐观与悲观之间作个折衷,具体做法是取一个乐观系数(0 1)来反映决策者对状态估计的乐观程度,计算公式如下运筹学教程 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按折衷准则确定其决策方案。解:若取乐观系数运筹学教程 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为运筹学教程 状态方案 42533547556636579 5856.47.66.27.04.6例5 设某决
4、策问题的决策收益表为运筹学教程四、等可能准则等可能准则又称机会均等法或称拉普拉斯(Laplace)准则,它是19世纪数学家 Laplace 提出的。他认为:当决策者面对着n种自然状态可能发生时,如果没有充分理由说明某一自然状态会比其他自然状态有更多的发生机会时,只能认为它们发生的概率是相等的,都等于1/n。计算公式如下运筹学教程 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按等可能准则确定其决策方案。解:按等可能准则此一问题的每种状态发生的概率为运筹学教程 状态方案 42533547556636579 5855.505.255.005.504.50运筹
5、学教程因有两个最大期望益损值方案,哪一个更优?运筹学教程考虑它们的界差:界差越小,方案越优。状态方案 42533547556636579 5855.505.255.005.504.50运筹学教程因故方案1为最优方案。五、遗憾准则遗憾准则又称最小最大沙万奇(Savage)遗憾准则或后悔准则。运筹学教程当决策者在决策之后,若实际情况出现时并不理想,决策者有后悔之意,而实际出现状态可能达到的最大值与决策者得到的收益值之差越大,决策者的后悔程度越大。因此可用每一状态所能达到的最大值(称作该状态的理想值)与其他方案(在同一状态下)的收益值之差定义该状态的后悔值向量。对每一状态作出后悔值向量,就构成后悔值
6、矩阵。对后悔值矩阵的每一行及对应每个方案求初其最大值,再在这些最大值中求出最小值所对应的方案,即为最优方案。计算公式如下运筹学教程最优方案为先取每一列中最大值,用这一最大之减去此列的各个元素。再取结果的最大值。运筹学教程 状态方案 42533547556636579 58579785例5 设某决策问题的决策收益表为试按遗憾准则确定其决策方案。解:先计算后悔值矩阵:运筹学教程 状态方案 42533547556636579 585 状态方案 13022230220030120 4142*342*4后悔值矩阵运筹学教程最优方案为1或4。方案准则 悲观准则乐观准则折衷准则等可能准则遗憾准则一般来讲,被
7、选中多的方案应予以优先考虑。运筹学教程第四节 效用函数方法一、效用概念的引入前面介绍风险型决策方法时,提到可根据期望益损值(最大或最小)作为选择最优方案的原则,但这样做并不一定合理。请看下面的例子:例6设有两个决策问题:问题1:方案A1:稳获100元;方案B1:用掷硬币的方法,掷出正面获得250元,掷出反面获得0元。运筹学教程问题2:方案A2:稳获10000元;方案B2:用掷硬币的方法,直到掷出正面为止,记所掷次数为N,则当正面出现时,可获2N元.当你遇到这两类问题时,如何决策?大部分会选择 A1 和 A2。但不妨计算一下其期望值:Y10250P(Y1=k)1/21/2方案B1的收益为随机变量
8、Y1。则其期望收益为:运筹学教程设方案B2的收益为随机变量Y2。Ai=“第i次掷出正面”,则第n次掷出正面的概率为:Y222223nP(Y2=k)1/21/221/231/2nX012n-1相互独立设掷出正面前掷出反面的次数为随机变量X,则有分布列:则方案2的平均收益为:运筹学教程Y222223nP(Y2=k)1/21/221/231/2nX012n-1于是,根据期望收益最大原则,应选择B1和B2,但这一结果很难令实际决策者接受。此乃研究效用函数的初衷。例7(赌一把)一个正常的人,遇到“赌一把”的机会。情况如下面的树,问此人如何决策?运筹学教程正常人B赌不赌45元掷出正面P=0.5-10元P=
9、0.50100元掷出反面45元对绝大部分人来说,只要兜里有10元钱,又不急用的话,就选择“赌”。因此时“赌”的平均收益为:类似的问题,让一个被判刑十年且手头仅有10元钱的罪犯做下面的决策:运筹学教程罪犯B赌释放45元掷出正面P=0.5-10元P=0.5-10元100元掷出反面45元此时罪犯可能要选择交出10元钱,获得释放。以上例子说明:同一货币量在不同场合下给决策者带来的主观上的满足程度不同,决策者在更多的场合下是根据不同结果对其需求欲望的满足程度来进行决策的,不仅仅依据期望收益最大进行决策。相同的期望益损值(以货币值为度量)的不同随机事件之间其风险可能存在着很大的差异。即说明货币量的期望益损
10、值不能完全反映随机事件的风险程度。运筹学教程 同一随机事件对不同的决策者的吸引力可能完全不同,因此可采用不同的决策。这与决策者个人的气质、冒险精神、经济状况、经验等等主观因素有很大的关系。即使同一个人在不同情况下对同一随机事件也会采用不同的态度。当我们以期望益损值(以货币值为度量)作决策准则时,实际已经假定期望益损值相等的各个随机事件是等价的,具有相同的风险程度,且对不同的人具有相同的吸引力。但对有些问题这个假定是不合适的。因此不能采用货币度量的期望益损值作决策准则,而用所谓“效用值”作决策准则。效用是一个属于主观范畴的概念,效用是因人、因事、因地而发生变化的。运筹学教程效用与效用函数v为定量
11、地描述决策者对风险的偏好和厌恶程度。用效用来衡量同一期望值在不同人主观上的价值(满意程度的衡量尺度)。习惯上,效用最大为1,最小为0v一个决策者对不同期望值的效用值,构成了一条效用曲线U(X)。它描述了特定的期望损益值水平和与之相对应的满足程度之间的关系。效用函数的确定v直接提问:v收入2万您是满意的,收入增加到多少,您会加倍满意?v心理试验法 首先确定甲、乙两个方案,询问决策者选择哪一个方案。甲:以概率P得到a元,或以(1P)的概率损失b元;乙:无风险稳得c元;(acb)如果决策者认为甲、乙两方案等价时有:p U(a)+(1-p)U(b)=U(c)运筹学教程a,b,c,p四个变量中,已知任意
12、三个,向决策者提问第四个变量应取何值?如此反复回答,便可绘制出该决策者的效用曲线。常用的提问:固定a,b,p(0.5)值,问决策者c取何值时甲、乙两方案等价。0.5U(a)+0.5U(b)=U(X)1U(X)X0a0b0b2b1a1运筹学教程例8:效用曲线的确定 0.5U(a)+0.5U(b)=U(C)最大收益 a0=200,最小收益 b0100 根据约定:U(200)=1,U(-100)=0第一次提问:C取多少时,稳拿c的方案与相同的可能性获得最大收益和最小收益的方案是等价的?若回答为C=0,则有U(0)=0.5 U(200)+U(-100)=1/2;第二次提问:C取多少时,稳拿C的方案与相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 课件 三节 不确 定型 决策 方法
限制150内