newv3决策分析--不确定决策以及效用函数wbu.pptx
《newv3决策分析--不确定决策以及效用函数wbu.pptx》由会员分享,可在线阅读,更多相关《newv3决策分析--不确定决策以及效用函数wbu.pptx(110页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、决策分析v决策分析的基本问题v风险性决策问题v不确定决策问题v效用函数法v层次分析法第三节 不确定型决策方法不确定型决策问题须具备以下几个条件:有一个决策希望达到的目标(如收益最大或损失较小)。存在两个或两个以上的行动方案。存在两个或两个以上的自然状态,但是既不能确定未来和中自然状态必然发生,又无法得到各种自然状态在未来发生的概率。每个行动方案在不同自然状态下的益损值可以计算出来。对于不确定型决策问题,有一些常用的决策方法,或称为不确定型决策准则。分别适用于具有不同心理状态、冒险精神的人。一。悲观准则(max-min 准则)悲观准则又称华尔德准则或保守准则,按悲观准则决策时,决策者是非常谨慎保
2、守的,为了“保险”,从每个方案中选择最坏的结果,在从各个方案的最坏结果中选择一个最好的结果,该结果所在的方案就是最优决策方案。例5 设某决策问题的决策收益表为 状态方案 42533547556636579 58542333所以 为最优方案。因二。乐观准则(max-max 准则)当决策者对客观状态的估计持乐观态度时,可采用这种方法。此时决策者的指导思想是不放过任何一个可能获得的最好结果的机会,因此这是一个充满冒险精神的决策者。一般的,悲观准则可用下式表示试按悲观准则确定其决策方案。一般的,乐观准则可用下式表示 状态方案 42533547556636579 58579785例5 设某决策问题的决策
3、收益表为试按乐观准则确定其决策方案。所以 为最优方案。因三。折衷准则折衷准则又称乐观系数准则或赫威斯准则,是介于悲观准则与乐观准则之间的一个准则。若决策者对客观情况的评价既不乐观也不悲观,主张将乐观与悲观之间作个折衷,具体做法是取一个乐观系数(01)来反映决策者对状态估计的乐观程度,计算公式如下 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按折衷准则确定其决策方案。解:若取乐观系数 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为 状态方案 42533547556636579 5856.47.66.27.04.6例5
4、 设某决策问题的决策收益表为四。等可能准则等可能准则又称机会均等法或称拉普拉斯(Laplace)准则,它是19世纪数学家 Laplace 提出的。他认为:当决策者面对着n种自然状态可能发生时,如果没有充分理由说明某一自然状态会比其他自然状态有更多的发生机会时,只能认为它们发生的概率是相等的,都等于1/n。计算公式如下 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按等可能准则确定其决策方案。解:按等可能准则此一问题的每种状态发生的概率为 状态方案 42533547556636579 5855.505.255.005.504.50因有两个最大期望益损值方案
5、,哪一个更优?考虑它们的界差:界差越小,方案越优。状态方案 42533547556636579 5855.505.255.005.504.50因故方案1为最优方案。五。遗憾准则遗憾准则又称最小最大沙万奇(Savage)遗憾准则或后悔准则。当决策者在决策之后,若实际情况并不理想,决策者有后悔之意,而实际出现状态可能达到的最大值与决策者得到的收益值之差越大,决策者的后悔程度越大。因此可用每一状态所能达到的最大值(称作该状态的理想值)与其他方案(在同一状态下)的收益值之差定义该状态的后悔值向量。对每一状态作出后悔值向量,就构成后悔值矩阵。对后悔值矩阵的每一行即对应每个方案求出其最大值,再在这些最大值
6、中求出最小值所对应的方案,即为最优方案。计算公式如下最优方案为先取每一列中最大值,用这一最大值减去这列的各个元素。再取结果的最大值。状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按遗憾准则确定其决策方案。解:先计算后悔值矩阵:状态方案 42533547556636579 585 状态方案 13022230220030120 4142*342*4后悔值矩阵最优方案为1或4。方案准则 悲观准则乐观准则折衷准则等可能准则遗憾准则一般来讲,被选中多的方案应予以优先考虑。设某工厂以批发方式销售它所生产的产品,每件产品的成本为 0.03元,批发价格每件0.05元。若
7、每天生产的产品当天销售不 完,每件要损失0.01元。某工厂每天的产量可以是0、1000、2000、3000、4000件,每 天的批发销售量,根据市场的需要可能为0、1000、2000、3000、4000件。(a)试建立收益矩阵(b)试用悲观、乐观及等可能准则决定该工厂的产量课堂举例每件产品的成本为0.03元,批发价格每件0.05元。若每天生产的产品当天销售不完,每件要损失0.01元。工厂的益损矩阵 如下表所示方案 状态市场需要量0 1000 2000 3000 4000产量0100020003000400000 0 0 0 1020 20 20 2020 10 4040 4030 0 3060
8、 6040 10 2050 80方案 状态 市场需要量0 1000 2000 3000 4000产量00 0 0 0 01000-10 20 20 20 202000-20 10 40 40 403000-30 0 30 60 604000-40-10 20 50 80按悲观准则确定其决策方案:0 010 10203040203040max=0 即 A1 为最优方案min 0,0,0,0,0=0min 10,20,20,20,20=10min 20,10,40,40,40=20min 30,10,30,60,60=30min 40,10,20,50,80=40按乐观准则确定其决策方案:方案 状
9、态 市场需要量0 1000 2000 3000 4000产量00 0 0 0 01000-10 20 20 20 202000-20 10 40 40 403000-30 0 30 60 604000-40-10 20 50 800 020 2040608040608080max=80 即 A5 为最优方案max 0,0,0,0,0=0max 10,20,20,20,20=20max 20,10,40,40,40=40max 30,10,30,60,60=60max 40,10,20,50,80=80按等可能准则确定其决策方案:方案 状态 市场需要量0 1000 2000 3000 4000产
10、量00 0 0 0 01000-10 20 20 20 202000-20 10 40 40 403000-30 0 30 60 604000-40-10 20 50 80期望值解:按等可能准则此问题的每种状态发生的概率为P(Sj)=1/n=1/5=0.2 j=1,2,3,4,5方案 状态 市场需要量0 1000 2000 3000 4000产量00 0 0 0 01000-10 20 20 20 202000-20 10 40 40 403000-30 0 30 60 604000-40-10 20 50 80期望值0142220E(A1)(00000)/5=0E(A2)(102020202
11、0)/5=14E(A3)(2010404040)/5=22E(A4)(3010306060)/5=26E(A5)(4010205080)/5=20故 A4 为最优方案2626【P239 11.1】某书店希望订购最新出版的好图书出售。根据以往经验,新书的销售量可能为50、100、150或200本。假定每本书的订购价为4元,销售价为6元,剩书处理价为每本2元。要求:(a)建立收益矩阵(b)依据悲观主义、乐观主义及等可能性决策准则,决定该 书店应订购新书的数量课堂练习(a)益损矩阵如下表方案 状态销售量50 100 150 200订购量50100150200每本书的订购价为4元,销售价 为6元,剩书
12、处理价为每本2元。若订购量为50本:销售量为50,则 a11=(6 4)50 100销售量为100,则 a12=100销售量为150,则 a13=100销售量为200,则 a14=100100 100 100 100若订购量为100本:销售量为50,则 a21=(6 4)50(2 4)50 0销售量为100,则 a22=(6 4)100=200销售量为150,则 a23=200销售量为200,则 a24=2000 200 200 200100 100 300 3002000 200 400(b)悲观主义方案 状态销售量50 100 150 200订购量50100150200100 100 10
13、0 1000 200 200 200100 100 300 300200 0 200 400max=100 即 A1 为最优方案1000100200min 100,100,100,100=100min 0,200,200,200=0min 100,100,300,300=100min 200,0,200,400=200100(b)乐观主义方案 状态销售量50 100 150 200订购量50100150200100 100 100 1000 200 200 200100 100 300 300200 0 200 400max=400 即 A4 为最优方案100200300400max 100,
14、100,100,100=100max 0,200,200,200=200max 100,100,300,300=300max 200,0,200,400=400400(c)等可能性决策方案 状态销售量50 100 150 200订购量50100150200100 100 100 1000 200 200 200100 100 300 300200 0 200 400期望值100150150100150E(S1)(100100100100)/4=100E(S2)(0200200200)/4=150E(S3)(100100300300)/4=150E(S4)(2000200400)/4=100故
15、S2 或 S3 为最优方案1504 效用函数法一。效用概念的引入前面介绍风险型决策方法时,提到可根据期望益损值(最大或最小)作为选择最优方案的原则,但这样做有时并不一定合理。请看下面的例子:例6设有两个决策问题:问题1:方案A1:稳获100元;方案B1:用掷硬币的方法,掷出正面获得250元,掷出反面获得0元。问题2:方案A2:稳获1000元;方案B2:用掷硬币的方法,直到掷出正面为止,记所掷次数为N,则当正面出现时,可获2N元.当你遇到这两类问题时,如何决策?大部分会选择 A1 和 A2。但不妨计算一下其期望值:Y10 250P(Y1=k)1/2 1/2方案B1的收益为随机变量Y1。则其期望收
16、益为:设方案B2的收益为随机变量Y2。Ai=“第i次掷出正面”,则第n次掷出正面的概率为:Y22 2223 2nP(Y2=k)1/2 1/221/23 1/2nX 0 1 2 n-1 相互独立设掷出正面前掷出反面的次数为随机变量X,则有分布率:则方案2的平均收益为:Y22 2223 n P(Y2=k)1/2 1/221/23 1/2nX 0 1 2 n-1 于是,根据期望收益最大原则,应选择B1和B2,但这一结果很难令实际决策者接受。此乃研究效用函数的初衷。例7(赌一把)一个正常的人,遇到“赌一把”的机会。情况如下面的树,问此人如何决策?正常人B赌不赌45元掷出正面P=0.5-10元P=0.5
17、0100元掷出反面10元对绝大部分人来说,只要兜里有10元钱,又不急用的话,就选择“赌”。因此时“赌”的平均收益为:以上例子说明:相同的期望益损值(以货币值为度量)的不同随机事件之间其风险可能存在着很大的差异。即说明货币量的期望益损值不能完全反映随机事件的风险程度。同一随机事件对不同的决策者的吸引力可能完全不同,因此可采用不同的决策。这与决策者个人的气质、冒险精神、现假设这个人是个穷人,10元钱是他一家三天的口粮钱,而且他仅有10元钱。这时,他宁肯用这10元钱来买全家三天的口粮,不致挨饿,而不愿去冒投机的风险。经济状况、经验等等主观因素有很大的关系。即使同一个人在不同情况下对同一随机事件也会采
18、用不同的态度。当我们以期望益损值(以货币值为度量)作决策准则时,实际已经假定期望益损值相等的各个随机事件是等价的,具有相同的风险程度,且对不同的人具有相同的吸引力。但对有些问题这个假定是不合适的。因此不能采用货币度量的期望益损值作决策准则,而用所谓“效用值”作决策准则。二。效用曲线的确定及分类老王B二次抽奖一次500元P=0.50元P=0.5500元1000元500元 为了讲清“效用”与“效用值”的概念,看下例例 老王参加某电视台综艺节目而得奖。他有两种方式可选择:一次获得500元奖金。分别以概率 0.5 与 0.5的机会抽奖可获得1000元与0元。试问老王该选择何种方式领奖?事件 的期望益损
19、值都是500元,但有人认为应选择他认为 的“价值”比 大,有的相反。都是“主观价值”。此时他认为事件 的效用比事件 来的大。如何来度量随机事件的效用(或说“价值”)?我们用“效用值”u来度量效用值的大小。“效用值”是一个“主观价值”,且是一个相对大小的值。通常假定决策者可能得到的最大收益相应的效用值为1,而可能得到的最小收益值(或最大损失值)相应的效用值为0。一般来说,若用 r 来表示期望收益值(这里收益值作广义理解,不一定是货币量,也可以是某事件的结果),则r的效用值用 来表示。因此有那么,当 时如何计算呢?一般用心理测试的方法来确定,具体做法是:反复向决策者提出下面的问题:“如果事件 是以
20、概率P得到收益为,以概率(1-P)得到收益为,事件 是以100%概率得到收益为 你认为 取多大值时,事件 与事件 是相当的(即认为效用值相等)?如果决策者经过思考后,认为 时 两事件效果是相当的,即有当,已知时,则 的效用值可求出。如当 则 则可求出再作出同样的问题来问决策者,则可在 两点中求出一点的效用值。如此继续,可得到在 及 中间的一系列 的效用值。再以 作横坐标,作纵坐标可得该决策者的效用曲线。举例如下。的效益值。例 设某决策者在股票交易所购买股票,现有两种选择:选择股票01号,预计每手(100股)可能分别以概率0.5获利200元,概率0.5 损失100元。选择股票02号,预计每手(1
21、00股)可能分别以概率1.0获利25元。试问该决策者应选择何种方式购买股票?用心理测试法对该决策者提问:对上述事件,问决策者愿意选择何种方式?若决策者选择,则降低 到20元,若还选择则在降低,若降至0元(即不赔不赚)时,决策者犹豫不定,说明决策者01号股票02号股票P=0.5-100元P=0.5?元200元B1B2P=1.0此时随机事件 的效用值与 相等。决策者01号股票02号股票0.5P=0.5-100元P=0.50元200元求出 时的效益值:得到效用曲线的三点。B1B2P=1.00.5决策者01号股票02号股票0.75P=0.50元P=0.5?元200元选择股票02号,预计每手(100股)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- newv3 决策 分析 不确定 以及 效用 函数 wbu
限制150内