《贝叶斯决策分析教材.pptx》由会员分享,可在线阅读,更多相关《贝叶斯决策分析教材.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 贝叶斯决策分析贝叶斯决策分析5.1贝叶斯决策的基本方法贝叶斯决策的基本方法5.1.1贝叶斯决策的基本方法贝叶斯决策的基本方法n管理决策的两种偏向:管理决策的两种偏向:(1)缺少调查,缺少调查,(2)调调查费用过高。查费用过高。贝叶斯决策:贝叶斯决策:为了提高决策质量,需要通过为了提高决策质量,需要通过市场调查,收集有关状态变量的补充信息,市场调查,收集有关状态变量的补充信息,对先验分布进行修正,用后验状态分布进行对先验分布进行修正,用后验状态分布进行决策。决策。贝叶斯决策的意义贝叶斯决策的意义贝叶斯决策贝叶斯决策可以做到少花钱多办事,提高决可以做到少花钱多办事,提高决策分析的科学
2、性和效益性。策分析的科学性和效益性。有关的概率公式有关的概率公式离散情况离散情况设有完备事件组设有完备事件组j(j=1,2,n),满),满足:足:则对任一随机事件则对任一随机事件H,有,有全概率公式:全概率公式:有关的概率公式有关的概率公式贝叶斯公式:贝叶斯公式:5.1贝叶斯决策的基本方法贝叶斯决策的基本方法5.1.2 贝叶斯决策的基本方法贝叶斯决策的基本方法n补充信息(信息值)补充信息(信息值)指通过市场调查分析所获取的补充信息,指通过市场调查分析所获取的补充信息,用已发生的随机事件用已发生的随机事件H或已取值的随机变量或已取值的随机变量表示,称表示,称H或或为信息值。为信息值。信息值的可靠
3、程度信息值的可靠程度用在状态变量用在状态变量的条件下,信息值的条件下,信息值H的条件的条件分布分布p(H/)表示。表示。5.1.2 贝叶斯决策的基本方法贝叶斯决策的基本方法离散情形离散情形若若取取n个值个值j(j=l,2,n),),H取取m个值个值Hi(i1,2,m),则信息值的可靠程度对),则信息值的可靠程度对应一个矩阵应一个矩阵贝叶斯决策的似然分布矩阵贝叶斯决策的似然分布矩阵5.1.2 贝叶斯决策的基本方法贝叶斯决策的基本方法利用市场调查获取的补充信息值利用市场调查获取的补充信息值Hi 或或去修去修正状态变量正状态变量的先验分布,即依据似然分布的先验分布,即依据似然分布矩阵所提供的充分信息
4、,用贝叶斯公式求出矩阵所提供的充分信息,用贝叶斯公式求出在信息值在信息值H或或发生的条件下,状态变量发生的条件下,状态变量的的条件分布条件分布 p(/H)。先验概率先验概率p():由以往的数据分析得到的:由以往的数据分析得到的概率;概率;后验概率后验概率p(/H):在得到信息之后,重新:在得到信息之后,重新加以修正的概率。加以修正的概率。贝叶斯决策的基本步骤贝叶斯决策的基本步骤1.验前分析验前分析n n依据数据和资料以及经验和判断,去测算和依据数据和资料以及经验和判断,去测算和估计状态变量估计状态变量的先验分布的先验分布p();vv计算各可行方案在不同计算各可行方案在不同下的条件结果值;下的条
5、件结果值;vv根据某种决策准则评价选择,找出最满意方根据某种决策准则评价选择,找出最满意方案。案。2.预验分析预验分析比较分析补充信息的价值和成本的过程。比较分析补充信息的价值和成本的过程。目的:目的:判断是否值得去补充信息?判断是否值得去补充信息?贝叶斯决策的基本步骤贝叶斯决策的基本步骤2.预验分析预验分析判断:判断:如果如果信息的价值信息的价值高于其高于其成本成本,则补充信,则补充信息给企业带来正效益,应该补充信息反之,息给企业带来正效益,应该补充信息反之,补充信息大可不必。补充信息大可不必。注:注:如果获取补充信息的费用很小,甚至可以如果获取补充信息的费用很小,甚至可以忽略不计,本步骤可
6、以省略,直接进行调查忽略不计,本步骤可以省略,直接进行调查和收集信息,并依据获取的补充信息转入下和收集信息,并依据获取的补充信息转入下一步骤。一步骤。贝叶斯决策的基本步骤贝叶斯决策的基本步骤3.验后分析验后分析n n利用利用补充信息补充信息修正修正先验分布先验分布,得到更加符合实际得到更加符合实际的的后验分布后验分布;n n再利用后验分布进行决策分析,选出最满意的再利用后验分布进行决策分析,选出最满意的可行方案;可行方案;n n对信息的价值和成本作对比分析,对决策分析对信息的价值和成本作对比分析,对决策分析的经济效益情况作出合理的说明的经济效益情况作出合理的说明验后分析和预验分析的异同:验后分
7、析和预验分析的异同:相同:相同:都是通过贝叶斯公式修正先验分布都是通过贝叶斯公式修正先验分布不同:不同:主要在于侧重点不同主要在于侧重点不同贝叶斯决策的基本步骤贝叶斯决策的基本步骤4.序贯分析序贯分析(主要针对多阶段决策)(主要针对多阶段决策)指把复杂的决策问题的决策分析全过程划分指把复杂的决策问题的决策分析全过程划分为若干阶段,每一阶段都包括为若干阶段,每一阶段都包括先验分析先验分析、预预验分析验分析和和验后分析验后分析等步骤等步骤,每个阶段前后相每个阶段前后相连连,形成决策分析全过程形成决策分析全过程p129例例5.1某工厂计划生产一种新产品,产品的销售情某工厂计划生产一种新产品,产品的销
8、售情况有畅销(况有畅销(1),),滞滞销销(2)两种两种,据以往,据以往的的经验经验,估,估计计两种两种情情况况发发生的生的概概率分布和利率分布和利润润如下表所示如下表所示:状态状态状态状态畅销(畅销(畅销(畅销(1 1 1 1)滞滞滞滞销销销销(2 2 2 2)概率概率概率概率P P(i i)0.8 0.8 0.2 0.2利润(万元)利润(万元)利润(万元)利润(万元)1.5 1.5 0.50.5p129例例5.1为了进一步摸清市场对这种产品的需求情况,为了进一步摸清市场对这种产品的需求情况,拟聘请某咨询公司进行市场调查和分析,该拟聘请某咨询公司进行市场调查和分析,该公司对销售情况预测也有畅
9、销公司对销售情况预测也有畅销(H1)和滞销和滞销(H2)两种,对畅销预测的准确率为两种,对畅销预测的准确率为0.95,对,对滞销预测的准确率为滞销预测的准确率为0.9:P P(HHi i/j j)1 1 1 1 2 2 2 2HH1 10.95 0.100.95 0.10HH2 20.05 0.900.05 0.90p129例例5.1解:解:1、验前分析、验前分析记方案记方案a1 为生产该新产品,方案为生产该新产品,方案a2 为不生产。为不生产。则:则:E(a1)=1.1(万元)(万元),E(a2)=0记验前分析的最大期望收益值为记验前分析的最大期望收益值为E1,有:,有:E1maxE(a1)
10、,E(a2)=1.35。因此验前分析后的决策为:因此验前分析后的决策为:生产该新产品生产该新产品。即:即:aopt a1E1为不作市场调查的期望收益。为不作市场调查的期望收益。p129例例5.12、预验分析:、预验分析:由全概率公式由全概率公式得:得:p129例例5.12、预验分析:、预验分析:再由再由贝叶斯公式贝叶斯公式得:得:p129例例5.12、预验分析:、预验分析:用用后验分布代替先验分布后验分布代替先验分布,计算各方案的,计算各方案的期期望收益值望收益值。vv当市场调查值为当市场调查值为 H1(产品畅销)时:(产品畅销)时:aopt(H1)a1即:市场调查畅销时,最即:市场调查畅销时
11、,最优方案是优方案是生产该新产品生产该新产品。p129例例5.12、预验分析:、预验分析:vv当市场调查值为当市场调查值为 H2(产品滞销)时:(产品滞销)时:aopt(H1)a2即:市场调查滞销时,最优方案是即:市场调查滞销时,最优方案是不生产该不生产该新产品新产品。p129例例5.1是否该进行市场调查?是否该进行市场调查?假定咨询公司收费为假定咨询公司收费为0.1万元。万元。2、预验分析:、预验分析:通过调查,该企业可获得的收益期望值为通过调查,该企业可获得的收益期望值为:因此,只要调查费用不超过因此,只要调查费用不超过0.0301万元,就应万元,就应该进行市场调查;否则,则不应进行市场调
12、查。该进行市场调查;否则,则不应进行市场调查。不应进行调查不应进行调查通过调查,该企业收益期望值能增加。通过调查,该企业收益期望值能增加。p129例例5.13、验后分析验后分析:综上所述,综上所述,v在咨询公司收费不超过在咨询公司收费不超过0.0301万元的情况下,万元的情况下,进行市场调查,能使该企业新产品开发决进行市场调查,能使该企业新产品开发决策取得较好的经济效益;否则,不做市场策取得较好的经济效益;否则,不做市场调查。调查。v若调查结果是该若调查结果是该产品畅销产品畅销,则应该选择方,则应该选择方案案a1,即,即生产新产品生产新产品;v若调查结果是该若调查结果是该产品滞销产品滞销,则应
13、该选择方,则应该选择方案案a2,即,即不生产不生产新产品。新产品。p132例例5.2某企业为开发某种新产品需要更新设备,有某企业为开发某种新产品需要更新设备,有三种方案可供选择:引进大型设备三种方案可供选择:引进大型设备(a1)、引、引进中型设备进中型设备(a2)、引进小型设备、引进小型设备(a3)。市场。市场对该新产品的需求状态也有三种:需求量大对该新产品的需求状态也有三种:需求量大(1)、需求量一般、需求量一般(2)、需求量小、需求量小(3)。根据市场预测,企业的收益矩阵如下(单。根据市场预测,企业的收益矩阵如下(单位:万元):位:万元):例例5.2根据历年资料,该产品各需求状态的概率分根
14、据历年资料,该产品各需求状态的概率分别为别为p(1)=0.3,p(2)=0.4,p(3)=0.3。为。为使新产品开发产销对路,该拟试销作市场调使新产品开发产销对路,该拟试销作市场调查,试销结果可能有三种:需求量大查,试销结果可能有三种:需求量大(H1)、需求量一般需求量一般(H2)、需求量小、需求量小(H3)。调查结果。调查结果值的可靠性如下表所示:值的可靠性如下表所示:试对该企业新产品开发方案进行决策。试对该企业新产品开发方案进行决策。P P(HHi i/j j)1 1 1 1 2 2 2 2 3 3 3 3HH1 10.6 0.20.6 0.20.20.2HH2 20.3 0.50.3 0
15、.50.20.2HH3 30.1 0.30.1 0.30.60.6p132例例5.2解:解:1、验前分析、验前分析E1maxE(a1),E(a2),E(a3)=17因此验前分析后的决策为:因此验前分析后的决策为:引进大型设备引进大型设备。即:即:aopt a1E1为不进行试销(市场调查)的期望收益。为不进行试销(市场调查)的期望收益。p132例例5.22、预验分析:、预验分析:由全概率公式由全概率公式得:得:p132例例5.22、预验分析:、预验分析:再由再由贝叶斯公式贝叶斯公式得:得:p132例例5.2p132例例5.22、预验分析:、预验分析:用用后验分布代替先验分布后验分布代替先验分布,
16、计算各方案的,计算各方案的期期望收益值望收益值。vv当市场调查值为当市场调查值为 H1(需求量大)时:(需求量大)时:P P(j j/H Hi i)1 1 1 1 2 2 2 2 3 3 3 3HH1 10.5625 0.25 0.5625 0.25 0.18750.1875HH2 20.2571 0.57140.2571 0.57140.17150.1715HH3 30.0909 0.36360.0909 0.36360.54550.5455p132例例5.2aopt(H1)a1即:试销为产品需求量大时,最优方案是即:试销为产品需求量大时,最优方案是引进引进大型设备。大型设备。P P(j j
17、/H Hi i)1 1 1 1 2 2 2 2 3 3 3 3HH1 10.5625 0.25 0.5625 0.25 0.18750.1875HH2 20.2571 0.57140.2571 0.57140.17150.1715HH3 30.0909 0.36360.0909 0.36360.54550.5455p132例例5.2vv当市场调查值为当市场调查值为 H2(需求量一般)时:(需求量一般)时:aopt(H2)a1即:试销为产品需求量一般时,最优方案也是即:试销为产品需求量一般时,最优方案也是引进大型设备。引进大型设备。vv当市场调查值为当市场调查值为 H3(需求量小)时:(需求量小
18、)时:aopt(H2)a3即:试销为产品需求量小时,最优方案是即:试销为产品需求量小时,最优方案是引进引进小型设备。小型设备。p132例例5.2p132例例5.23、验后分析:、验后分析:通过试销,该企业可获得的收益期望值为通过试销,该企业可获得的收益期望值为:该企业收益期该企业收益期望值能增加:望值能增加:只要试销所需费用不超过只要试销所需费用不超过3万元,就应该进行万元,就应该进行市场调查;否则,则不应进行试销。市场调查;否则,则不应进行试销。p132例例5.23、验后分析验后分析:v在试销费用不超过在试销费用不超过3万元的情况下,进行试万元的情况下,进行试销,能使该企业新产品开发决策取得
19、较好销,能使该企业新产品开发决策取得较好的经济效益;若试销费用不超过的经济效益;若试销费用不超过3万元,则万元,则不应进行试销。不应进行试销。v若试销结果是该若试销结果是该产品需求量大产品需求量大或或一般一般,则,则应该选择方案应该选择方案a1,即,即引进大型设备引进大型设备;v若调查结果是该若调查结果是该产品需求量小产品需求量小,则应该选,则应该选择方案择方案a3,即,即引进小型设备引进小型设备。5.2 贝叶斯决策信息的价值贝叶斯决策信息的价值从前面的分析看出,利用补充信息来修正从前面的分析看出,利用补充信息来修正先验概率,可以使决策的准确度提高,从先验概率,可以使决策的准确度提高,从而提高
20、决策的科学性和效益性。因此,信而提高决策的科学性和效益性。因此,信息本身是有价值的息本身是有价值的能带来收益。能带来收益。但获得的情报越多,花费也更多。但获得的情报越多,花费也更多。因此有一个获取补充信息是否有利的问题:因此有一个获取补充信息是否有利的问题:收益与成本的比较。收益与成本的比较。问题:问题:如何衡量信息的价值?如何衡量信息的价值?5.2 贝叶斯决策信息的价值贝叶斯决策信息的价值5.2.1完全信息的价值(完全信息的价值(EVPI)n完全情报:完全情报:指能够提供状态变量真实情况的指能够提供状态变量真实情况的补充信息。即在获得补充情报后就完全消补充信息。即在获得补充情报后就完全消除了
21、风险情况,风险决策就转化为确定型除了风险情况,风险决策就转化为确定型决策。决策。1.完全信息值完全信息值设设Hi 为补充信息值,若存在状态值为补充信息值,若存在状态值0,使,使得条件概率得条件概率P(0/Hi)=1,或者当状态值,或者当状态值 0时,总有时,总有P(/Hi)=0。则称信息值。则称信息值Hi为为完全信息值。完全信息值。(补充信息可靠性(补充信息可靠性100%)5.2.1完全信息的价值(完全信息的价值(EVPI)2.完全信息值完全信息值Hi的价值的价值设决策问题的收益函数为设决策问题的收益函数为Q=Q(a,),其中,其中a为行动方案,为行动方案,为状态变量。为状态变量。若若Hi为完
22、全信息值,掌握了为完全信息值,掌握了Hi的最满意的行的最满意的行动方案为动方案为a(Hi),其收益值为,其收益值为Q(a(Hi),),)maxQ(a,)验前最满意行动方案为验前最满意行动方案为aopt,其收益值为其收益值为Q(aopt,),则称掌握了完全信息值,则称掌握了完全信息值Hi前后前后的收益值增量:的收益值增量:为在状态变量为为在状态变量为时的完全信息值时的完全信息值Hi的价值。的价值。5.2.1完全信息的价值(完全信息的价值(EVPI)3.完全信息价值完全信息价值如果补充信息值如果补充信息值 Hi对每一个状态值对每一个状态值都是都是完全信息值,则完全信息值完全信息值,则完全信息值Hi
23、 对状态对状态的的期望收益值称为完全信息价值的期望值期望收益值称为完全信息价值的期望值(expected value of perfect information),简简称完全信息价值,记做称完全信息价值,记做EVPI。5.2.1完全信息的价值(完全信息的价值(EVPI)在在例例5.1中中如果补充信息如果补充信息(咨询公司市场调查咨询公司市场调查)的准确的准确度很高,预测畅销,则度很高,预测畅销,则100%畅销;预测滞畅销;预测滞销,则销,则100%滞销;这时:滞销;这时:P P(1 1/HH1 1)=1=1,P P(2 2/HH1 1)=0=0 P P(1 1/HH2 2)=0=0,P P(
24、2 2/HH2 2)=1=1 则则H1(咨询公司预测畅销)(咨询公司预测畅销)、H2(咨询公司(咨询公司预测滞销)预测滞销)都是都是完全信息值完全信息值(完全情报完全情报)。5.2.1完全信息的价值(完全信息的价值(EVPI)在例在例5.1中,若中,若H1、H2都是都是完全信息值完全信息值验前最满意行动方案为验前最满意行动方案为a1(生产新产品生产新产品)完全信息值完全信息值H1的价值的价值=1.5-=1.5-Q Q(a a1 1,1 1)=)=)=)=1.5-1.5=01.5-1.5=0完全信息值完全信息值H2的价值的价值=0-=0-Q Q(a a1 1,2 2)=)=)=)=0-0-(-0
25、.5-0.5)=0.5=0.5完全信息价值为:完全信息价值为:状态状态状态状态畅销(畅销(畅销(畅销(1 1 1 1)滞滞滞滞销销销销(2 2 2 2)概率概率概率概率P P(i i)0.8 0.8 0.20.2利润(万元)利润(万元)利润(万元)利润(万元)1.5 1.5 0.50.55.2.2补充信息的价值(补充信息的价值(EVAI)1.补充信息价值补充信息价值实际工作中取得完全情报是非常困难的。实际工作中取得完全情报是非常困难的。n补充信息值补充信息值Hi 的价值:的价值:决策者掌握了补充决策者掌握了补充信息值信息值 Hi前后期望收益值的增加量前后期望收益值的增加量(或期望或期望损失值的
26、减少量损失值的减少量)。补充信息价值:补充信息价值:全部补充信息值全部补充信息值Hi 价值的期价值的期望值,称为补充信息价值的期望值。简称望值,称为补充信息价值的期望值。简称补补充信息价值充信息价值,记做,记做EVAI(Expected Value of Additional Information)。)。2、补充信息价值(、补充信息价值(EVAI)的计算)的计算公式公式1:其中:其中:a()表示在信息表示在信息值下的最下的最满意方案,意方案,E/表示在信息值表示在信息值的条件下对状态值的条件下对状态值求收求收益期望值。益期望值。公式公式2:公式公式3:R(a,)表示决策问题的损失函数表示决策
27、问题的损失函数例例5.1中:中:验前最满意行动方案为验前最满意行动方案为a1(生产新生产新产品产品)E(aopt,)=)=E(a1,)=)=1.1万元万元a(H1)=a1,a(H2)=a2EVAI=1.13-1.1=0.03万元万元5.2.3EVAI 与与EVPI 的关系的关系任何补充信息价值都是非负的,且不超过完任何补充信息价值都是非负的,且不超过完全信息的价值。全信息的价值。即:即:EVPIEVAI0信息价值对管理决策的意义信息价值对管理决策的意义任何补充信息决不会降低决策方案的经济效任何补充信息决不会降低决策方案的经济效益!益!完全信息是一类特殊的补充信息,是价值的完全信息是一类特殊的补
28、充信息,是价值的信息。信息。5.3抽样贝叶斯决策抽样贝叶斯决策问题:如何获取补充信息问题:如何获取补充信息?主要途径:抽样调查主要途径:抽样调查5.3.1抽样贝叶斯决策的基本方法抽样贝叶斯决策的基本方法1.抽样贝叶斯决策抽样贝叶斯决策利用抽样信息值作为补充信息值,去修正利用抽样信息值作为补充信息值,去修正状态变量的先验分布,得到后验分布,再状态变量的先验分布,得到后验分布,再依据后验分布进行的贝叶斯决策。依据后验分布进行的贝叶斯决策。2.抽样贝叶斯的决策步骤抽样贝叶斯的决策步骤验前分析、预验分析、验后分析验前分析、预验分析、验后分析5.3抽样贝叶斯决策抽样贝叶斯决策例例5.8设某公司的一条生产
29、线成批地生产某设某公司的一条生产线成批地生产某种零件,每批为种零件,每批为800件。现将零件组装成仪件。现将零件组装成仪器,根据过去的统计资料分析,零件的次器,根据过去的统计资料分析,零件的次品率及其相应的概率如表品率及其相应的概率如表52。若组装成。若组装成仪器调试时,发现次品零件则需要更换,仪器调试时,发现次品零件则需要更换,每件更换的改装费为每件更换的改装费为15元。若采取某种技元。若采取某种技术措施,可使每批零件的次品率降到最低术措施,可使每批零件的次品率降到最低为为0.02,但每批要花费技术改造费,但每批要花费技术改造费500元。元。例例5.8进行技术改造进行技术改造之前之前,采取抽
30、样检验,抽取,采取抽样检验,抽取20个零件,发现一个次品。试对该公司是个零件,发现一个次品。试对该公司是否应该采取技术改造措施作出决策分析。否应该采取技术改造措施作出决策分析。表表表表5 52 2状态状态状态状态 j j(次品率)次品率)次品率)次品率)1 1=0.02=0.02 2 2=0.05=0.05 3 3=0.1=0.1 4 4=0.15=0.15 5 5=0.2=0.2概率概率概率概率p p(j j)0.40.40.30.30.150.150.10.10.050.05例例5.8验前分析验前分析方案:方案:不采取技术措施(不采取技术措施(a1),),采取技术措施(采取技术措施(a2)
31、E1minE(a1),E(a2)=740因此验前分析后的决策为:因此验前分析后的决策为:采取采取技术措施。技术措施。即:即:aopt a2例例5.8:预验分析:预验分析如果允许抽样检验,设如果允许抽样检验,设X=“抽取个零件中所抽取个零件中所含废品个数含废品个数”,则:,则:P(X=kj)=C20kjk (1-j)20-k,k=0,1,20,j=1,2,5计算得计算得:P(X=11)=0.2725,P(X=12)=0.3774P(X=13)=0.2702,P(X=14)=0.1368P(X=15)=0.0576例例5.8:预验分析:预验分析后验概率:后验概率:P(1X=1)=0.3903,P(
32、2X=1)=0.4053P(3X=1)=0.1451,P(4X=1)=0.0490P(5X=1)=0.0103两两方案的期望方案的期望费用值:费用值:因此抽到因此抽到1个次品后的决策为:个次品后的决策为:不采取技术措不采取技术措施。施。即:即:aopt a1例例5.8:预验分析:预验分析如果抽样如果抽样20个未抽到废品个未抽到废品P(X=01)=0.6676,P(X=02)=0.3585P(X=03)=0.1216,P(X=04)=0.0388P(X=05)=0.0115后验概率:后验概率:P(1X=0)=0.6722,P(2X=0)=0.2707P(3X=0)=0.0459,P(4X=0)=
33、0.0098P(5X=0)=0.0014例例5.8:预验分析:预验分析如果抽样如果抽样20个未抽到废品个未抽到废品,两两方案的期望方案的期望费费用值:用值:因此若未抽到次品,则决策为:因此若未抽到次品,则决策为:不采取技术措不采取技术措施。施。即:即:aopt a1例例5.8:预验分析:预验分析如果抽样如果抽样20个抽到个抽到2个废品个废品P(X=21)=0.0528,P(X=22)=0.1887P(X=23)=0.2852,P(X=24)=0.2293P(X=25)=0.1369后验概率:后验概率:P(1X=2)=0.1406,P(2X=2)=0.3766P(3X=2)=0.2846,P(4
34、X=2)=0.1526P(5X=2)=0.0456例例5.8:预验分析:预验分析如果抽样如果抽样如果抽样如果抽样2020个抽到个抽到个抽到个抽到2 2个废品个废品个废品个废品,两两两两方案的期望方案的期望方案的期望方案的期望费用值:费用值:费用值:费用值:决策为:决策为:采取技术措施。采取技术措施。即:即:aopt a2。同理,当抽样。同理,当抽样20个抽到的废品个抽到的废品数超过数超过2个时,个时,应选择采取技术措施。应选择采取技术措施。抽样后决策的期望费用为:抽样后决策的期望费用为:比未经抽样就进比未经抽样就进行决策,其费用行决策,其费用可减少:可减少:p148例例5.9某公司降价销售一批
35、某种型号的电子元件,某公司降价销售一批某种型号的电子元件,这种元件一箱这种元件一箱100个,以箱为单位销售。已个,以箱为单位销售。已知这批元件每箱的废品率有三种可能,即知这批元件每箱的废品率有三种可能,即 0.20,0.10,0.05,其相应概率分别是,其相应概率分别是0.5,0.3,0.2。假设该元件正品的市场价格为每。假设该元件正品的市场价格为每箱箱100元,废品不值钱。该公司处理价格每元,废品不值钱。该公司处理价格每箱为箱为85元,遇到废品不予更换。某乡镇企业元,遇到废品不予更换。某乡镇企业正需要购买这种元件,该企业应如何作出决正需要购买这种元件,该企业应如何作出决策?如果该公司允许购买
36、前从每箱中抽取策?如果该公司允许购买前从每箱中抽取 4个元件进行检验,确定所含废品个数,假定个元件进行检验,确定所含废品个数,假定抽样是可放回的,该企业应如何作出决策。抽样是可放回的,该企业应如何作出决策。p148例例5.9验前分析验前分析设设a1,a2分别表示该企业购买和不购买这批分别表示该企业购买和不购买这批元件的可行方案。元件的可行方案。E1maxE(a1),E(a2)=1因此验前分析后的决策为:因此验前分析后的决策为:购买购买该批产品该批产品。即:。即:aopt a1例例5.9:预验分析:预验分析如果允许每箱抽样如果允许每箱抽样4个检验,设个检验,设X=“抽取个抽取个零件中所含废品个数
37、零件中所含废品个数”,则:,则:P(X=kj)=C4kjk (1-j)4-k,k=0,1,4,j=1,2,3计算得计算得:P(X=01)=0.4096 P(X=02)=0.6561 P(X=03)=0.8145例例5.9:预验分析:预验分析后验概率:后验概率:P(1X=0)=0.3628 P(2X=0)=0.3487P(3X=0)=0.2885两两方案的期望方案的期望收益值:收益值:因此若抽样因此若抽样4个未抽取到废品,应个未抽取到废品,应购买该批产购买该批产品。品。即:即:aopt a1例例5.9:预验分析:预验分析P(X=11)=0.4069,P(X=12)=0.2916P(X=13)=0
38、.1715后验概率:后验概率:P(1X=1)=0.6271P(2X=1)=0.2679,P(3X=1)=0.1050因此若抽样因此若抽样4个抽取到个抽取到1个废品,则个废品,则不应购买该不应购买该批产品。批产品。即:即:aopt a2例例5.9:预验分析:预验分析P(X=21)=0.1536,P(X=22)=0.0486P(X=23)=0.0135后验概率:后验概率:P(1X=1)=0.8163P(2X=1)=0.1550,P(3X=1)=0.0287因此若抽样因此若抽样4个抽取到个抽取到2个废品,则个废品,则不应购买该不应购买该批产品。批产品。即:即:aopt a2。同理:抽到废品同理:抽到
39、废品3、4个时,也不应购买该批产品个时,也不应购买该批产品例例5.9:验后分析:验后分析因此若抽样因此若抽样4个未抽取到废品,则应选择购个未抽取到废品,则应选择购买该批产品买该批产品(a1),预期收益为,预期收益为2.815元;否元;否则则不应购买该批产品不应购买该批产品(a2),预期收益为,预期收益为0。抽样的预期收益为:抽样的预期收益为:比未经抽样就进行决策,其收益可增加:比未经抽样就进行决策,其收益可增加:5.3抽样贝叶斯决策抽样贝叶斯决策5.3.2抽样信息的价值抽样信息的价值当补充情报是采用抽样的方法获得时,这种当补充情报是采用抽样的方法获得时,这种补充情报价值习惯上称为抽样情报价值补
40、充情报价值习惯上称为抽样情报价值(Expected Value of Sampling Information)记做记做EVSI。在例在例5.8中中EVSI=E1-E2=167.55(元)(元)在例在例5.9中中EVSI=E2-E1=0.59(元)(元)5.3抽样贝叶斯决策抽样贝叶斯决策5.3.3最佳样本容量最佳样本容量 在抽样贝叶斯决策中,抽样所支付的费用叫在抽样贝叶斯决策中,抽样所支付的费用叫抽样成本。样本容量为抽样成本。样本容量为N时的抽样成本记为时的抽样成本记为C(N)。当样本容量当样本容量N确定以后,抽样情报价值也随确定以后,抽样情报价值也随之而确定。抽样情报价值也是之而确定。抽样情
41、报价值也是N的函数,记的函数,记为为EVSI(N)。v抽样净收益:抽样净收益:ENGS(N)=EVSI(N)-C(N)v最佳样本容量:最佳样本容量:使使ENGS(N)达到最大值)达到最大值的非负整数的非负整数5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.1决策法则决策法则 从补充信息值从补充信息值(或或H)的集合到行动方案集合的集合到行动方案集合A的单值对应称为决策法则。记作:的单值对应称为决策法则。记作:若某个决策问题有若某个决策问题有m个行动方案,有个行动方案,有n个补充个补充信息值,则至多有信息值,则至多有mn个决策法则。个决策法则。最佳决策法则:最佳决策法则:在一个决策问题
42、的所有决策在一个决策问题的所有决策法则中,按照某一原则选出的最佳者,称为该法则中,按照某一原则选出的最佳者,称为该决策问题的最佳决策法则。决策问题的最佳决策法则。5.4.1决策法则决策法则例例5.1中,有两个行动方案:中,有两个行动方案:a1 为生产该新产为生产该新产品,品,a2 为不生产该新产品。为不生产该新产品。有两种补充信息:畅销有两种补充信息:畅销(H1)和滞销和滞销(H2)共有共有4种决策法则:种决策法则:按照期望收益按照期望收益值最大原则选出值最大原则选出的的最佳决策法则最佳决策法则是是2(H)。5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险贝叶斯风险设贝叶
43、斯决策法则设贝叶斯决策法则(),对于状态变量,对于状态变量的任一值,当补充信息值的任一值,当补充信息值确定后,行动方确定后,行动方案案a=()也就相应确定,则对应的损失也就相应确定,则对应的损失值为值为R(),),损失值越小,决策法则越优。损失值越小,决策法则越优。风险函数风险函数(,):损失值损失值R(),)对所有补充对所有补充信息值的信息值的数学期望数学期望。5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险贝叶斯风险风险函数风险函数(,)是在状态值是在状态值下,决策法则下,决策法则对全部补充信息值的平均损失对全部补充信息值的平均损失。例例5.1中,损失矩阵为中,损失矩
44、阵为决策法则决策法则1(H)a1的风险函数值为:的风险函数值为:5.4.2贝叶斯风险贝叶斯风险决策法则决策法则2(H)的风险函数值为:的风险函数值为:同理可求出决策法则同理可求出决策法则3(H)和和4(H)的风险函数的风险函数值:值:5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险贝叶斯风险贝叶斯风险贝叶斯风险 B()对决策法则对决策法则,风险函数,风险函数(,)对状态对状态的数的数学期望,称为决策法则学期望,称为决策法则的贝叶斯风险。的贝叶斯风险。贝叶斯风险贝叶斯风险B()是一个常数,表示决策法是一个常数,表示决策法 则则,对一切补充信息值,对一切补充信息值和状态值和状
45、态值的平的平均损失值。均损失值。5.4.2贝叶斯风险贝叶斯风险例例5.1中中:同理可求出决策法则同理可求出决策法则B(2)、B(3)和和B(4)5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.3贝叶斯原则贝叶斯原则以贝叶斯风险作为评价决策法则优劣的原则以贝叶斯风险作为评价决策法则优劣的原则称为称为贝叶斯原则贝叶斯原则。(以贝叶斯风险小的决策法则为优)(以贝叶斯风险小的决策法则为优)最佳决策法则:最佳决策法则:在贝叶斯原则下,贝叶斯风在贝叶斯原则下,贝叶斯风险最小的决策法则称为险最小的决策法则称为最佳决策法则最佳决策法则。如例如例51中:中:B(2)B(1)B(4)B(3)因此:最优决策法则为因此:最优决策法则为2,这这与之前与之前贝贝叶斯决叶斯决策的策的结论结论完全一致。完全一致。5.4贝叶斯风险和贝叶斯原则贝叶斯风险和贝叶斯原则5.4.3贝叶斯原则贝叶斯原则可以证明:可以证明:贝叶斯决策所得到的决策法则,就贝叶斯决策所得到的决策法则,就是贝叶斯原则下的最佳决策法则是贝叶斯原则下的最佳决策法则。并且,最佳决策法则的贝叶斯风险等于并且,最佳决策法则的贝叶斯风险等于完全信完全信息价值与补充信息价值之差息价值与补充信息价值之差(后验完全信息(后验完全信息价值)。价值)。即:即:B(opt)EVPIEVAI
限制150内