决策分析贝叶斯决策ppt课件.ppt
1 贝叶斯决策贝叶斯决策第一节第一节 先验分布先验分布1.先验概率分布先验概率分布 作决策分析时,最先确定的各种自然状态的概率,它是作决策分析时,最先确定的各种自然状态的概率,它是在做任何实验或调查以前就确定了的。在做任何实验或调查以前就确定了的。2.客观的先验分布客观的先验分布 根据某些客观的情报或证据,对自然状态估计或指定的根据某些客观的情报或证据,对自然状态估计或指定的先验概率先验概率。2表5 由这些资料可以确定未来任何一天的销售量由这些资料可以确定未来任何一天的销售量(即自即自然状态然状态)的概率分布。的概率分布。日销量日销量天数天数频率频率10以下以下1030305050以上以上391530.10.30.50.1例如一个商店的某种商品在过去例如一个商店的某种商品在过去30天内的销售记录如下:天内的销售记录如下:3先验分布例子先验分布例子: :用某一段时间内每批产品所包含的不合格品数目,来估用某一段时间内每批产品所包含的不合格品数目,来估计该产品不合格品率的概率分布;计该产品不合格品率的概率分布;用过去历年秋季广州市火灾的次数,来估计明年秋季火用过去历年秋季广州市火灾的次数,来估计明年秋季火灾次数的概率分布。灾次数的概率分布。 3.主观的先验分布主观的先验分布3.1定义:定义: 决策者小心分析自然状态的各种情况,评估各种自然决策者小心分析自然状态的各种情况,评估各种自然状态出现的可能性大小之后,状态出现的可能性大小之后,主观指定的先验概率分布主观指定的先验概率分布。 43.2指定方法指定方法决策者凭经验,凭预感或直觉去指定这些概率。决策者凭经验,凭预感或直觉去指定这些概率。请教一些银行家、经济学家、市场研究机构等等,综合他们请教一些银行家、经济学家、市场研究机构等等,综合他们的意见后再来指定这些先验概率。的意见后再来指定这些先验概率。5第二节第二节 Bayes定理与后验概率分布定理与后验概率分布1.后验分布后验分布 利用利用Bayes定理将补充信息和先验分布结合起来,产生的定理将补充信息和先验分布结合起来,产生的综合信息。综合信息。2 .Bayes定理定理 设自然状态设自然状态有有k种,分别用种,分别用1,2,k表示表示 P(i)表示自然状态表示自然状态i发生的先验概率分布发生的先验概率分布 用用表示调查结果,表示调查结果, P(|i)表示在状态表示在状态i条件下,调查结果刚好为条件下,调查结果刚好为的概率的概率。后验概率后验概率(BayesBayes公式)公式)为为6 P P(i i)P P(i i)P=P=(i i | |)= = P P(j j)P P(j j) (i=1 2i=1 2,k k) 比先验概率分布更为准确。比先验概率分布更为准确。3 3 Bayes定理定理的应用的应用例例1 1 某自动生产设备在生产过程中可能正常亦可能不某自动生产设备在生产过程中可能正常亦可能不正常,正常时产品的合格率为正常,正常时产品的合格率为80%80%,不正常时产品的合,不正常时产品的合格率为格率为30%30%。从某时刻生产的产品中抽取一件进行检验,。从某时刻生产的产品中抽取一件进行检验,要求我们根据这件产品的情况来判断设备是否正常。要求我们根据这件产品的情况来判断设备是否正常。 设备正常和设备不正常,分别用设备正常和设备不正常,分别用1 1和和2 2表示,先验表示,先验概率为概率为P P(1 1)=0.5 P=0.5 P(2 2)=0.5=0.57情况情况1 1:从某时刻的产品中抽取一件产品,若发现:从某时刻的产品中抽取一件产品,若发现为合格品,即抽样的结果为为合格品,即抽样的结果为=“=“合格品合格品”,这就得到了,这就得到了一种补充的信息,一种补充的信息,P P(合格品合格品| |1 1)=0.8=0.8P P(合格品合格品| |2 2)=0.3=0.3利用利用BayesBayes公式得:公式得: 73. 05 . 03 . 05 . 08 . 05 . 08 . 0|2211111 PPPPPPP合格品合格品合格品合格品合格品合格品合格品合格品8 27. 05 . 03 . 05 . 08 . 05 . 03 . 0|2211222 PPPPPPP合格品合格品合格品合格品合格品合格品合格品合格品即抽得一件产品为合格品后算得设备为正常的概率是即抽得一件产品为合格品后算得设备为正常的概率是0.73,设备不正常的概率为,设备不正常的概率为0.27,故应判断此时设备正,故应判断此时设备正常,即常,即=1 1 9情况情况2:若从某时刻生产的产品中抽到的一件产品为不合格品,利:若从某时刻生产的产品中抽到的一件产品为不合格品,利用用Bayes公式算得公式算得故应判断此时设备不正常,即故应判断此时设备不正常,即=2 22. 05 . 07 . 05 . 02 . 05 . 02 . 0|不合格品|2211111 PPPPPPP不合格品不合格品不合格品不合格品不合格品不合格品 78. 05 . 07 . 05 . 02 . 05 . 07 . 0|2211222 PPPPPPP不合格品不合格品不合格品不合格品不合格品不合格品不合格品不合格品10情况情况3 3:如果从某时刻生产的产品中连续抽取两件产品的结果为如果从某时刻生产的产品中连续抽取两件产品的结果为=“合合合合”,即两件产品皆为合格品,容易算得,即两件产品皆为合格品,容易算得 09. 03 . 03 . 0|64. 08 . 08 . 0|222111 合合合合合合合合合合合合合合合合PPPPPP 877. 05 . 009. 05 . 064. 05 . 064. 0|2211111 PPPPPPP合合合合合合合合合合合合合合合合利用概率的性质得利用概率的性质得 P(2合合合合)=1P(1 1合合合合) =0.123判断此时设备为正常,即判断此时设备为正常,即=1 111情况情况4:抽样结果为:抽样结果为X=“合合不不”, P(合合不不 1 1)=P(合合 1 1) P(不不 1 1) =0.8 0.2=0.16 P(合合不不 2)= P(合合 2) P(不不 2) =0.3 0.7=0.21由由Bayes公式以及概率的性质知公式以及概率的性质知 568. 05 . 021. 05 . 016. 05 . 021. 0|.|.|.|432. 05 . 021. 05 . 016. 05 . 016. 0|.|.|22112222211111 PPPPPPPPPPPPPP不不合合不不合合不不合合不不合合不不合合不不合合不不合合不不合合因此,应判断此时设备不正常因此,应判断此时设备不正常12情况情况5:可以抽出的两件产品皆为不合格品,即可以抽出的两件产品皆为不合格品,即X=“不不不不”,P(1 不不) =0.075 P(2 不不)=0.432若两件产品皆为不合格品,判断此时产品不正常若两件产品皆为不合格品,判断此时产品不正常情况情况6:第一件产品为不合格品,第二件产品为合格品,第一件产品为不合格品,第二件产品为合格品,即即X=“不不合合”的后验概率的后验概率P(1 不合) =0.432 P(2 不合)=0.568判断是此时不正常。判断是此时不正常。很多情况下,容易知道某一事件或实验结果(很多情况下,容易知道某一事件或实验结果(X)在各种在各种状态下发生的概率状态下发生的概率P(X X i i),因此因此,上面的贝叶斯公式很上面的贝叶斯公式很有实用价值。有实用价值。134.全概率公式全概率公式ikiipxpxp1/例二例二 一商店出售某种商品,其货源可能来自甲,乙,丙三一商店出售某种商品,其货源可能来自甲,乙,丙三厂产品的合格率份别是厂产品的合格率份别是95%,92%和和90%,但知道销售甲,但知道销售甲的时间为的时间为20%,销售乙的时间为,销售乙的时间为40%,销售丙的时间为,销售丙的时间为40%那么那么 (1)这种商店出售的这种商品的总合格率为多少?这种商店出售的这种商品的总合格率为多少?()如果某人买一件这种商品发现为不合格品,此时商()如果某人买一件这种商品发现为不合格品,此时商店正在出售那个工厂的产品?店正在出售那个工厂的产品?14由题意知由题意知p(甲甲)=0.2 p(乙乙).4 p(丙丙)=0.4p(x/ 甲甲)=0.95 p(x/ 乙乙)=0.92 p(x/丙丙)=0.90有全概率公式有全概率公式p(x)=0.950.2+0.92 0.4+0.90 0.4=0.918若用若用表示表示X“X“某种商品为不合格商品某种商品为不合格商品”p(p(甲甲)=0.05 p(乙乙)=0.08 p(丙丙)=0.10 122. 04 . 01 . 04 . 008. 02 . 005. 02 . 005. 0| 丙丙丙丙乙乙乙乙甲甲甲甲甲甲甲甲甲甲PxPPxPPxPPxPxP因此由贝叶斯公式知因此由贝叶斯公式知 :15488. 0|390. 0|xPxP丙乙因此因此,商店此时最有可能在出售丙厂的产品。商店此时最有可能在出售丙厂的产品。 同理可得:同理可得:16第三节第三节 后验决策及其优良性后验决策及其优良性 决策方案决策方案(x(x) )的贝叶斯风险:的贝叶斯风险:B()=EP(,P(,) = = P(P(i i,)P(,)P(= =i i) )它反映这一决策方案的平均损失。它反映这一决策方案的平均损失。 例如,如果设备正常,而判断为不正常,会损失例如,如果设备正常,而判断为不正常,会损失1500元;元;判断为正常,损失为判断为正常,损失为0。若设备不正常,而判断为正常会损。若设备不正常,而判断为正常会损失失2000元;判断为不正常则损失为元;判断为不正常则损失为0,我们来求各种决策方,我们来求各种决策方案的风险值和贝叶斯风险。案的风险值和贝叶斯风险。 用用 a a1 1表示表示“判断设备正常判断设备正常”,a a2 2 表示表示“判断设备不正判断设备不正常常”,该决策问题的损失矩阵为:,该决策问题的损失矩阵为: 17表表14-3 损失矩阵表损失矩阵表P(=i)a1a111/20150021/220000 “不不”“合合”“不不”“合合”“不不”“合合”“不不”“合合”xaxaxxaxaxxaxaxxaxax224113122211 18P(=1 1)=1/2 )=1/2 P(=2 2)=1/2)=1/2P(x=“合合”| |=1)=0.8 P(x=“不不”| |=1)=0.2P(x=“合合”| |=2)=0.3P(x=“不不”| |=2)=0.7对于决策方案对于决策方案1(x)R(1, 1(合)合)) =R(1,a1) =0R(1, 1(不)不)) =R(1,a2) =1500R(2, 1(合)合)) =R(2,a1) =2000R(2, 1(不)不)) =R(2,a2) =0于是于是1(x)的风险值为的风险值为P(1, 1)=Ex|= =11R(R(1, 1(x))= R(1, 1(合)合))P(合合| |1)+ R(1, 1(不)不)) P(不不| |1)=00.8+15000.2=300(0.2=300(元元) ) 19P(2, 1)=Ex|=2=2R(R(2, 1(x))= R(2, 1(合)合))P(x=“合合”| |=2)+ R(2, 1(不)不)) P(x=“不不”| |=2)=20000.3+00.3+00.7=600(0.7=600(元元) )故决策方案故决策方案1(x)的贝叶斯风险为的贝叶斯风险为B(1)= P(1, 1) P(=1)+ P(2, 1) P(=2) =3001/2+6001/2+6001/2=4501/2=450(元)元)决策方案决策方案2(x)的贝叶斯风险的贝叶斯风险R(1, 2(合)合)) =R(1,a2) =1500R(1, 2(不)不)) =R(1,a1) =0R(2, 2(合)合)) =R(2,a2) =0R(2, 2(不)不)) =R(2,a1) =2000于是于是2(x)的风险值为的风险值为20对于决策方案对于决策方案3 3(x x)R(R(1,1, 3 3(合)合)) =) =R(R(1 1, ,a a1 1) =0) =0R(R(1,1, 3 3(不)不)) =) =R(R(1 1, ,a a2 2) =0) =0R(R(2,2, 3 3(合)合)) =) =R(R(2 2, ,a a1 1) =2000) =2000R(R(2,2, 3 3(不)不)) =) =R(R(2 2, ,a a2 2) =2000) =2000P(1, 2)=Ex|= =11R(R(1, 2(x)) = R(1, 2(合)合))P(合合| |1)+ R(1, 2(不)不)) P(不不| |1) =1500 0.8+0 0.8+0 0.2=12000.2=1200P(2, 2)=Ex|=2=2R(R(2, 2(x)) = R(2, 2(合)合))P(x=“合合”| |=2) + R(2, 2(不)不)) P(x=“不不”| |=2) =00.3+20000.3+20000.7=1400(0.7=1400(元元) )B(2)=1200 + 1400 + 1400 = = 1300(元元)21于是于是3(x)的风险值为的风险值为P(1, 3)=Ex|-|-1 1R(R(1, 3(x)) =00.8+00.2=0(0.2=0(元元) )P(2, 3)=Ex|-2|-2R(R(2, 3(x)) =20000.3+20000.3+20000.7=2000(0.7=2000(元元) )故决策方案故决策方案3(x)的贝叶斯风险为的贝叶斯风险为B(3)= P(1, 3) P(=1)+ P(2, 3) P(=2) =01/2+20001/2+20001/2=10001/2=1000(元)元)同理方案同理方案4(x)的贝叶斯风险的贝叶斯风险 B(4)=750(元)元)因此,若用贝叶斯风险衡量,方案因此,若用贝叶斯风险衡量,方案1(x)优于其他三种优于其他三种方案。方案。22 若抽取两件产品来补充情报信息,这时决策方案共有若抽取两件产品来补充情报信息,这时决策方案共有八个,分别记为八个,分别记为1,2,3,4,5,6,7,8,各个决各个决策方案的风险值和贝叶斯风险见表策方案的风险值和贝叶斯风险见表5-4:状态状态先验分布先验分布P()P(x|=1) =10.5 =20.5 合合合合0.64 合合不不0.32 不不不不0.04 合合合合0.09 合合不不0.42 不不不不0.49 方案方案1损失损失R风险值风险值P贝叶斯风险贝叶斯风险B a10 a10 a10 a12000 a12000 a12000 0 20001000表表5-423方案方案2损失损失R风险值风险值P贝叶斯风险贝叶斯风险Ba10 a10 a21500 a12000 a12000 a20 605401020方案方案3损失损失R风险值风险值P贝叶斯风险贝叶斯风险B a10a21500a10a12000a20a120004808201160方案方案4损失损失R风险值风险值P贝叶斯风险贝叶斯风险B a21500a10a10a20a12000a120009601390182024方案方案5损失损失R风险值风险值P贝叶斯风险贝叶斯风险Ba10 a21500a21500 a12000 a20 a20 540360180方案方案6损失损失R风险值风险值P贝叶斯风险贝叶斯风险B a21500a10a21500a20a12000a201020930840方案方案7损失损失R风险值风险值P贝叶斯风险贝叶斯风险B a21500a21500a10a20a20a120001440121098025方案方案8损失损失R风险值风险值P贝叶斯风险贝叶斯风险Ba21500a21500a21500 a20a20 a20150075001124aaax合”合”“合“合 x不”不”“不“不 x不“合x故 不”“合不”“不合”“合,xxxxP0015004126 64. 0P1 合合合合 04. 0P1 不不不不111不合合不不合PPP=0.16+0.16=0.32 9600.3200.60400.641500 ,141141 xxPxRRiiki同理求得同理求得P 元18204227得的贝叶斯风险为得的贝叶斯风险为B用贝叶斯风险的大小来衡量,决策方案用贝叶斯风险的大小来衡量,决策方案 元元13905 . 018205 . 09604 :5x 不”不”合合不”,“不”,“不“不合”合”“合“合1215xaxax 的贝叶斯风险最小,故它优于其他的七个决策方案。的贝叶斯风险最小,故它优于其他的七个决策方案。当抽取一件产品检验后而作决策,决策方案当抽取一件产品检验后而作决策,决策方案 为最佳决策为最佳决策方案,若抽取两件产品检验后而作决策,方案方案,若抽取两件产品检验后而作决策,方案 为最佳为最佳决策方案。决策方案。 2528若我们不作抽样,只凭空猜测,猜设备正常的平均损失为若我们不作抽样,只凭空猜测,猜设备正常的平均损失为1000元,猜设备不正常的平均损失为元,猜设备不正常的平均损失为750元,因此当猜设备不正常,元,因此当猜设备不正常,此时平均损失为此时平均损失为750元。元。若通过抽取一件产品检验,然后作决策,并采用决策方案若通过抽取一件产品检验,然后作决策,并采用决策方案 ,这时的平均损失(即贝叶斯风险)为这时的平均损失(即贝叶斯风险)为450元。元。若通过抽取二件产品检验,而后作决策,并采用方案若通过抽取二件产品检验,而后作决策,并采用方案 ,这时,这时的平均损失为的平均损失为360元。这些效果完全是由于抽样观察的结果,或元。这些效果完全是由于抽样观察的结果,或者说是补充情报的结果。者说是补充情报的结果。抽取一件产品检验的补充情报价值为抽取一件产品检验的补充情报价值为 750-450=300(元)(元)抽取两件产品的补充情报价值为抽取两件产品的补充情报价值为 750-360=390(元)(元)完全情报的价值与补充情报的关系为:完全情报的价值与补充情报的关系为: 定理定理1.任何补充情报的价值都是非负的,且不超过完全情报任何补充情报的价值都是非负的,且不超过完全情报的价值。的价值。 1529为了简便,我们设情报值(或调查结果)只有为了简便,我们设情报值(或调查结果)只有K种,分别记种,分别记为为 。若我们取得情报。若我们取得情报 ,按决策方案,按决策方案 采取行动,采取行动,那么在状态那么在状态 时的损失值为时的损失值为R ,而这时而这时 发生的发生的概率为后验概率概率为后验概率P ,故各种状态下的平均损失故各种状态下的平均损失为为称为后验损失。利用全概率公式称为后验损失。利用全概率公式xxxk,.,21xi x j xij ,jxijx xxPxRxijijnji ,15 jjinjiPxPxx 1RP则则P 表示在各种自然状态下情报值为表示在各种自然状态下情报值为 的平均概率。的平均概率。 xix xi30定理定理2.记为记为 决策方案决策方案 的贝叶斯风险,则的贝叶斯风险,则用这个计算公式容易求出最佳决策方案。用这个计算公式容易求出最佳决策方案。 B x xxPxRBiiki 1第四节第四节 最佳决策方案最佳决策方案一反序分析一反序分析反序分析的过程为:反序分析的过程为:在抽样之前,针对所有可能出现的抽样结局,分别计在抽样之前,针对所有可能出现的抽样结局,分别计算各自然状态的后验概率,算各自然状态的后验概率,利用这些概率求出各行动方案的后验损失值,利用这些概率求出各行动方案的后验损失值,然后比较这些后验损失值的大小,选择各种抽样结果然后比较这些后验损失值的大小,选择各种抽样结果下的最佳行动方案,综合成最佳决策方案。下的最佳行动方案,综合成最佳决策方案。31例例3 某公司的产品每某公司的产品每1000件装成一箱交顾客。每箱的件装成一箱交顾客。每箱的不合格品率可分为不合格品率可分为5%以下、以下、5%到到15%之间、以及之间、以及15%以上三种情况,为了计算简便,这三种状态分别表示为以上三种情况,为了计算简便,这三种状态分别表示为。15. 0,10. 0,05. 03210 0. .6 60 00 0. .0 05 5p p0 0. .3 30 00 0. .1 10 0p p0 0. .1 10 00 0. .1 15 5p p 按照以往的经验,公司的决策者推测为这三种值的概按照以往的经验,公司的决策者推测为这三种值的概率分别为率分别为0.60,0.30,0.10,即先验概率分布为,即先验概率分布为32 该公司的每箱产品在交付顾客之前,面临这样的决策问题:该公司的每箱产品在交付顾客之前,面临这样的决策问题: 方案为方案为a1:检验箱中每件产品,每一件的检验费用为检验箱中每件产品,每一件的检验费用为0.1元,元,于是一箱的检验费用为于是一箱的检验费用为100元。元。 采用采用a1的优点:可检验出一箱中的所有不合格品,保证交的优点:可检验出一箱中的所有不合格品,保证交付顾客的产品百分之百合格。付顾客的产品百分之百合格。 方案记为方案记为a2:整箱都不做检验,顾客买到不合格品时必须准整箱都不做检验,顾客买到不合格品时必须准予更换,每更换的一件所需的费用总和为予更换,每更换的一件所需的费用总和为1.25元。元。 采用采用a2的优点:可节省检验费的优点:可节省检验费100元元。决策者从每箱中抽出决策者从每箱中抽出2件产品检验,作出最佳决策方案:件产品检验,作出最佳决策方案: 设抽出的两件产品为设抽出的两件产品为z1、 z2 ,并规定当第并规定当第i件产品检验结件产品检验结果为不合格品时,记果为不合格品时,记zi =1,否则,否则zi =0,另外设抽样总的结果,另外设抽样总的结果为为x= z1+ z2 33x的值刚好为抽样的两件产品中的不合格品数目,它是一个随的值刚好为抽样的两件产品中的不合格品数目,它是一个随机变数。在抽样试验前,我们就知道,机变数。在抽样试验前,我们就知道,x可能有可能有0,1,2三种结三种结果。果。x的概率分布是超几何分布,此处可认为的概率分布是超几何分布,此处可认为x近似服从两项分近似服从两项分布。布。 在实际进行抽样试验前,决策者先作下面分析:假定抽样在实际进行抽样试验前,决策者先作下面分析:假定抽样后观察到的不合格品数为后观察到的不合格品数为0,即,即x=0,则可计算各状态则可计算各状态 的后验概率,及每一种可能行动方案的后验概率,及每一种可能行动方案 的后验损失计算格的后验损失计算格式及结果如表式及结果如表55所示。表中数值显示行动所示。表中数值显示行动 的后验损失为的后验损失为100元,而行动元,而行动a a2 2的后验损失为的后验损失为90.75元,故出现元,故出现x=0的抽样结果的抽样结果时,最佳行动方案为时,最佳行动方案为a a2 2。假设抽样结果为假设抽样结果为x=1,作计算列入表作计算列入表56中可得最佳行动方案为中可得最佳行动方案为a a1 1。最后假设抽样结果为最后假设抽样结果为x=2x=2,计计算结果列入表算结果列入表5 57 7中得最佳行动方案为。综合这些结论,即得中得最佳行动方案为。综合这些结论,即得最佳决策方案为:最佳决策方案为: 321,aa21, 02 , 121xaxax a134表表4-5的计算的计算 9025. 005. 0105. 01| 01 xP 632. 07225. 01 . 081. 03 . 09025. 0632. 09025. 06 . 00 x|1 P1.250.051000=62.5 810. 010. 0110. 01| 02 xP 284. 07225. 01 . 081. 03 . 09025. 0632. 081. 03 . 00 x|2 P1.250.101000=125 35 7225. 015. 0115. 01| 03 xP 084. 07225. 01 . 081. 03 . 09025. 0632. 07225. 01 . 00 x|3 P1.250.151000=187.5 75.905 .187084. 0125284. 05 .62632. 00,31 xPaRiii 36自然状态自然状态i先验概率先验概率P() 各状态下各状态下x=0的概的概率率P(x=0)后验概率后验概率P(x=0)各行动方案的损失各行动方案的损失R(,a) a1 a2 0.050.60.9020.63210062.500.100.30.8100.284100125.000.150.10.7220.084 100187.50后验损失后验损失10090.75 0,31 xPaRiii 表表5-5 不合格品为不合格品为0件(即件(即x=0)时后验损失表时后验损失表37表表5-6的计算的计算 095. 005. 0105. 02| 11 xP418. 0255. 01 . 018. 03 . 0095. 06 . 0095. 06 . 01x|1PP(x=1|2)=0.1(1-0.1)2=0.18 P(x=1|3)= 0.15(1-0.15)2=0.255 5 .1105 .187186. 0125396. 05 .62418. 00,31 xPaRiii 38自然状态自然状态 先验概率先验概率P() 各状态下各状态下x=1的概的概率率P(x=1)后验概率后验概率P(x=1)各行动方案的损各行动方案的损失失R(,a) a1 a2 0.050.60.0950.41810062.500.100.30.1800.396100125.000.150.10.2250.186 100187.50后验损失后验损失100110.5表表5-6 不合格品为不合格品为1件(即件(即x=1)时后验损失表时后验损失表 1,31 xPaRiii 39表表5-6 不合格品为不合格品为2件(即件(即x=2)时后验损失表时后验损失表自然状态自然状态 先验概率先验概率P() 各状态下各状态下x=2的概的概率率P(x=2)后验概率后验概率P(x=1)各行动方案的损各行动方案的损失失R(,a) a1 a2 0.050.60.0020.19410062.500.100.30.0100.490100125.00.150.10.0220.316100187.5后验损失后验损失100132.62 2,31 xPaRiii 40=0.05;P=0.632=0.10;P=0.284=0.15;P=0.084=0.15;P=0.316=0.15;P=0.316=0.15;P=0.316=0.15;P=0.316=0.15;P=0.084=0.10;P=0.490=0.10;P=0.490=0.10;P=0.396=0.10;P=0.284=0.10;P=0.396=0.05;P=0.632=0.05;P=0.418=0.05;P=0.194=0.05;P=0.418=0.05;P=0.19410010010010010010010010010062.562.562.5125.0125.0125.0187.5187.5187.5100100P=0.857没有不合格品x=0P=0.136有一件不合格品x=1P=0.007有二件不合格品x=290.7590.75100100100110.5132.62a1a1a1a2a2a212.0741由反序分析求得的最佳方案为贝叶斯原则下的最佳决策方案。由反序分析求得的最佳方案为贝叶斯原则下的最佳决策方案。证明如下证明如下设某决策问题的自然状态为设某决策问题的自然状态为1 1,2 2, , n n ,先验概率分先验概率分布为布为p(p(1 1),p(),p(2 2),), ,p(p(n n) );可以采取的行动可以采取的行动方案方案为为a a1 1,a,a2 2, ,a am m。损失函数为损失函数为R R(i i,a aj j)。)。令补充情报值为令补充情报值为x x,可能为可能为x x1 1,x x2 2,x xk k记记x xi i在状态在状态j j下发生下发生的概率为的概率为P P(x x= =x xi i|j j)又记又记 mjjjiiPxxPxxP1| 若若(X X)为任一个决策方案,而为任一个决策方案,而0 0(X X)是按反序分析得是按反序分析得到的最佳决策方案,当到的最佳决策方案,当x=xx=xi i,按照这两个决策方案,分别应按照这两个决策方案,分别应采取行动采取行动(X Xi i)和和0 0(X Xi i)由反序分析过程知,后验损失由反序分析过程知,后验损失42由于由于(X X)是任意选取的一个决策方案,上式即说明方案是任意选取的一个决策方案,上式即说明方案0 0(X X)在所有的决策方案中,其贝叶斯风险最小。下面用决在所有的决策方案中,其贝叶斯风险最小。下面用决策树来表示反序决策过程。策树来表示反序决策过程。 在决策树中,在各种状态变量下,所抽取的两件没有不合格在决策树中,在各种状态变量下,所抽取的两件没有不合格品的概率品的概率P P可由全概率公式计算:可由全概率公式计算: kixRxRii, 2 , 110 BxxPxRxxPxRBikiiikii 00故贝叶斯风险故贝叶斯风险 15. 015. 0|010. 010. 0|005. 005. 0|00PxPPxPPxPxPP43 9025. 095. 005. 0|02 xP 81. 090. 010. 0|02 xP 7225. 085. 015. 0|02 xP 857. 01 . 07225. 03 . 081. 06 . 09025. 00 xPP故得故得仿此可计算仿此可计算21xPxP及二、正序分析二、正序分析 正序分析的过程为:在进行抽样之前,枚举所有可能出正序分析的过程为:在进行抽样之前,枚举所有可能出现得抽样结果现得抽样结果x,及所有可能得决策方案及所有可能得决策方案(X X),),针对每一针对每一方案方案(X X),),计算其贝叶斯风险,并比较各个方案的贝叶斯计算其贝叶斯风险,并比较各个方案的贝叶斯风险大小,贝叶斯风险最小的决策方案即为最佳方案。风险大小,贝叶斯风险最小的决策方案即为最佳方案。 44P370习题解答习题解答1 %125.93%95500300500%90500300300|1mjjjiiPxxPxxP2设调整成功为设调整成功为 状态,调整不成功为状态,调整不成功为 状态,状态, 128238.025.07.075.005.025.07.0|1765.025.07.075.005.075.005.0|7.03.01|05.095.01|25.075.0212121不不不不xpxpxpxppp45某公司准备经营某种新产品,可以采取的行动有:某公司准备经营某种新产品,可以采取的行动有:小批生产试销,中批及大批生产。可能出现的销售状态小批生产试销,中批及大批生产。可能出现的销售状态有:畅销、一般及滞销。有:畅销、一般及滞销。如大批生产,在畅销时可获利如大批生产,在畅销时可获利100万元,一般时可获万元,一般时可获利利30万元,滞销时亏损万元,滞销时亏损60万元;万元;如中批生产,在前两种情况下可分别获利如中批生产,在前两种情况下可分别获利50万元、万元、40万元,滞销时则亏损万元,滞销时则亏损20万元;万元;如小批量生产则在三种情况下分别获利如小批量生产则在三种情况下分别获利10万元、万元、9万万元、元、6万元。又根据长期经验,同类产品为畅销,一般及万元。又根据长期经验,同类产品为畅销,一般及滞销的概率分别是滞销的概率分别是0.2,0.5,0.3,这对于现在正在考虑的,这对于现在正在考虑的新产品来说,可以作为先验分布。从某些迹象来看,这新产品来说,可以作为先验分布。从某些迹象来看,这种新产品的市场需求情况有些变化,为弄清这一点,进种新产品的市场需求情况有些变化,为弄清这一点,进行了市场预测。预测的准确度如下:行了市场预测。预测的准确度如下:46状态(状态()( )( )( )( ) .47023. 00.020.30.20.50.80.20.020.3|376. 00.020.30.20.50.80.20.20.5|601. 00.020.30.20.50.80.20.80.2|131211HpHpHp1)预测结果为畅销:)预测结果为畅销:532. 96023. 09376. 0601. 01063.4420023. 040376. 0601. 0507060023. 030376. 0601. 0100121EEE最优行动为大批生产最优行动为大批生产482)预测结果为一般)预测结果为一般:059. 00.080.30.70.50.150.20.080.3|866. 00.080.30.70.50.150.20.70.5|074. 00.080.30.70.50.150.20.150.2|232221HpHpHp888. 86059. 09866. 0074. 01016.3720059. 040866. 0074. 05084.2960059. 030866. 0074. 0100321EEE最优行动为中批生产最优行动为中批生产49预测结果为滞销:预测结果为滞销:82. 00.90.30.10.50.050.20.080.3|15. 00.90.30.10.50.050.20.70.5|03. 00.90.30.10.50.050.20.050.2|333231HpHpHp57. 66059. 09866. 0074. 0109 . 820059. 040866. 0074. 0507 .416082. 03015. 003. 0100321EEE最优行动为小批生产最优行动为小批生产332211HaHaHax50 投放市场投放市场 400000.6-35000 0.4=10000元元 不投放市场不投放市场 0 所以投放市场所以投放市场 077. 00.10.40.80.60.10.4|923. 00.10.40.80.60.80.6|1211XpXp调查结果调查结果为受欢迎为受欢迎 不不调调查查时时实际状态实际状态先验概率先验概率调查结果为调查结果为1的概率的概率X1调查结果为调查结果为2的概率的概率X2受欢迎受欢迎 1不受欢迎不受欢迎 20.60.40.80.10.20.9451投放市场投放市场 : 40000 0.923+35000 0.077-10000=2422575. 00.90.40.20.60.90.4|25. 00.90.40.20.60.20.6|2221XpXp投放市场投放市场 : 40000 0.25+35000 0.75-10000=-26250 不投放市场:不投放市场: -10000不投放市场不投放市场 -10000所以投放市场所以投放市场调查结果调查结果为不受欢迎为不受欢迎 所以不投放市场所以不投放市场