贝叶斯分析学习.pptx
《贝叶斯分析学习.pptx》由会员分享,可在线阅读,更多相关《贝叶斯分析学习.pptx(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、风险型决策问题的决策准则最大可能值准则先看发生概率最大,再看损失值最小;效用则反之。如P73例1贝叶斯准则后果的期望效用最大;或损失的期望效用最小。第1页/共73页风险型决策问题的决策准则E-V准则优势原则与随机性决策准则(1)当概率不能确定时采用;(2)优势原则:见课本75页例题(3)随机策略:删除最劣方案第2页/共73页损失函数、风险函数和贝叶斯风险第3页/共73页损失函数、风险函数和贝叶斯风险 损失函数记作l(,a),它表示一决策问题当状态为,决策人的行动为a时,所产生的后果使决策人遭受的损失。由于损失函数可能为负值,因此它也能反映决策人获得的收益。后果的效用越大,损失越小。故用效用函数
2、去定义损失函数的一种简单办法,是令 l(,a)=-u(,a)为了使损失函数非负,可以定义为 由于损失函数经过任何正线性变换仍然是同一优先关系的效用函数,因此以上两种形式的损失函数都会得到同样的分析结果。第4页/共73页 给定的,观察的结果(信息)X是一随机变量,用F(x)记X的条件分布函数,用f(x)记X的条件密度函数,用 记随机变量的样本空间。决策规则 就是由所有可能信息值的集合到所有可能行动的集合的一个映射。换句话说,决策规则是这样一个规则,按照这个规则,对于每一个信息值X均有唯一确定的可行行动a=(x)与之对应。设给定一个决策规则(x),在任一状态下,当信息值X确定后,它所对应的行动(x
3、)也就确定了,从而(x)的损失值为l(,(x),它也是一随机变量。当给定,l(,(x)对X的期望值称为风险函数,并记为R(,),R(,)=E x l(,(x)第5页/共73页若X为离散随机变量,则由于决策认事先不知道真实状态,他只能对随机状态的先验密度()作出主观估计。所以进行决策分析时,还需要将损失函数R(,(x)对取期望值,即第6页/共73页如为连续随机变量,则如为离散随机变量,则第7页/共73页 r(,)称为决策规则 相对于 的贝叶斯风险。对于固定的决策规则(x),其贝叶斯风险为一常数,它反映出利用这一决策规则决策的平均损失。三种标准的“损失函数”:(1)平方损失:更一般的平方损失是加权
4、平方损失,其形式是第8页/共73页 线性损失 “0-1”损失第9页/共73页例.有两类盒子:甲类盒子只有一个,其中装有80个红球,20个白球;乙类盒子共有三个,每个盒子均装有20个红球,80个白球。四个盒子外表一样,内容不知。今从中任取一盒,请你猜它是哪类的。如果猜中,付你1元钱;如果未猜中,不付你钱。那么你怎样猜法?如果从这个盒子中任意抽取N个球(回置地),让你观察,你如何根据这N个球的性质来选择自己的行动?当容量为1或2的抽样时,求各决策规则的风险函数和贝叶斯风险,并分别指出最佳决策规则。解:令表示所取出的这个盒子中红球所占的比例。显然,只能取两个值:若这个盒子是甲类的,=1=0.8;若这
5、个盒子是乙类的,=1=0.2。用a1、a2分别表示猜这个盒子是甲类的和猜它是乙类的这两个行动方案。显然收益矩阵如表5.1所示。第10页/共73页表5.1猜盒问题的收益矩阵 1 2 1/4 3/4 a110a201假设N=1,即从你猜的那个盒子中取出1个球来观察。规定:对于红球,x=1;对于白球,x=0,其抽样分布如表5.2所示:第11页/共73页表5.2N=1时猜盒问题的抽样分布矩阵P()P(x=0/)P(x=1/)11/40.20.823/40.80.2第12页/共73页P(x=0/)表示从甲类盒子中抽取1球是白球的概率,显然它等于0.2。对另外三个概率可作类似理解。利用先验分布和抽样分布计
6、算后验分布:P(x=0)=0.21/4+0.83/4=0.65P(1/x=0)=0.05/0.65=1/13P(2/x=0)=0.60/0.65=12/13P(x=1)=0.81/4+0.23/4=0.35P(1/x=1)=0.2/0.35=4/7P(2/x=1)=0.15/0.35=3/7第13页/共73页表5.3N=1时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.651/1312/1310.354/73/7第14页/共73页样本容量N=2时,表5.4N=2时猜盒问题的抽样分布矩阵P()P(x=0/)P(x=1/)P(x=2/)11/40.040.320.6423/40.6
7、40.320.04第15页/共73页表5.5N=2时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.491/4948/4910.321/43/420.1916/193/19第16页/共73页本例中,如果样本容量为1,由于所有可能的抽样结果有2个,可行行动也有2个,故决策规则共有22=4个:1(x)=a12(x)=3(x)=4(x)=a2如果样本容量为2,那么抽样结果有3种可能,可行行动海时2个,因此决策规则共有23=8个。一般地,对于有S个可行行动的决策问题,若补充信息值有n个,则决策规则共有Sn个。第17页/共73页对于决策法则1(x),无论是x=0或x=1,都有l(1,1(x
8、)=l(1,a1)=0l(2,1(x)=l(2,a1)=1于是 R(1,1(x)=l(1,1(x)=0R(2,1(x)=l(1,1(x)=1即1(x)的风险函数为其贝叶斯风险:r(,1)=R(1,1)P(1)+R(2,1)P(2)=0.75第18页/共73页对于决策规则2(x),l(1,2(0)=l(1,a1)=0l(1,1(1)=l(1,a2)=1于是R(1,2(x)=R(1,2(0)P(x=0/1)+R(1,2(1)P(x=1/1)=10.8+00.2=0.8同样地,l(2,2(0)=l(2,a1)=1l(2,2(1)=l(2,a2)=0R(2,2(x)=R(2,2(0)P(x=0/2)+
9、R(2,2(1)P(x=1/2)=10.8+00.2=0.8因此,2(x)的风险函数为R(,2)=0.8其贝叶斯风险为r(,2)=0.8类似地,可以求出3和4的贝叶斯风险分别为r(,3)=0.2,r(,4)=0.25最佳决策规则为3第19页/共73页贝叶斯定理第20页/共73页贝叶斯定理贝叶斯定理:令A1,A2,An 为事件空间的某个划分,即=且 对于j l,AjAl=。令B是概率非零的任意事件,即P(B)0,则有P(AlB)=贝叶斯定理给出了先验分布和后验分布之间的关系。第21页/共73页给定x后的后验分布(或简称为后验)由(x)表示,正如符号所表示的,它定义为给定样本观测值x后的条件分布。
10、注意,和X的联合密度是h(x,)=()f(x)“后验分布”这个名称预示着(x)的作用,正如先验分布反映先于试验的对的信念。后验分布把的先验信念与含于样本x内关于的信息结合起来得出对的最后信念的合成图像。设状态的先验密度为(),贝叶斯定理指出,由观察X所确定的后验密度是(x)是第22页/共73页上式中的f(x)称为似然函数,m(x)称为预测密度。当为连续变量时,当为离散变量时,第23页/共73页第24页/共73页第25页/共73页贝叶斯分析第26页/共73页随机决策规则 有时需要以一种随机的方式采取行动,这类情况在有一个聪明的对手参与时尤为常见。例如硬币博弈。例3.3(硬币博弈)你和你的对手同时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 分析 学习
限制150内