贝叶斯推断学习.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《贝叶斯推断学习.pptx》由会员分享,可在线阅读,更多相关《贝叶斯推断学习.pptx(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 贝叶斯推断贝叶斯推断2.1 2.1 条件方法条件方法2.2 2.2 估计估计2.3 2.3 区间估计区间估计(可信区间可信区间)2.4 2.4 假设检验假设检验2.5 2.5 预测预测2.6 2.6 似然原理似然原理第1页/共72页2.1 2.1 条件方法 1.后验分布的特点:未知参数的后验分布是集三种信息(总体、样本和后验)于一身,它包含了所有可供利用的信息。故有关的参数估计和假设检验等统计推断都按一定方式从后验分布提取信息,其提取方法与经典统计推断相比要简单明确得多。第2页/共72页2.条件方法的基本思想:基于后验分布的统计推断实际上只考虑已出现的数据(样本观察值)而认为未出
2、现的数据与推断无关,这一重要的观点被称为“条件观点”,基于这种观点提出的统计方法被称为条件方法。第3页/共72页3.条件方法与频率方法的区别:(以对估计的无偏性认识为例)例如经典统计学认为参数的无偏估计应满足:其中平均是对样本空间中所有可能出现的样本而求的,可实际中样本空间中绝大多数样本尚为出现过,而多数从未出现的样本也要参与平均是实际工作者难以理解的。故在贝叶斯推断中不用无偏性,而条件方法是容易被实际工作者理解和接受的。例2.1 (教材P36)第4页/共72页2.2 2.2 估计1.1.贝叶斯估计 定义2.1 使后验密度 达到最大的值 称为最大后验估计;后验分布的中位数 称为后验中位数估计;
3、后验分布的期望值 称为 的后验期望值估计,这三个估计都称为贝叶斯估计,记为 。第5页/共72页解题的基本步骤:2分析后验分布的特征:对称分布 第6页/共72页第7页/共72页例2.3 为估计不合格率 ,今从一批产品中随机抽取n件,其中不合格品数X服从 ,一般选取 为 的先验分布,设 已知,求 的Bayes估计。解:由共轭先验分布可知,的后验分布为:则得:特例:选用贝叶斯假设作为先验分布,即则:第8页/共72页第一、在二项分布时,的最大后验估计就是经典统计中的极大似然估计,即 的极大似然估计就是取特定的先验分布下的贝叶斯估计。第二、的后验期望值估计 要比最大后验估计 更合适一些。注意注意:第9页
4、/共72页试验号样本量样本量n不合格不合格数数x13000.200210000.08333310.8004101010.917表2.1 不合格率 的二种贝叶斯估计的比较第10页/共72页 例2.42.4 设x是来自如下指数分布的一个观察值。又取柯西分布作为的先验分布,即:求的最大后验估计 。解:由前面方法可求出的后验密度:为了寻找的最大后验估计 ,对后验密度求导数,得:由于(|x)的非减性,考虑到的取值不能超过x,故的最大后验估计应为 =x第11页/共72页2.2.贝叶斯估计的误差 设 是 的一个贝叶斯估计,在样本给定后,是一个数,在综合各种信息后,是按 取值,所以评价一个贝叶斯估计的误差的最
5、好而又简单的方式是用对 的后验均方差或平方根来度量,定义如下:定义2.2 设参数的后验分布为 ,贝叶斯估计为 ,则 的后验期望 称为 的后验均方差,而其平方根称为后验标准误。第12页/共72页注意:(1)表示用条件分布 求期望;(2)当 时,则称为后验方差,其平方根称为后验标准差;(3)后验均方差与后验方差的关系:这表明,当 时,可使后验均方差达到最小,实际中常取后验均值作为 的贝叶斯估计值;(4)与经典统计的两点比较:后验方差应用的方便程度不一样;计算的复杂程度不一样。(阅读教材p40最后一段)第13页/共72页例2.5 设一批产品的不合格率为 ,检查是一个一个进行,直到发现第一个不合格品为
6、止,若X为发现第一个不合格品时已检查的产品数,则X服从几何分布,其分布列为:设 的先验分布为 ,如今只获得一个样本观察值x=3,求 的最大后验估计,后验期望估计,并计算它的误差。解:(1)先求联合分布。因为已知的先验分布和在给定下,X=3的条件概率,则联合分布为:X=3的无条件概率为(利用全概率公式)第14页/共72页再求的后验分布列为:或 最后得 的最大后验估计:的后验均方差为(2)(3)因为,所以:第15页/共72页例2.6 在例2.3中,在选用共轭分布下,不合格品率的后验分布为贝塔分布,它的后验方差为:其中n为样本量,x为样本中不合格品数,与为先验分布中的两个超参数。若取=1,则其后验方
7、差为:这时的后验期望估计和最大后验估计 分别为:第16页/共72页显然,的后验均方差就是上述Var(/x),的后验均方差为:对若干对(n,x)的值算得的后验方差和后验均方差列入表2.2中。表2.2 和的后验均方差nxVarMSE301/50.026670.1600.066670.261001/120.005880.0800.012820.111012/120.010680.101/100.015120.122012/220.003590.061/200.005270.07第17页/共72页2.3 区间估计(可信区间)一、可信区间 第18页/共72页 这里的可信水平和可信区间与经典统计中的置信水
8、平与置信区间虽是同类的概念,但两者还是有本质的差别,主要表现在下面二点:1.在条件方法下,对给定的样本 x和可信水平1-,通过后验分布可求得具体的可信区间,譬如,的可信水平为0.9的可信区间是1.5,2.6,这时我们可以写出 2.在经典统计中寻求置信区间有时是困难的,因为它要设法构造一个枢轴量(含有被估计参数的随机变量),使它的分布不含未知参数,这是一项技术性很强的工作。相比之下可信区间只要利用后验分布,不需要再去寻求另外的分布,可信区间的寻求要简单得多。第19页/共72页 例2.72.7 设 是来自正态总体 的一个样本观察值,其中 已知,若正态均值的先验分布取为 ,其中 与 已知,则可求得
9、的后验分布为 ,由此很容易获得 的 可信 区间:其中是标准正态分布1-/2的分位数。第20页/共72页例2.8 80年代我国彩电平均寿命的贝叶斯估计。经过早期筛选后的彩色电视机的寿命服从指数分布,它的密度函数为:其中0是彩电的平均寿命。现从一批彩电中随机抽取n台进行寿命试验,试验到第r(rn)台失效为止,其失效时间为 ,另外n-r台彩电直到试验停止时还未失效,这样的试验称为截尾寿命试验,所得样本 称为截尾样本,此截尾样本的联合密度函数为:其中F(t)为彩电的寿命的分布函数,称为总试验时间。第21页/共72页(1)确定参数的先验分布:倒伽玛分布IGa(,)(2)利用历史资料确定两个超参数和的值(
10、用第三种方法)(3)求出的后验分布:IGa(+r,+Sr)(4)用后验均值作为的贝叶斯估计:(5)可信下限的确定具体实施的步骤:第22页/共72页 定义2.4 设参数的后验密度为(|x),对给定的概率1-(01-,则增大k,再转入Step1与Step2。若P(C(k)|x)1-,则减小k,再转入Step1与Step2。第25页/共72页 例2.9 在2.8中已经确定彩电平均寿命的后验分布为倒伽玛分布IGa(1.956,42868),现求的可信水平为0.90的最大后验密度(HPD)可信区间。解题的基本步骤:1.确定参数的后验密度和分布函数:后验密度:分布函数:2.确定初始值3.按第一步计算初始区
11、间4.计算后验概率5.验证初始区间是否满足要求,满足则停止,否则继续。第26页/共72页表2.3 可信区间的搜索过程/16.710.3678790.3677650.7357590.0093830.7263760.59.2550.0758160.0758110.9098000.0009810.9088190.539.0390.0876300.0876540.9005660.0011910.8983750.5289.0530.0868150.0868380.9011890.0011770.900012第27页/共72页2.4 假设检验一、假设检验 经典统计中处理假设检验问题的基本步骤:1.建立原假
12、设H0与备择假设H1:H0:0,H1:1其中0与1是参数空间中不相交的二个非空子集。2.选择检验统计量T=T(x),使其在原假设H0为真时概率分布是已知的。这是在经典方法中最困难的一步。3.对给定的显著性水平(01时接受H0;当0/11/2若取均匀分布U(0,1)作为的先验分布,试做出判断。解:因为0的后验概率为:在n=5时可计算各种x下的后验概率及后验机会比(见表2.4)第31页/共72页 表2.4 的后验机会比从表中可以看出,当x=0,1,2时,应接受0,而在x=3,4,5时,应拒绝0,接受1。x012345063/6457/6442/6422/647/641/6411/647/6422/
13、6442/64576463/640/163.08.141.910.520.120.016第32页/共72页二、一个重要的概念贝叶斯因子定义2.5 设两个假设0与1的先验概率分别为0与1,后验概率分别为0与1,则称:为贝叶斯因子。n贝叶斯因子表示数据x支持原假设的程度。第33页/共72页三、简单假设0=0对简单假设1=11.贝叶斯因子的计算方法及其含义。在这种场合,两种简单假设的后验概率分别为:其中p(x/)为样本的分布,这时后验机会比为:如果要拒绝原假设0=0,则必须有:0/1小于1,即:第34页/共72页即要求两密度函数值之比大于临界值,这正是著名的奈曼皮尔逊引理的基本结果,从贝叶斯观点看,
14、这个临界值就是两个先验概率比。由此得到这种情形下的贝叶斯因子是:它不依赖于先验分布,仅依赖于样本的似然比,这时贝叶斯因子的大小表示样本x支持0的程度。第35页/共72页2.例题分析(P54例2.11)设XN(,1),其中只有两种可能,非0即1,需要检验的假设是:H0:=0,H1:=1若从该总体中抽取一个容量为n的样本x,试计算贝叶斯因子及作出相应的决策。解:先计算似然函数:再计算贝叶斯因子:最后进行数值分析:假设n=10,=2。则贝叶斯因子为:,这个数很小,所以应该拒绝H0而接受H1。第36页/共72页四、复杂假设0对复杂假设11.贝叶斯因子的计算。在这种情形下,贝叶斯因子不仅与样本有关,还依
15、赖于参数空间上的先验分布()。先把先验分布()限制在01上,并令:于是先验分布可改写为:其中0与1分别是0与1上的先验概率,g0与g1分别是0与1上的概率密度函数,由此可计算出后验概率比为 则贝叶斯因子为:第37页/共72页2.结论分析:由上式可看出,B(x)还依赖于0与1上的先验分布g0与g1,这时贝叶斯因子虽已不是似然比,但仍可看作0与1上的加权似然比,它部分地消除了先验分布的影响,而强调了样本观察值的作用。若设 与 分别是在0与1上的极大似然估计(MLE),那么经典统计中所使用的似然比统计量 是贝叶斯因子B(x)的特殊情况,即认为先验分布g0()与g1()的质量全部集中在 与 上。第38
16、页/共72页3.例题2.12 设从正态总体N(,1)中随机抽取一个容量为10的样本x,算得样本均值 =1.5,试对如下两个假设进行检验:H0:1,H1:1取的共轭先验分布为N(0.5,2)。解:根据题意可算得的后验分布为 ,其中1=1.4523,=(0.3086)2,即N(1.4523,0.30862),由此可算得H0与H1的后验概率:0=P(1|x)=0.0708 1=P(1|x)=1-0=0.9292后验机会比为:0/1=0.0708/0.9292=0.0761可见,H0为真的可能性较小,因此拒绝H0,接受H1,即认为正态均值大于1。第39页/共72页 另外,由先验分布N(0.5,2)也可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 推断 学习
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内