第三章贝叶斯估计精选PPT.ppt
《第三章贝叶斯估计精选PPT.ppt》由会员分享,可在线阅读,更多相关《第三章贝叶斯估计精选PPT.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章贝叶斯估计1第1页,本讲稿共50页3先先验验信信息息,即即在在抽抽样样之之前前有有关关统统计计推推断断的的一一些些信信息息。譬譬如如,在在估估计计某某产产品品的的不不合合格格率率时时,假假如如工工厂厂保保存存了了过过去去抽抽检检这这种种产产品品质质量量的的资资料料,这这些些资资料料(包包括括历历史史数数据据)有有时时估估计计该该产产品品的的不不合合格格率率是是有有好好处处的的。这这些些资资料料所所提提供供的的信信息息就就是是一一种种先先验验信信息息。又又如如某某工工程程师师根根据据自自己己多多年年积积累累的的经经验验对对正正在在设设计计的的某某种种彩彩电电的的平平均均寿寿命命所所提提供供
2、的的估估计计也也是是一一种种先先验验信信息息。由由于于这这种种信信息是在息是在“试验之前试验之前”就已有的,故称为先验信息。就已有的,故称为先验信息。以以前前所所讨讨论论的的点点估估计计只只使使用用前前两两种种信信息息,没没有有使使用用先先验验信信息息。假假如如能能把把收收集集到到的的先先验验信信息息也也利利用用起起来来,那那对对我我们们进进行行统统计计推推断断是是有有好好处处的的。只只用用前前两两种种信信息息的的统统计计学学称称为为经经典典统统计计学学,三三种种信信息息都都用用的的统统计计学学称称为为贝贝叶叶斯斯统统计学。本节将简要介绍贝叶斯统计学中的点估计方法。计学。本节将简要介绍贝叶斯统
3、计学中的点估计方法。2第2页,本讲稿共50页二、贝叶斯公式的密度函数形式二、贝叶斯公式的密度函数形式贝贝叶叶斯斯统统计计学学的的基基础础是是著著名名的的贝贝叶叶斯斯公公式式,它它是是英英国国学学者者贝贝叶叶斯斯(T.R.Bayes17021761)在在他他死死后后二二年年发发表表的的一一篇篇论论文文论论归归纳纳推推理理的的一一种种方方法法中中提提出出的的。经经过过二二百百年年的的研研究究与与应应用用,贝贝叶叶斯斯的的统统计计思思想想得得到到很很大大的的发发展展,形形成成一一个个统统计计学学派派贝贝叶叶斯斯学学派派。为为了了纪纪念念他他,英英国国历历史史最最悠悠久久的的统统计计杂杂志志Biome
4、trika在在1958年又全文刊登贝叶斯的这篇论文。年又全文刊登贝叶斯的这篇论文。初初等等概概率率论论中中的的贝贝叶叶斯斯公公式式是是用用事事件件的的概概率率形形式式给给出出的的。可可在在贝贝叶叶斯斯统统计计学学中中应应用用更更多多的的是是贝贝叶叶斯斯公公式式的的密密度度函函数数形形式式。下下面面结结合合贝贝叶叶斯斯统统计计学学的的基基本本观观点点来来引引出出其其密密度度函函数数形形式式。贝贝叶叶斯斯统统计计学学的的基基本本观观点点可可以以用用下下面面三三个个观观点点归归纳出来。纳出来。3第3页,本讲稿共50页假假设设随随机机变变量量X有有一一个个密密度度函函数数p(x;),其其中中是是一一个
5、个参参数数,不不同同的的对对应应不不同同的的密密度度函函数数,故故从从贝贝叶叶斯斯观观点点看看,p(x;)在在给给定定后后是是个个条条件件密密度度函函数数,因因此此记记为为p(x)更更恰恰当当一一些些。这这个个条条件件密密度度能能提提供供我我们的有关的们的有关的信息就是总体信息。信息就是总体信息。假假设设当当给给定定后后,从从总总体体p(x)中中随随机机抽抽取取一一个个样样本本X1,Xn,该该样样本本中中含含有有的的有有关关信信息息。这这种种信信息息就是样本信息。就是样本信息。假设假设我们对参数我们对参数已经积累了很多资料,经过分析、整理和已经积累了很多资料,经过分析、整理和加工,可以获得一些
6、有关加工,可以获得一些有关的有用信息,这种信息就是先验信的有用信息,这种信息就是先验信息。参数息。参数不是永远固定在一个值上,而是一个事先不能确不是永远固定在一个值上,而是一个事先不能确定的量。定的量。4第4页,本讲稿共50页从贝叶斯观点来看,未知参数从贝叶斯观点来看,未知参数是一个随机变量。描述这是一个随机变量。描述这个随机变量的分布可从先验信息中归纳出来,这个分布称个随机变量的分布可从先验信息中归纳出来,这个分布称为先验分布,其密度函数用为先验分布,其密度函数用()表示。表示。1先验分布先验分布定定义义3.1将将总总体体中中的的未未知知参参数数看看成成一一取取值值于于的的随随机机变变量量,
7、它它有有一一概概率率分分布布,记记为为(),称称为为参参数数的的先验分布。先验分布。2后验分布后验分布在贝叶斯统计学中,把以上的三种信息归纳起来的最好形式在贝叶斯统计学中,把以上的三种信息归纳起来的最好形式是在总体分布基础上获得的样本是在总体分布基础上获得的样本X1,Xn,和参数的联和参数的联合密度函数合密度函数 5第5页,本讲稿共50页在在这这个个联联合合密密度度函函数数中中。当当样样本本给给定定之之后后,未未知知的的仅仅是是参参数数了了,我我们们关关心心的的是是样样本本给给定定后后,的的条条件件密密度度函函数数,依据密度的计算公式,容易获得这个条件密度函数依据密度的计算公式,容易获得这个条
8、件密度函数这就是贝叶斯公式的密度函数形式,这就是贝叶斯公式的密度函数形式,称为称为的的后验密度函数后验密度函数,或,或后验分布后验分布。而。而6第6页,本讲稿共50页是是样样本本的的边边际际分分布布,或或称称样样本本的的无无条条件件分分布布,它它的的积积分分区区域域就就是是参参数数的的取取值值范范围围,随随具具体体情情况况而定。而定。前面的分析总结如下:人们根据先验信息对参数前面的分析总结如下:人们根据先验信息对参数已有已有一个认识,这个认识就是先验分布一个认识,这个认识就是先验分布()。)。通过试验,通过试验,获得样本。从而对获得样本。从而对的先验分布进行调整,调整的方法的先验分布进行调整,
9、调整的方法就是使用上面的贝叶斯公式,调整的结果就是后验分就是使用上面的贝叶斯公式,调整的结果就是后验分布布 。后验分布是三种信息的综合。获。后验分布是三种信息的综合。获得后验分布使人们对得后验分布使人们对的认识又前进一步,可看出,获得的认识又前进一步,可看出,获得样本的的效果是把样本的的效果是把我们对我们对的认识由的认识由()调整到调整到。所以对。所以对的统计推断就应建立在后验分布的统计推断就应建立在后验分布的基础上。的基础上。7第7页,本讲稿共50页例例1设设事事件件A的的概概率率为为,即即。为为了了估估计计而作而作n次独立观察,其中事件次独立观察,其中事件A出现次数为出现次数为X,则有则有
10、X服从二项分布服从二项分布即即如果此时我们对事件如果此时我们对事件A的发生没有任何了解,对的发生没有任何了解,对 的大小的大小也没有任何信息。在这种情况下,贝叶斯建议用区间(也没有任何信息。在这种情况下,贝叶斯建议用区间(0,1)上的均匀分布作为的先验分布。因为它在()上的均匀分布作为的先验分布。因为它在(0,1)上)上每一点都是机会均等的。这个建议被后人称为贝叶斯假每一点都是机会均等的。这个建议被后人称为贝叶斯假设。设。8第8页,本讲稿共50页此此式式在在定定义义域域上上与与二二项项分分布布有有区区别别。再再计计算算X的的边边际际密密度为度为样本样本X与参数的联合分布为与参数的联合分布为即即
11、9第9页,本讲稿共50页拉拉普普拉拉斯斯计计算算过过这这个个概概率率,研研究究男男婴婴的的诞诞生生比比例例是是否否大大于于0.5?如抽了如抽了251527个男婴个男婴,女婴女婴241945个个贝贝叶叶斯斯统统计计学学首首先先要要想想方方设设法法先先去去寻寻求求的的先先验验分分布布。先先验验分布的确定大致可分以下几步:分布的确定大致可分以下几步:第第一一步步,选选一一个个适适应应面面较较广广的的分分布布族族作作先先验验分分布布族族,使使它它在在数数学处理上方便一些,这里我们选用学处理上方便一些,这里我们选用分布族分布族10第10页,本讲稿共50页注:注:作为作为的先验分布族是恰当的,从以下几方面
12、考虑:的先验分布族是恰当的,从以下几方面考虑:1参参数数是是废废品品率率,它它仅仅在在(0,1)上上取取值值。因因此此,必必需需用用区区间间(0,1)上上的的一一个个分分布布去去拟拟合合先先验验信信息息。分分布布正正是是这样一个分布。这样一个分布。2分分布布含含有有两两个个参参数数a与与b,不不同同的的a与与b就就对对应应不不同同的的先先验验分布,因此这种分布的适应面较大。分布,因此这种分布的适应面较大。11第11页,本讲稿共50页3样样本本X的的分分布布为为二二项项分分布布b(n,)时时,假假如如的的先先验验分分布布为为分分布布,则则用用贝贝叶叶斯斯估估计计算算得得的的后后验验分分布布仍仍然
13、然是是分分布布,只只是是其其中中的的参参数数不不同同。这这样样的的先先验验分分布布(分分布布)称称为为参参数数的的共共轭轭先先验验分分布布。选选择择共共轭轭先先验验分分布布在在处处理理数数学学问问题题上上带来不少方便。带来不少方便。4国内外不少人使用国内外不少人使用分布获得成功。分布获得成功。第第二二步步,根根据据先先验验信信息息在在先先验验分分布布族族中中选选一一个个分分布布作作为为先先验验分分布布,使使它它与与先先验验信信息息符符合合较较好好。利利用用的的先先验验信信息息去去确确定定分分布布中中的的两两个个参参数数a与与b。从从文文献献来来看看,确确定定a与与b的的方方法法很很多多。例例如
14、如,如如果果能能从从先先验验信信息息中中较较为为准准确确地地算算得得先先验验平平均均和和先先验验方方差差,则则可可令令其其分分别别等等于于分分布布的的期期望望与与方方差差最最后后解解出出a与与b。12第12页,本讲稿共50页如果从先验信息获得如果从先验信息获得则则可可解解得得a=3,b=12这这意意味味着着的的先先验验分分布布是是参参数数a=3,b=12的的分布。分布。假假如如我我们们能能从从先先验验信信息息中中较较为为准准确确地地把把握握的的两两个个分分位位数数,如如确确定定确确定定的的10分分位位数数0。1和和50的的中中位位数数0。5,那那可以通过如下两个方程来确定可以通过如下两个方程来
15、确定a与与b。13第13页,本讲稿共50页假假如如的的信信息息较较为为丰丰富富,譬譬如如对对此此产产品品经经常常进进行行抽抽样样检检查查,每每次次都都对对废废品品率率作作出出一一个个估估计计,把把这这些些估估计计值值看看作作的的一一些些观观察察值值,再再经经过过整整理理,可可用用一一个个分分布布去拟合它。去拟合它。假假如如关关于于的的信信息息较较少少,甚甚至至没没有有什什么么有有用用的的先先验验信信息息,那那可可以以用用区区间间(0,1)上上的的均均匀匀分分布布(a=b=1情情况况)。用用均均匀匀分分布布意意味味着着我我们们对对的的各各种种取取值值是是“同同等等对对待待的的”,是,是“机会均等
16、的机会均等的”。14第14页,本讲稿共50页贝贝叶叶斯斯本本人人认认为为,当当你你对对参参数数的的认认识识除除了了在在有有限限区区间间(c,d)之之外外,其其它它毫毫无无所所知知时时,就就可可用用区区间间(c,d)上上的的均均匀匀分分布布作作为为的的先先验验分分布布。这这个个看看法法被被后后人人称称之之为为“贝贝叶叶斯假设斯假设”。确定了先验分布后,就可计算出后验分布,过程如下:确定了先验分布后,就可计算出后验分布,过程如下:x=0,1,n,01于是于是X的边际分布为的边际分布为15第15页,本讲稿共50页最后在给出最后在给出X=x的条件下,的条件下,的后验密度为的后验密度为显然这个后验分布仍
17、然是显然这个后验分布仍然是分布,它的两个参数分别是分布,它的两个参数分别是a+x和和b+n-x。我们选后验期望作为的贝叶斯估计,则我们选后验期望作为的贝叶斯估计,则的贝叶斯的贝叶斯估计为估计为与前面的极大似然估计是不同的。与前面的极大似然估计是不同的。16第16页,本讲稿共50页如果用(如果用(0,1)上的均匀作为)上的均匀作为的先验分布,则的先验分布,则的贝的贝叶斯估计为叶斯估计为 计算如下:计算如下:后验分布为后验分布为17第17页,本讲稿共50页三、三、常用的一些共轭先验分布常用的一些共轭先验分布对对于于一一些些常常用用的的指指数数分分布布族族,如如果果仅仅对对其其中中的的参参数数感感兴
18、兴趣,下表列出了它们的共轭先验分布及后验期望。趣,下表列出了它们的共轭先验分布及后验期望。分 布共 轭 先 验 分 布后 验 分 布 正态分布正态分布二项分布 分布 Poisson分布 分布(a,b)18第18页,本讲稿共50页EX1 EX1 设设是一批产品的不合格率,已知它不是是一批产品的不合格率,已知它不是0.10.1就是就是0.20.2,且其,且其先验分布为先验分布为(0.10.1)=0.7,=0.7,(0.20.2)=0.3=0.3假如从这批产品中随机取假如从这批产品中随机取8 8个进行检查,发现有个进行检查,发现有2 2个不合格,求个不合格,求的后验分布。的后验分布。解:解:19第1
19、9页,本讲稿共50页EX2 设一卷磁带上的缺陷数服从泊松分布设一卷磁带上的缺陷数服从泊松分布P()其中其中可取可取1.0和和1.5中的一个中的一个,又设又设的先验分布为的先验分布为 (1.0)=0.4(1.5)=0.6假如检查一卷磁带发现了假如检查一卷磁带发现了3个缺陷,求个缺陷,求的后验的后验分布。分布。20第20页,本讲稿共50页四、贝叶斯推断(估计)四、贝叶斯推断(估计)条件方法条件方法由由于于未未知知参参数数的的后后验验分分布布是是集集三三种种信信息息(总总体体、样样本本和和先先验验)于于一一身身,它它包包含含了了所所有有可可供供利利用用的的信信息息。故故有有关关的的参参数数估估计计和
20、和假假设设检检验验等等统统计计推推断断都都按按一一定定方方式式从从后后验验分分布布提提取取信信息息,其其提提取取方方法法与与经经典典统统计计推推断断相相比比要要简简单单明明确确得得多多。基基于于后后验验分分布布的的统统计计推推断断就就意意味味着着只只考考虑虑已已出出现现的的数数据据(样样本本观观察察值值)而而认认为为未未出出现现的的数数据据与与推推断断无无关关,这这一一重重要要的的观观点点被被称称为为“条条件件观观点点”,基基于于这这种种观观点点提提出出的的统统计计方法被称为条件方法。方法被称为条件方法。21第21页,本讲稿共50页例如经典统计学认为参数的无偏估计应满足:例如经典统计学认为参数
21、的无偏估计应满足:其其中中平平均均是是对对样样本本空空间间中中所所有有可可能能出出现现的的样样本本而而求求的的,可可实实际际中中样样本本空空间间中中绝绝大大多多数数样样本本尚尚未未出出现现过过,而而多多数数从从未未出出现现的的样样本本也也要要参参与与平平均均是是实实际际工工作作者者难难以以理理解解的的。故故在在贝贝叶叶斯斯推推断断中中不不用用无无偏偏性性,而而条条件件方方法法是是容容易易被被实实际际工工作作者理解和接受者理解和接受的。22第22页,本讲稿共50页估计估计1.1.贝叶斯估计贝叶斯估计 定定义义3.2 使使后后验验密密度度 达达到到最最大大的的值值 称称为为最最大大后后验验估估计计
22、;后后验验分分布布的的中中位位数数 称称为为后后验验中中位位数数估估计计;后后验验分分布布的的期期望望值值 称称为为 的的后后验验期期望望值值估计,这三个估计都称为贝叶斯估计,记为估计,这三个估计都称为贝叶斯估计,记为 。例例1 为估计不合格率为估计不合格率 ,今从一批产品中随机抽取,今从一批产品中随机抽取n件,其件,其中不合格品数中不合格品数X服从服从 ,一般选取,一般选取 为为 的先的先验分布,设验分布,设 已知,由共轭先验分布可知,已知,由共轭先验分布可知,的后验的后验分布为分布为可计算得:可计算得:23第23页,本讲稿共50页选用贝叶斯假设选用贝叶斯假设 ,则,则 第第一一、在在二二项
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 章贝叶斯 估计 精选 PPT
限制150内