贝叶斯统计学.pptx
《贝叶斯统计学.pptx》由会员分享,可在线阅读,更多相关《贝叶斯统计学.pptx(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、贝叶斯统计学贝叶斯统计简介贝叶斯统计简介:贝叶斯统计是英国统计学家贝叶斯(贝叶斯统计是英国统计学家贝叶斯(1702170217611761)首先提出的。贝叶斯统计是在与经典统计理论的长)首先提出的。贝叶斯统计是在与经典统计理论的长期争论中发展起来的。形成了两大重要的统计学派(贝派和期争论中发展起来的。形成了两大重要的统计学派(贝派和频派)。贝叶斯统计主要在统计决策理论中应用广泛。尽管频派)。贝叶斯统计主要在统计决策理论中应用广泛。尽管很早就产生贝叶斯统计,但它真正得到发展是二次世界大战很早就产生贝叶斯统计,但它真正得到发展是二次世界大战以后,特别是上个世纪初。以后,特别是上个世纪初。学习的目的
2、学习的目的:介绍贝叶斯统计的基本思想和基本方法,给学生介绍贝叶斯统计的基本思想和基本方法,给学生提供一种新的统计思维方式,丰富统计知识提供一种新的统计思维方式,丰富统计知识-锦上添锦上添花。同时提供一种研究实际统计问题的新方法。花。同时提供一种研究实际统计问题的新方法。学习方法学习方法:以概率论为基础,系统学习。注重方法的基本思想以概率论为基础,系统学习。注重方法的基本思想和原理。学会运用有关工具,加强练习。和原理。学会运用有关工具,加强练习。教学计划安排:教学计划安排:重点介绍重点介绍1 13 3章(原理),适当介绍章(原理),适当介绍4 45 5章。章。第1页/共100页第一章第一章 先验
3、分布与后验分布先验分布与后验分布 1.1 1.1 三种信息三种信息(总体信息、样本信息和先验信息总体信息、样本信息和先验信息)1.2 1.2 贝叶斯公式贝叶斯公式(事件形式和密度函数形式事件形式和密度函数形式)1.3 1.3 共轭先验分布共轭先验分布 1.4 1.4 超参数及其确定超参数及其确定 1.5 1.5 多参数模型多参数模型 1.6 1.6 充分统计量充分统计量第2页/共100页1.11.1三种信息三种信息 三种信息及对应的统计分科三种信息及对应的统计分科 贝叶斯统计与经典统计的主要区别贝叶斯统计与经典统计的主要区别第3页/共100页1.三种信息及对应的统计分科总体信息:是人们对总体的
4、了解,所带来的有关信息,总体信息包括总体分布或者总体分布族的有关信息。例如:“总体属于正态分布”、“它的密度函数是钟型曲线”等等。样本信息:是通过样本而给我们提供的有关信息。这类“信息”是最具价值和与实际联系最紧密的信息。人们总是希望这类信息越多越好。样本信息越多一般对总体推断越准确。基于以上两种信息所作出的统计推断被称为经典统计。其特征主要是:把样本数据看成是来自具有一定概率分布的总体,所研究的对象是总体,而不是立足与数据本身。第4页/共100页事实上,在现实活动中,还有一类信息可以用来进行统计推断-先验信息。先验信息:是在抽样之前有关所要研究的问题的一些信息。来源于经验和历史资料的总结。先
5、验信息是现实活动中一种有用的信息应该加以充分利用,但经典统计忽视了,对于统计推断是一个损失。利用先验信息进行统计推断的统计理论就是贝叶斯统计。第5页/共100页例11 英国统计学家Savage(1961)曾考察如下二个统计实验:A一位常饮牛奶加茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶。对此做了十次试验,她都正确地说出了。B一位音乐家声称,他能从一页乐谱辨别出是海顿(Haydn)还是莫扎特(Mozart)的作品。在十次这样的试验中,他都能正确辨别。在这两个统计试验中,假如认为被实验者是在猜测,每次成功概率为05,那么十次都猜中的概率为(2的负十次方)2-1000009766,这是一个很小
6、的概率,是几乎不可能发生的,所以“每次成功概率为o5”的假设应被拒绝。被实验者每次成功概率要比o5大得多。这就不是猜测,而是他们的经验在帮了他们的忙。可见经验(先验信息的一种)在推断中不可忽视,应加以利用。第6页/共100页例12 “免检产品”是怎样决定的?某厂的产品每天都要抽检几件,获得不合格品率的估计。经过一段时间后就积累大量的资料,根据这些历史资料(先验信息的一种)对过去产品的不合格率可构造一个分布:P(P(i/n)=i/n)=i i i i=0,1,2=0,1,2.n.n这个对先验信息进行加工获得的分布今后称为先验分布。这个先验分布是综合了该厂过去产品的质量情况。如果这个分布的概率绝大
7、部分集中在0 0附近,那该产品可认为是“信得过产品”。假如以后的多次抽检结果与历史资料提供的先验分布是一致的。使用单位就可以对它作出“免检产品”的决定,或者每月抽检一、二次就足够了,这就省去了大量的人力与物力。可见历史资料在统计推断中应加以利用。第7页/共100页2.贝叶斯统计与经典统计主要区别(1 1)统计推断所依据信息不同)统计推断所依据信息不同(2 2)对总体参数的认识不同)对总体参数的认识不同(3 3)对概率的理解不同)对概率的理解不同(4 4)对样本利用方式上不同)对样本利用方式上不同(5 5)应用领域不同)应用领域不同第8页/共100页1.21.2贝叶斯公式贝叶斯公式 事件形式的贝
8、叶斯公式事件形式的贝叶斯公式 密度函数形式贝叶斯公式密度函数形式贝叶斯公式 贝叶斯统计学派主要观点贝叶斯统计学派主要观点 后验分布及其与三种信息的关系后验分布及其与三种信息的关系第9页/共100页1.1.事件形式的贝叶斯公式事件形式的贝叶斯公式(1 1)全概公式)全概公式:设有事件设有事件A A只能与一完备事件组只能与一完备事件组 中之一事件同时发生,则事件中之一事件同时发生,则事件A A出现出现的概率的概率称上式为全概公式。称上式为全概公式。(2 2)贝叶斯公式)贝叶斯公式:设有事件设有事件A A只能与一完备事件组只能与一完备事件组 中之一事件同时发生,则事件中之一事件同时发生,则事件A A
9、发生发生的条件下的条件下 发生的概率发生的概率-称之为贝叶斯公式称之为贝叶斯公式m=1.nm=1.n第10页/共100页2.2.密度函数形式的贝叶斯公式密度函数形式的贝叶斯公式定定义义 设设在在给给定定样样本本x x后后,的的 后后验验分分布布为为 ,它它是是给给定定样本观测值样本观测值x x后的条件分布。若又设后的条件分布。若又设 和和x x具有联合密度具有联合密度 (x x为样本,下同为样本,下同)其中,其中,为为 的先验分布。的先验分布。x x的边缘密度(边际密度)为的边缘密度(边际密度)为 (为连续随机变量为连续随机变量)(为离散随机变量上式求和为离散随机变量上式求和)显然,显然,的后
10、验分布为(的后验分布为(m(x)m(x)0 0)称此为贝叶斯公式的密度函数形式。称此为贝叶斯公式的密度函数形式。第11页/共100页第12页/共100页3.3.贝叶斯学派主要认识贝叶斯学派主要认识(1 1)贝叶斯统计中)贝叶斯统计中 表示表示 给定时,某值给定时,某值x x的条件分布。的条件分布。(2 2)根据参数的先验信息确定的分布就是先验分布)根据参数的先验信息确定的分布就是先验分布(3 3 3 3)从贝叶斯观点来看,样本一般分两步进行,首先从)从贝叶斯观点来看,样本一般分两步进行,首先从 产生一个产生一个,第二步是,第二步是在分布在分布 产生一个样本。产生一个样本。(4 4)样本似然函数
11、为)样本似然函数为(5 5)h h将三种信息综合进去了。将三种信息综合进去了。(6 6)是将是将h h中与中与 无关即我们研究的问题无关的信息消除。基于后验分布作出无关即我们研究的问题无关的信息消除。基于后验分布作出推断。推断。第13页/共100页4.4.后验分布与三种信息的关系后验分布与三种信息的关系后验分布是利用总体信息、样本信息和先验信息进后验分布是利用总体信息、样本信息和先验信息进行综合处理(去粗取精)得到后验信息(即后验分行综合处理(去粗取精)得到后验信息(即后验分布)的过程。贝叶斯统计可就是以后验分布为基础布)的过程。贝叶斯统计可就是以后验分布为基础的统计学。的统计学。对理解后验分
12、布,可以这样看:事先人们对总体和对理解后验分布,可以这样看:事先人们对总体和 有一个初步的经验的认识这就是有一个初步的经验的认识这就是 ,当样本取得,当样本取得以后,根据样本的以后,根据样本的“鲜活鲜活”信息调整人们事先对总信息调整人们事先对总体和参数体和参数 的认识,得到后验分布的认识,得到后验分布 ,贝叶斯,贝叶斯统计再根据后验分布进行估计推断。统计再根据后验分布进行估计推断。对样本理解:样本在没有抽选之前,与经典统计一对样本理解:样本在没有抽选之前,与经典统计一样,抽样过程是随机的(样本值是随机变量),但样,抽样过程是随机的(样本值是随机变量),但一旦抽中就将其看作是总体的代表,而且提供
13、的信一旦抽中就将其看作是总体的代表,而且提供的信息是总体特征的反映,可以以此为基础影响统计推息是总体特征的反映,可以以此为基础影响统计推断。断。第14页/共100页例:例:设事件设事件A A发生发生的概率为的概率为,即,即(A)(A)。为了估计。为了估计 而作而作n n次独立观察。其中,事件次独立观察。其中,事件A A出现次数为出现次数为X X,显然,显然,X X服从二项服从二项分布分布b(n,b(n,)即即 (x=0,1,2,x=0,1,2,.n.n)若取若取 的先验分布为(的先验分布为(0,10,1)上的均匀分布,试求)上的均匀分布,试求 的后验分布。的后验分布。第15页/共100页解:由
14、于取先验分布为(0,1)上的均匀分布,即所以,利用贝叶斯公式,将抽样信息和先验信息进行综合。为此,计算样本x和参数的联合分布:(x=0,1,2x=0,1,2n n。00 11)由此,x的边缘分布为第16页/共100页第17页/共100页所以后验密度为所以后验密度为 贝塔分布贝塔分布,记为记为/x/xBe(x+1,n-x+1)Be(x+1,n-x+1)第18页/共100页 由此可见,后验分布只不过是样本信息出现以后人们对总体认识的一种合理调整,因为我们现在得到了“新鲜”样本信息。在调整的过程中,样本信息、总体信息和先验信息都以不同的方式影响着后验分布从而影响统计推断和统计决策过程。第19页/共1
15、00页各种信息对后验分布的影响总体分布对后验分布的影响是显然的,通过似然函数和样本发生的可能性来发挥作用。样本数据(信息)通过似然函数达到对后验分布的影响。我们相信在一次抽样中样本发生,就意味着已经取得的样本出现的概率最大。样本不同对总体认识不同。先验信息(包括先验分布形式、参数大小等)对后验分布均有较大影响。第20页/共100页拉普拉斯实例(拉普拉斯实例(p910p910)17861786年拉普拉斯研究巴黎男婴诞生的比率年拉普拉斯研究巴黎男婴诞生的比率:他希望检验男婴出生比率他希望检验男婴出生比率 是否大于是否大于0.50.5。收集收集17451745年年17701770年婴儿出生数据:男年
16、婴儿出生数据:男251527251527个;女婴个;女婴241945241945个。个。选用先验分布:选用先验分布:在在n=251527+241945=493472,x=251527n=251527+241945=493472,x=251527时,代入时,代入/x/xBe(x+1,n-Be(x+1,n-x+1)x+1)得后验分布为:得后验分布为:第21页/共100页第22页/共100页根据上式计算0.5的概率第23页/共100页P(0.5/x)=1.1510-42在样本出现以前,在01之间处处等可能取值。在样本出现以后,按分布/xBe(x+1,n-x+1)在01之间取值。这是调整以后的结果。由
17、于从调整以后结果来看,小于0.5的概率非常小,所以认为应该大于0.5。第24页/共100页进一步研究考察样本是如何对先验分布进行调整的。在此,最初先验分布是一个均匀分布,即:第25页/共100页第26页/共100页第27页/共100页第28页/共100页第29页/共100页第30页/共100页第31页/共100页第32页/共100页例例 验验血血可可以以帮帮助助判判断断一一个个人人是是否否有有某某种种疾疾病病,化化验验结结果果或或者者为为阳阳性性(x x=1=1表表示示),或或者者为为阴阴性性(以以x x0 0表表示示)。令令1 1表表示示状状态态“有有病病”,2 2表表示示状状态态“无无病病
18、”。又又知知p(x=1/p(x=1/1 1)=0.8)=0.8,p(x=0/p(x=0/1 1)=0.2)=0.2,p(x=1/p(x=1/2 2)0.30.3,p(x=0/p(x=0/2 2)0.70.7。又又设设有有先先验验分分布布(信信息息)(1 1)0.050.05,(2 2)0.950.95,求求后后验验分分布布,并并体体验验样样本本调调整整先先验验分布为后验分布的过程。分布为后验分布的过程。第33页/共100页解:解:为了计算后验分布(概率)先计算边缘分布:为了计算后验分布(概率)先计算边缘分布:(将将f f都应换成都应换成p p)m(1)=p(1/m(1)=p(1/1 1)(1
19、1)p(1/p(1/2 2)(2 2)=0.04+0.285=0.325=0.04+0.285=0.325第34页/共100页例例1 16 6 伊伊索索寓寓言言“孩孩子子与与狼狼”讲讲的的是是一一个个小小孩孩每每天天到到山山上上放放羊羊,山山里里有有狼狼出出没没,第第一一天天他他在在山山上上喊喊:“狼狼来来了了!狼狼来来了了!”山山下下的的村村民民们们闻闻声声便便去去打打狼狼,可可到到了了山山上上,发发现现狼狼没没有有来来;第第二二天天仍仍是是如如此此;第第三三天天,狼狼真真的的来来了了,可可无无论论小小孩孩怎怎么么喊喊叫叫,也也没没有有人人来来救救他他,因因为为前前二二次次他他说说了了谎谎话
20、话,人人们们不不再再相相信信他他了了。用用贝贝叶叶斯斯统统计计来来分分析析这个寓言中村民的心理活动。这个寓言中村民的心理活动。第35页/共100页解解:为为此此先先要要作作一一些些假假设设。首首先先假假设设村村民民们们对对这这个个小小孩孩的的印印象象一一般般,他他爱爱说说谎话谎话(记为记为1 1)和爱说和爱说真话真话(记为记为2 2)的概率相同,即设的概率相同,即设 (1 1)1/2 1/2 (2 2)1/21/2 另另外外再再假假设设:爱爱说说谎谎话话的的孩孩子子喊喊狼狼来来了了(记记为为x x1 1)时时,狼狼来来的的概概率率为为1 13 3,爱爱说说真真话话的的孩孩子子喊喊狼狼来来了了时
21、时,狼狼来来的的概概率率为为3 34 4,相相应应地地狼狼没没有有来来(记记为为x x2 2),所所以有以有p(xp(x1 1/1 1)=1/3 p(x)=1/3 p(x1 1/2 2)=3/4)=3/4p(xp(x2 2/1 1)=2/3 p(x)=2/3 p(x2 2/2 2)=1/4)=1/4当当第第一一次次村村民民上上山山打打狼狼,发发现现狼狼没没有有来来(x(x2 2发发生生了了)时时,村村民民们们对对说说谎谎话话小小孩孩的的认认识识集集中中体体现现在在条条件件概概率率(1 1/x x2 2)上上,根根据据上上述述假假设设,利利用用贝贝叶叶斯斯公公式式不不难难算得算得第36页/共10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 统计学
限制150内