贝叶斯估计在抽样调查中的应用(PPT39页)17331.ppt
-
资源ID:83279627
资源大小:754KB
全文页数:40页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
贝叶斯估计在抽样调查中的应用(PPT39页)17331.ppt
贝叶斯估计及其在 抽样调查中的应用 (BayesBayes,ThomasThomas)(1702(1702 1761)1761)贝叶斯是英国数学家贝叶斯是英国数学家贝叶斯是英国数学家贝叶斯是英国数学家.1702.1702年生于伦敦;年生于伦敦;年生于伦敦;年生于伦敦;17611761年年年年4 4月月月月1717日卒于坦布里奇韦尔斯日卒于坦布里奇韦尔斯日卒于坦布里奇韦尔斯日卒于坦布里奇韦尔斯.贝叶斯是一位自学成才的数学家贝叶斯是一位自学成才的数学家贝叶斯是一位自学成才的数学家贝叶斯是一位自学成才的数学家.曾助理宗教曾助理宗教曾助理宗教曾助理宗教事务,后来长期担任坦布里奇韦尔斯地方教堂的事务,后来长期担任坦布里奇韦尔斯地方教堂的事务,后来长期担任坦布里奇韦尔斯地方教堂的事务,后来长期担任坦布里奇韦尔斯地方教堂的牧师牧师牧师牧师.1742.1742年,贝叶斯被选为英国皇家学会会员年,贝叶斯被选为英国皇家学会会员年,贝叶斯被选为英国皇家学会会员年,贝叶斯被选为英国皇家学会会员.如今在概率、数理统计学中以贝叶斯姓氏命名如今在概率、数理统计学中以贝叶斯姓氏命名如今在概率、数理统计学中以贝叶斯姓氏命名如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计等等贝叶斯统计等等贝叶斯统计等等贝叶斯统计等等.2 2贝叶斯方法(Bayesian approach)贝叶斯方法是基于贝叶斯定理而发展起来用于系统地贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述解决统计问题的方法阐述解决统计问题的方法(Samuel Kotz(Samuel Kotz和吴喜之和吴喜之,2000),2000)。贝叶斯推断的基本方法是将关于未知参数的先验信息贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数后根据后验信息去推断未知参数(茆诗松和王静龙等茆诗松和王静龙等,1998,1998年年)。“贝叶斯提出了一种归纳推理的理论贝叶斯提出了一种归纳推理的理论(贝叶斯定理贝叶斯定理),以后被一些统计学者发展为一种系统的统计推断方法,称以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法为贝叶斯方法.”摘自摘自中国大百科全书中国大百科全书(数学卷)(数学卷)3 3第一章先验分布与后验分布 统计学有两个主要学派统计学有两个主要学派:频率学派与贝叶斯学派频率学派与贝叶斯学派.它们它们之间有异同之间有异同,贝叶斯统计是在与经典统计的争论中发展起贝叶斯统计是在与经典统计的争论中发展起来来,主要的争论有主要的争论有:1.1.未知参数可否作为随机变量未知参数可否作为随机变量?2.2.事件的概率是否一定的频率解释事件的概率是否一定的频率解释?3.3.概率是否可用经验来确定概率是否可用经验来确定?.1.1 1.1 先介绍三种信息的概念先介绍三种信息的概念 经典统计学派规定统计推断使用两种信息经典统计学派规定统计推断使用两种信息:总体信息总体信息总体信息总体信息 样本信息样本信息样本信息样本信息 而而而而贝叶斯学派认为是三种信息贝叶斯学派认为是三种信息:总体信息总体信息总体信息总体信息 样本信息样本信息样本信息样本信息 先验信息先验信息先验信息先验信息4 4总体信息总体信息 即总体分布或总体所属分布族给我们的信息。即总体分布或总体所属分布族给我们的信息。譬如,譬如,“总体是正态分布总体是正态分布”就给我们带来很多信就给我们带来很多信息:密度函数是一条钟形曲线;一切一阶距都存息:密度函数是一条钟形曲线;一切一阶距都存在;有关正态变量(服从正态分布随机变量)的在;有关正态变量(服从正态分布随机变量)的一些事件的概率可以计算;由正态分布可以导出一些事件的概率可以计算;由正态分布可以导出分布,分布和分布等重要分布,还有许多成熟的分布,分布和分布等重要分布,还有许多成熟的点估计、区间估计和假设检验方法可供我们选用。点估计、区间估计和假设检验方法可供我们选用。总体信息是很重要的信息,为了获得此信息,往总体信息是很重要的信息,为了获得此信息,往往耗资巨大。往耗资巨大。5 5样本信息样本信息n n 从总体中抽取的样本给我们提供的信息从总体中抽取的样本给我们提供的信息。n n 这是最“新鲜”的信息,并且愈多愈好。人们希望对样本的加工和处理对总体的某些特征作出较为精确的统计推断。没有样本就没有统计学可言。这是大家都理解的事实。6 6 基于上述两种信息进行的统计推断称为经典统基于上述两种信息进行的统计推断称为经典统基于上述两种信息进行的统计推断称为经典统基于上述两种信息进行的统计推断称为经典统计学,它的基本观点是把数据(样本)看成是具计学,它的基本观点是把数据(样本)看成是具计学,它的基本观点是把数据(样本)看成是具计学,它的基本观点是把数据(样本)看成是具有一定概率分布的总体,所研究的对象是这个总有一定概率分布的总体,所研究的对象是这个总有一定概率分布的总体,所研究的对象是这个总有一定概率分布的总体,所研究的对象是这个总体而不局限于数据本身。这方面最早的工作是高体而不局限于数据本身。这方面最早的工作是高体而不局限于数据本身。这方面最早的工作是高体而不局限于数据本身。这方面最早的工作是高斯斯斯斯(Gauss,C.F.17771855(Gauss,C.F.17771855)和勒让德和勒让德和勒让德和勒让德(Legendre,A.M.17521833Legendre,A.M.17521833)的误差分析,正态的误差分析,正态的误差分析,正态的误差分析,正态分布和最小二乘法。从十九世纪末到二十世纪上分布和最小二乘法。从十九世纪末到二十世纪上分布和最小二乘法。从十九世纪末到二十世纪上分布和最小二乘法。从十九世纪末到二十世纪上半叶,经皮尔逊半叶,经皮尔逊半叶,经皮尔逊半叶,经皮尔逊(Pearson,K.18571936Pearson,K.18571936)、费、费、费、费歇歇歇歇(Fisher,R.A.18901962Fisher,R.A.18901962)奈曼奈曼奈曼奈曼(Neyman.J.Neyman.J.)等人的杰出工作创立了经典统计学。随着经典统等人的杰出工作创立了经典统计学。随着经典统等人的杰出工作创立了经典统计学。随着经典统等人的杰出工作创立了经典统计学。随着经典统计学的持续发展与广泛的应用,它本身的缺陷也计学的持续发展与广泛的应用,它本身的缺陷也计学的持续发展与广泛的应用,它本身的缺陷也计学的持续发展与广泛的应用,它本身的缺陷也逐渐暴露出来了。逐渐暴露出来了。逐渐暴露出来了。逐渐暴露出来了。7 7先验信息先验信息 即在抽样之前有关统计问题的一些信息,一般说来,即在抽样之前有关统计问题的一些信息,一般说来,先验信息主要先验信息主要来源于经验和历史资料来源于经验和历史资料。例例1 1:有一英国妇女,对奶茶能辨别出先倒进茶还是:有一英国妇女,对奶茶能辨别出先倒进茶还是先倒进奶,做十次试验她都正确说出。先倒进奶,做十次试验她都正确说出。某学生第一次第一次看到他的数学老师,即有反应:老师30岁到40之间,极可能35岁左右(左右可理解为正负3岁,极可能可理解为90%的可能).P(32X38)=0.908 89 9三种信息三种信息 基于上述三种信息(总体信息、样本信息和基于上述三种信息(总体信息、样本信息和先验信息)进行的统计推断被称为贝叶斯统计学。先验信息)进行的统计推断被称为贝叶斯统计学。它与经典统计学的主要差别在于是否利用先验信它与经典统计学的主要差别在于是否利用先验信息。息。贝叶斯统计学派把任意一个未知参数都看成贝叶斯统计学派把任意一个未知参数都看成贝叶斯统计学派把任意一个未知参数都看成贝叶斯统计学派把任意一个未知参数都看成随机变量,应用一个概率分布去描述它的未知状随机变量,应用一个概率分布去描述它的未知状随机变量,应用一个概率分布去描述它的未知状随机变量,应用一个概率分布去描述它的未知状况,该分布称为先验分布。况,该分布称为先验分布。况,该分布称为先验分布。况,该分布称为先验分布。1010贝叶斯的信息处理路径贝叶斯的信息处理路径1111n n后验分布是三种信息的综合后验分布是三种信息的综合后验分布是三种信息的综合后验分布是三种信息的综合,先验分布反应人们在先验分布反应人们在先验分布反应人们在先验分布反应人们在抽样前对参数的认识抽样前对参数的认识抽样前对参数的认识抽样前对参数的认识,后验分布反应人们在抽样后后验分布反应人们在抽样后后验分布反应人们在抽样后后验分布反应人们在抽样后对参数的认识对参数的认识对参数的认识对参数的认识n nBayesBayes统计推断原则统计推断原则统计推断原则统计推断原则:对参数对参数 所作任何推断所作任何推断(参参数估计数估计,假设检验等假设检验等)都必须建立在后验分布基础上都必须建立在后验分布基础上.1212共轭分布法 后验分布和先验分布是同一个类型后验分布和先验分布是同一个类型后验分布和先验分布是同一个类型后验分布和先验分布是同一个类型1313 定义:定义:定义:定义:设是总体分布中的参数(或参数向量),设是总体分布中的参数(或参数向量),是的先验密度函数,假如由抽样信息算得的后验是的先验密度函数,假如由抽样信息算得的后验密度函数与有相同的密度函数形式,则称是的密度函数与有相同的密度函数形式,则称是的(自然)共轭先验分布。(自然)共轭先验分布。应该着重指出,共轭先验分布是对某一分布应该着重指出,共轭先验分布是对某一分布中的参数而言的。如正态均值、正态方差、泊松中的参数而言的。如正态均值、正态方差、泊松均值等。离开指定参数及其所在的分布去谈论共均值等。离开指定参数及其所在的分布去谈论共轭先验分布是没有意义的。轭先验分布是没有意义的。1414正态均值(方差已知)的共轭先验分布是正态分布正态均值(方差已知)的共轭先验分布是正态分布正态均值(方差已知)的共轭先验分布是正态分布正态均值(方差已知)的共轭先验分布是正态分布151516161717常用共轭先验分布常用共轭先验分布1818共轭先验分布的优点共轭先验分布的优点1919贝叶斯估计在抽样推断中的应用 贝叶斯估计法也是一种需要利用与调查变量相关的辅助变量(先验信息)进行估计的方法,但其方法和思路与其他方法相比有自己的特色。贝叶斯估计法的基本思路是,要对某一指标或目标进行估计,则总体以前该指标的水平,即先验指标与目前欲估计的指标(即目标量)也称后验指标有关,可以利用先验指标对后验指标进行估计。2020n n设,欲对总体均值 进行估计,根据该总体以往的资料有该指标的平均数 和方差 ,现从总体N中抽出容量为n的样本,计算得样本平均数 和该平均数的方差 ,则总体均值的贝叶斯估计法的估计量为:n n 2121n n其中:其中:估计量的方差为:估计量的方差为:2222 显然显然 是相关的同一指标的两个取值水是相关的同一指标的两个取值水平,则上式的平,则上式的 可以看做是以方差的倒数可以看做是以方差的倒数 和和 为权数的加权算术平均,实际上此方差的为权数的加权算术平均,实际上此方差的 倒数是估计精度的倒数,即方差的值越大,其倒数是估计精度的倒数,即方差的值越大,其 倒数便越小,则相应平均数作为估计的精度就倒数便越小,则相应平均数作为估计的精度就 越低,通俗的讲是该平均数的代表性越差;反之,越低,通俗的讲是该平均数的代表性越差;反之,方差越小,其倒数越大,相应平均数的估计精度方差越小,其倒数越大,相应平均数的估计精度越高。越高。2323 贝叶斯估计量方差的意义是先验指标和抽样指标精度之和的倒数。而以上估计式有非常直观的含义:贝叶斯估计量的精度为先验指标精度与抽样指标精度之和,这意味着贝叶斯估计量的精度要高于 中任何一个作为估计量的估计精度,即:2424 例如,某市有居民家庭共97670户,根据上年的统计,居民人均月货币收入为2580元,其方差为5804.22,现从该总体中随机抽出100户,调查目前居民人均收入水平情况,有关调查结果和计算见表8.252526262727282829293030313132323333343435353636373738383939谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH