《贝叶斯统计学的运用与瞻望.docx》由会员分享,可在线阅读,更多相关《贝叶斯统计学的运用与瞻望.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、贝叶斯统计学的运用与瞻望0引言贝叶斯统计方法是一种以贝叶斯公式为核心,以先验信息和后验信息为综合根据,以“辩证推断为主要特征的统计方法。与经典的统计归纳推理方法相比,它采用了一种全新的思维范式,将不确定参数看作随机变量,并以贝叶斯理论BayesTheory为基础,将获取数据前人们的主观信念作为先验信息与样本信息进行综合,再根据贝叶斯定理推导出参数的后验概率分布,最后以该后验分布为基础,利用模拟方法进行参数的统计推断。1贝叶斯基本统计理论就基本统计理论而言,贝叶斯统计学与经典统计学存在着重大的差异,其中最主要的特征能够概括为下面三个方面:1.1“主观概率在经典频率统计学中,概率通常被定义为:在同
2、一条件下进行屡次重复实验的基础上对事件出现可能性的一种测度,是一种基于数据的“客观的概率。然而,在贝叶斯统计学中,概率被看作是人们对于一个不确定事件真实度的相信程度或者信念,不依靠事件能否重复,是一种“主观概率。贝叶斯学派以为频率解释的概率只能应用于在一定时期内能够重复地、无限次地出现的事件,至少在理论上应该如此,然而事实上,一些事件的概率通过大量重复试验获得是不现实的,很多时候人们都是根据已有的知识和逻辑推理能力来对统计问题作出判定的。1.2先验信息对于“客观“概率的经典频率统计学而言,统计推断一般只需要两方面的信息:是模型信息,即已知或假定研究对象数量特征构成的总体服从某种概率分布,如正态
3、分布等等。二是数据信息,即通过试验或者调查获得的相关样本数据信息。所有统计推断都仅依靠于这些“客观样本数据来完成。然而,贝叶斯统计学除了以上两种信息外,还利用另外一种信息,那就是先验信息。基于“主观“概率的贝叶斯统计学以为在进行试验或者调查获取相关数据前,人们往往已经从理论分析、实践经历积累以及主观判定,长期积累了很多资料和信息,这些先验信息使得人们在没有数据的情况下仍然能对不确定事件给出一定的信度评价。假如能够利用这些信息,并与观察数据有机结合起来无疑能帮助提高统计推断的质量,十分是在可获数据较少的情况下,先验信息的作用更为明显。1.3未知参数的随机性在经典统计学派看来,总体中的待估参数是一
4、个普通的未知变量,其值是一个固定不变的常数。为了对这个未知参数进行推断,往往需要从总体中进行大量重复的抽样,被抽取的样本被看成是来自服从一定概率分布如正态分布总体的随机变量。因而,经典统计实际上是利用了所有可能的随机样本信息,来实现对某个参数的无偏估计。相反,贝叶斯统计学将任何一个未知参数都看作是随机变量,都具有不确定性,并且能够通过一个概率分布来描绘。在获取数据之前能够根据经历或历史资料构建该参数的先验分布,在获得样本数据之后,能够利用样本数据对先验分布修正获得该参数的后验分布。因而,贝叶斯统计所研究的并不是样本空间,而是参数的取值规律,其利用的是已固定的一组样本信息,而非所有可能的随机样本
5、。2贝叶斯统计推断方法参数估计与假设检验构成统计推断的两大基本内容,贝叶斯统计学在这两个方面构成了与频率统计学相平行的理论方法,并赋予统计推断以新的解释。2.1点估计就点估计而言,经典统计学通常要求,作为总体参数的一个优良估计必须具备无偏性,即假如用赞表示总体参数的优良估计值,那么赞必须具备E赞=的性质,也就是从总体N个单位中按随机性原则抽取n个单位组成样本,假如对每一个样本都计算一次赞的值,那么共CnN个赞值的期望均值应该等于。然而,在实际应用中,人们往往只能根据一次抽样观察做出估计,显然就不可回避这样的问题,在一次抽样观察中用赞去估计,其优良性怎样去评估呢?对此,根据经典统计学的理论是不好
6、给出确切讲明的。然而,贝叶斯统计推断采用损失函数作为选取最佳估计值的评价标准。它以为最佳估计值的选取依靠于用赞来估计参数真值时所造成的损失,一般用损失函数L赞,来表示,若要获得最佳估计值,就必须使在所有可能值上的后验加权平均(或期望)损失最小,即E/y/y,L赞,=乙L赞,/y坠到达最小。假如采用二次损失函数L1=c赞,2,那么后验期望损失就变为:E/y/y,L1赞,=乙c赞,2/y坠对上式求导,得dd赞=2乙c赞-/y坠,令上式为0,即可获得的最佳点估计值实际上就是后验密度的均值(期望):赞=E=乙/y坠。由此可见,在贝叶斯点估计时,参数估计的优良性能够通过期望后验损失最小来反映,而且后验分
7、布是仅依靠于一次抽样观察做出的,因而无论抽样能否能够重复,都能够对某一次抽样观察给出最优估计值。2.2区间估计对于区间估计而言,在经典统计学中,通常假设对于给定值01,假如来历自总体分布Fy,的随机样本y1,y2,yn确定的两个统计量=y1,y2,yn和=y1,y2,yn知足:P=y1,y2,yn=y1,y2,yn叟1-,那么就将随机区间,称作为的置信水平为1-的置信区间。然而这里出现了一个问题就是,由于在经典统计学中,总体参数被视为是一个固定不变的常数,因而并不能以为参数落在置信区间,中的概率为1-,只能以为,在n次抽样中,有1-CnN次求出的置信区间能够覆盖到总体参数,另外CnN次无法覆盖
8、。因此这种解释,对于仅进行一次抽样或者试验的人来讲,其实是毫无意义的。相反,在贝叶斯统计学中,总体参数被看做是一个服从一定概率分布的随机变量,因而,一旦获得的后验分布/y,就可得到落入某个区间内的后验概率,例如Pa燮0燮b/y=ba乙/y1-,它表示参数落入区间a,b的概率为1-。当然,这里的a和b并不唯一单峰型的密度函数中是唯一的,在贝叶斯区间估计时,通常选用最大后验密度HPD作为总体参数的贝叶斯可信区间,以保证这个可信区间内的每点的后验密度函数值都大于区间以外点的密度函数值。由此可见,在置信区间的解释和处理上,较经典统计而言,贝叶斯统计含意更为明晰明了,并且在置信区间的寻求和计算上也简单得
9、多。2.3假设检验对于假设检验问题,经典统计学运用的是反证思想进行推断。即认定在一次实验中,小概率事件不会发生的前提下,假如观察到的事件,是H0为真时不合理的小概率事件,则拒绝原假设H0。详细可表示为假如代表小概率,那么在原假设H0为真的条件下,若样本y发生的概率Py/H0,则讲明是小概率事件,原假设H0为假。与之不同的是,贝叶斯统计学直接讨论H0和H1的后验概率,通过比拟后验概率的大小进行判定。假如PH0/y和PH1/y分别为两个假设事件的后验概率,那么当PH0/yPH1/y时,则拒绝原假设H0,反之则接受。事实上,上述两种推断方法在一定程度上统一于贝叶斯公式。由贝叶斯公式容易得到:PH0/
10、yPH1/y=PH0Py/H0PH1Py/H1。因而,当PH0=PH1,即H0与H1居于平等地位时,经典学派与贝叶斯学派的结果是一致的。然而,在进行假设检验的时候,原假设和备择假设的提法一般是有讲究的,它要求把带有倾向性的意见当作备择假设,而把与备择假设相对立的假设作为原假设。因而,H0常居于将被否认的位置,由于这种倾向性意见的存在,经典统计推断的结果很容易遭到原假设和备择假设的位置的影响,当两种假设的位置互换后,其推断结果很可能不同。但对于贝叶斯统计推断而言,由于是基于各个假设的后验概率进行判定,因而其推断结果并不遭到两者位置的影响。此外,经典统计学中的假设检验也存在好像参数估计解释那样的问
11、题。假如在给定的显著水平下,根据经典统计学的解释是,在可能的CnN个样本中,共做CnN次假设检验,其中平均有CnN次否认了原假设,而1-CnN次没有拒绝原假设,因而,同样没有直接回答原假设成不成立的问题。而贝叶斯假设检验不要求接受或是拒绝某个假设,由于后验时机比就足以讲明问题。贝叶斯统计在检验问题中的另外一个优势在于多重检验问题,是经典统计所办不到的。例如将假设设为:H00;H10;H20。贝叶斯统计中只需分别计算H0、H1和H2的后验概率来做出推断,而经典统计方法则很难去处理此类问题。3结论与瞻望由上所述,贝叶斯统计学能够不断发展壮大的原因在于,在很多方面它比经典统计有明显的优势。然而,贝叶斯统计学赖以与经典统计学叫板的地方,恰恰是其遭到质疑的地方。贝叶斯学派遭到的批评集中于两个方面:一是,将参数看成是随机变量能否妥当;二是,参数的先验分布的主观问题。其实在很多情况下,假如不考虑其中涉及到的统计思想和概率理论基础,用贝叶斯统计方法导出来的结果与经典统计学几乎没有二致。贝叶斯统计学与经典统计学不存在谁要取代谁的问题,解决二者之间争论的最好办法,恐怕还要着眼于互相扬长避短,一切以能得到良好的统计推断为根本目的。
限制150内