概率密度函数的估计..ppt
《概率密度函数的估计..ppt》由会员分享,可在线阅读,更多相关《概率密度函数的估计..ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章概率密度函数的估计概率密度函数的估计v概率密度估计的基础知识概率密度估计的基础知识v参数估计理论参数估计理论极大似然估计(极大似然估计(MLE)贝叶斯估计(或称最大后验估计)贝叶斯估计(或称最大后验估计)贝叶斯学习贝叶斯学习v非参数估计理论非参数估计理论密度估计密度估计Parzen窗估计窗估计K近邻估计近邻估计(KNE)4-1概率密度估计的基础知识概率密度估计的基础知识贝叶斯分类器中只要知道先验概率、条件概率或后验概概率P(i),P(x/i),P(i/x)就可以设计分类器了。现在来研究如何用已知训练样本的信息去估计P(i),P(x/i),P(i/x)一参数估计与非参数估计一参数估计
2、与非参数估计参参数数估估计计:先假定研究的问题具有某种数学模型,如正态分布,二项分布,再用已知类别的学习样本估计里面的参数。非非参参数数估估计计:不假定数学模型,直接用已知类别的学习样本的先验知识直接估计数学模型。二监督参数估计与非监督参数估计二监督参数估计与非监督参数估计监监督督参参数数估估计计:样本所属的类别及类条件总体概率概率密度函数的形式已知,而表征概率密度函数的某些参数是未知的。目的在于:由已知类别的样本集对总体分布的某些参数进行统计推断,此种情况下的估计问题称为监督参数估计。非监督参数估计非监督参数估计:已知总体概率密度函数形式但未知样本所属类别,要求推断出概率密度函数的某些参数,
3、称这种推断方法为非监督情况下的参数估计。注注:监督与非监督是针对样本所属类别是已知还是未知而言的。三三.参数估计的基本概念参数估计的基本概念1.统计量统计量:样本中包含着总体的信息,总希望通过样本集把有关信息抽取出来。也就是说,针对不同要求构造出样本的某种函数,该函数称为统计量。2.参数空间参数空间:在参数估计中,总假设总体概率密度函数的形式已知,而未知的仅是分布中的参数,将未知参数记为,于是将总体分布未知参数的全部可容许值组成的集合称为参数空间,记为。3.点估计、估计量和估计值点估计、估计量和估计值:点估计问题就是构造一个统计量作为参数的估计,在统计学中称为的估计量。若是属于类别的几个样本观
4、察值,代入统计量d就得到对于第i类的的具体数值,该数值就称为的估计值。4.区间估计区间估计:除点估计外,还有另一类估计问题,要求用区间作为可能取值范围得一种估计,此区间称为置信区间,该类估计问题称为区间估计。5.参数估计方法参数估计方法:参数估计是统计学的经典问题,解决方法很多,在此只考虑两种常用方法:一种是最大似然估计方法,另一种是贝叶斯估计方法。(1)最大似然估计:最大似然估计:把参数看作是确定而未知的,最好的估计值是在获得实际观察样本的最大的条件下得到的。(2)贝叶斯估计:贝叶斯估计:把未知的参数当作具有某种分布的随机变量,样本的观察结果使先验分布转化为后验分布,再根据后验分布修正原先对
5、参数的估计。6.参数估计的评价参数估计的评价:评价一个估计的“好坏”,不能按一次抽样结果得到的估计值与参数真值的偏差大小来确定,而必须从平均和方差的角度出发进行分析,即关于估计量性质的定义。4-2参数估计理论参数估计理论一极大似然估计一极大似然估计假定:待估参数是确定的未知量按类别把样本分成M类X1,X2,X3,XM其中第i类的样本共N个Xi=(X1,X2,XN)T并且是独立从总体中抽取的Xi中的样本不包含(ij)的信息,所以可以对每一类样本独立进行处理。第i类的待估参数根据以上四条假定,我们下边就可以只利用第i类学习样本来估计第i类的概率密度,其它类的概率密度由其它类的学习样本来估计。1.一
6、般原则:一般原则:第i类样本的类条件概率密度:P(Xi/i)=P(Xi/ii)=P(Xi/i)原属于i类的学习样本为Xi=(X1,X2,XN,)Ti=1,2,M求求i的极大似然估计就是把的极大似然估计就是把P(Xi/i)看成看成i的函数,求的函数,求出使它极大时的出使它极大时的i值。值。学习样本独立从总体样本集中抽取的N个学习样本出现概率的乘积取对数:对i求导,并令它为0:有时上式是多解的,上图有5个解,只有一个解最大即.P(Xi/i)2.多维正态分布情况多维正态分布情况已知,未知,估计服从正态分布所以在正态分布时代入上式得所以,有这说明未知均值的极大似然估计正好是训练样本的算术平均。,均未知
7、A.一维情况:n=1对于每个学习样本只有一个特征的简单情况:(n=1)由 上 式得即学习样本的算术平均样本方差v讨论讨论:1.正态总体均值的极大似然估计即为学习样本的算术平均2.正态总体方差的极大似然估计与样本的方差不同,当N较大的时候,二者的差别不大。B多维情况:n个特征(推导过程,作为练习)估计值:结论结论:的估计即为学习样本的算术平均估计的协方差矩阵是矩阵的算术平均(nn阵列,nn个值)二二.贝叶斯估计贝叶斯估计极大似然估计是把待估的参数看作固定的未知量,而贝叶斯估计则是把待估的参数作为具有某种先验分布的随机变量,通过对第i类学习样本Xi的观察,通过贝叶斯准则将概率密度分布P(Xi/)转
8、化为后验概率P(/Xi),进而求使得后验概率分布最大的参数估计,也称最大后验估计。估计步骤估计步骤:确定的先验分布P(),待估参数为随机变量。用第i类样本xi=(x1,x2,.xN)T求出样本的联合概率密度分布P(xi|),它是的函数。利用贝叶斯公式,求的后验概率下面以正态分布的均值估计为例说明贝叶斯估计的过程:一维正态分布一维正态分布:已知2,估计假设概率密度服从正态分布P(X|)=N(,2),P()=N(0,02)第i类学习样本xi=(x1,x2,.xN)T,i=1,2,M第i类概率密度P(x|i,xi)=P(x|xi)所以由贝叶斯公式,则可得后验概率:因为N个样本是独立抽取的,所以上式可
9、以写成其中为比例因子,只与x有关,与无关P(Xk|)=N(,2),P(u)=N(0,02)其中a,a包含了所有与无关的因子P(|Xi)是u的二次函数的指数函数P(|Xi)仍然是一个正态函数,P(|Xi)=N(N,N2)另外后验概率可以直接写成正态形式:比较以上两个式子,对应的系数应该相等解以上两式得将N,代入P(|Xi)可以得到后验概率,再用公式 对的估计为若令P()=N(0,02)=N(0,1),即为标准正态分布,且总体分布的方差也为1,则此时估计与极大似然估计相似,只是分母不同。三贝叶斯学习三贝叶斯学习1.贝叶斯学习的概念贝叶斯学习的概念:通过已有的概率分布和观测数据推理求出的后验概率之后
10、,直接去推导总体分布(形式已知),即当观察一个样本时,N=1就会有一个的估计值的修正值;当观察N=4时,对进行修正,向真正的靠近;当观察N=9时,对进行修正,向真正的靠的更近;当观察N个样本后,N就反映了观察到N个样本后对的最好推测,而N2反映了这种推测的不确定性。N,N2,N2 随观察样本增加而单调减小,且当N,N20;当N,P(|xi)越来越尖峰突起,于是N,P(|xi)函数,即收敛于一个以真实参数为中心的函数,这个过程成为贝叶斯学习贝叶斯学习。2类概率密度的估计类概率密度的估计在求出u的后验概率P(|xi)后,可以直接利用式推断类条件概率密度。即P(x|xi)P(x|i,xi)一维正态一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 密度 函数 估计
限制150内