非参数估计完整.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《非参数估计完整.pptx》由会员分享,可在线阅读,更多相关《非参数估计完整.pptx(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、引言参数化估计:ML方法和Bayesian估计。假设概率密度形式已知。实际中概率密度形式往往未知。实际中概率密度往往是多模的,即有多个局部极大值。实际中样本维数较高,且关于高维密度函数可以表示成一些低维密度函数乘积的假设通常也不成立。本章介绍非参数密度估计方法:能处理任意的概率分布,而不必假设密度函数的形式已知。第1页/共72页主要内容概率密度估计Parzen窗估计k-NN估计最近邻分类器(NN)k-近邻分类器(k-NN)第2页/共72页概率密度估计概率密度估计问题:给定样本集:估计概率分布:第3页/共72页概率密度估计直方图方法:非参数概率密度估计的最简单方法 1.把x的每个分量分成k 个等
2、间隔小窗,(xEd,则形成kd 个小舱)2.统计落入各个小舱内的样本数qi 3.相应小舱的概率密度为:qi/(NV)(N:样本 总数,V:小舱体积)第4页/共72页概率密度估计直方图的例子第5页/共72页概率密度估计非参数概率密度估计的核心思路:一个向量x落在区域R中的概率P为:因此,可以通过统计概率P来估计概率密度函数p(x)第6页/共72页概率密度估计假设N个样本的集合是根据概率密度函数为p(x)的分布独立抽取得到的。那么,有k个样本落在区域R中的概率服从二项式定理:k 的期望值为:对P的估计:当 时,估计是非常精确的第7页/共72页概率密度估计假设p(x)是连续的,且R足够小使得p(x)
3、在R内几乎没有变化。令R是包含样本点x的一个区域,其体积为V,设有N个训练样本,其中有k落在区域R中,则可对概率密度作出一个估计:对p(x)在小区域内的平均值的估计第8页/共72页概率密度估计当样本数量N固定时,体积V的大小对估计的效果影响很大。过大则平滑过多,不够精确;过小则可能导致在此区域内无样本点,k=0。此方法的有效性取决于样本数量的多少,以及区域体积选择的合适。第9页/共72页概率密度估计收敛性问题:样本数量N无穷大是,估计的概率函数是否收敛到真实值?实际中,越精确,要求:实际中,N是有限的:当时,绝大部分区间没有样本:如果侥幸存在一个样本,则:第10页/共72页概率密度估计理论结果
4、:设有一系列包含x 的区域R1,R2,,Rn,,对R1采用1个样本进行估计,对R2用2 个,Rn包含kn个样本。Vn为Rn的体积。为p(x)的第n次估计第11页/共72页概率密度估计如果要求能够收敛到p(x),那么必须满足:选择Vn选择kn第12页/共72页概率密度估计两种选择方法:第13页/共72页主要内容概率密度估计Parzen窗估计k-NN估计最近邻分类器(NN)k-近邻分类器(k-NN)第14页/共72页Parzen窗估计定义窗函数:假设Rn是一个d维的超立方体。令hn为超立方体一条边的长度,则体积:立方体窗函数为:中心在原点的单位超立方体第15页/共72页Parzen窗估计X处的密度
5、估计为:落入以X为中心的立方体区域的样本数为:可以验证:第16页/共72页窗函数的要求Parzen窗估计过程是一个内插过程,样本xi距离x越近,对概率密度估计的贡献越大,越远贡献越小。只要满足如下条件,就可以作为窗函数:第17页/共72页窗函数的形式 方窗函数指数窗函数正态窗函数其中:第18页/共72页窗口宽度的影响Parzen估计的性能与窗宽参数hn紧密相关当hn较大时,x和中心xi距离大小的影响程度变弱,估计的p(x)较为平滑,分辨率较差。当hn较小时,x和中心xi距离大小的影响程度变强,估计的p(x)较为尖锐,分辨率较好。第19页/共72页窗口宽度的影响第20页/共72页窗函数密度估计值
6、5个样本的Parzen窗估计:第21页/共72页渐近收敛性Parzen窗密度估计的渐近收敛性:无偏性:一致性:当 时,第22页/共72页0123456x6x5x3x1x2x4x 例:对于一个二类(1,2)识别问题,随机抽取1类的6个样本X=(x1,x2,.x6)1=(x1,x2,.x6)=(x1=3.2,x2=3.6,x3=3,x4=6,x5=2.5,x6=1.1)估计P(x|1)即PN(x)解:选正态窗函数第23页/共72页 x是一维的上式用图形表示是6个分别以3.2,3.6,3,6,2.5,1.1为中心的正态曲线,而PN(x)则是这些曲线之和。代入:由图看出,每个样本对估计的贡献与样本间的
7、距离有关,样本越多,PN(x)越准确。第24页/共72页例:设待估计的P(x)是个均值为0,方差为1的正态密度函数。若随机地抽取X样本中的1个、16个、256个作为学习样本xi,试用窗口法估计PN(x)。解:设窗口函数为正态的,1,0hN:窗长度,N为样本数,h1为选定可调节的参数。第25页/共72页v用 窗法估计单一正态分布的实验N=N=256N=16N=1第26页/共72页由图看出,PN(x)随N,h1的变化情况 当N1时,PN(x)是一个以第一个样本为中心的正态曲线,与窗函数差不多。当N16及N=256时 h10.25 曲线起伏很大,噪声大 h11 起伏减小 h14 曲线平坦 当N时,P
8、N(x)收敛于一平滑的正态曲线,估计曲线较好。第27页/共72页例:待估的密度函数为二项分布解:此为多峰情况的估计设窗函数为正态解:此为多峰情况的估计设窗函数为正态x-2.5-210.2502P(x)-2.5x-20 x2x为其它第28页/共72页N=N=256N=16N=1v用 窗法估计两个均匀分布的实验第29页/共72页当N=1、16、256、时的PN(x)估计如图所示 当N1时,PN(x)实际是窗函数。当N16及N=256时 h10.25 曲线起伏大 h11 曲线起伏减小 h14 曲线平坦 当N时,曲线较好。第30页/共72页Parzen窗估计优点由前面的例子可以看出,Parzen窗估计
9、的优点是应用的普遍性。对规则分布,非规则分布,单锋或多峰分布都可用此法进行密度估计。可以获得较为光滑且分辨率较高的密度估计,实现了光滑性和分辨率之间的一个较好平衡。缺点要求样本足够多,才能有较好的估计。因此使计算量,存储量增大。窗宽在整个样本空间固定不变,难以获得区域自适应的密度估计。第31页/共72页识别方法1.保存每个类别所有的训练样本;2.选择窗函数的形式,根据训练样本数n选择窗函数的h宽度;3.识别时,利用每个类别的训练样本计算待识别样本x的类条件概率密度:4.采用Bayes判别准则进行分类。第32页/共72页例子:基于Parzen估计的Bayesian分类器较小较大第33页/共72页
10、主要内容概率密度估计Parzen窗估计Kn近邻估计最近邻分类器(NN)k-近邻分类器(k-NN)第34页/共72页Kn近邻估计在Parzen窗估计中,存在一个问题:对hn的选择。若hn选太小,则大部分体积将是空的(即不包含样本),从而使Pn(x)估计不稳定。若hn选太大,则Pn(x)估计较平坦,反映不出总体分布的变化Kn近邻法的思想:固定样本数量Kn,调整区域体积大小Vn,直至有Kn个样本落入区域中第35页/共72页Kn近邻估计Kn近邻密度估计:固定样本数为,在附近选取与之最近的个样本,计算该个样本分布的最小体积在X处的概率密度估计值为:第36页/共72页渐近收敛的条件渐近收敛的充要条件为:通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 完整
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内