【教学课件】第三章概率密度的估计.ppt
《【教学课件】第三章概率密度的估计.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第三章概率密度的估计.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 概率密度密度的估计第三章 概率密度密度的估计2第三章 概率密度密度的估计33.1 引言基于样本的Bayes分类器:通过估计类条件概率密度函数,设计相应的判别函数分类器功能结构基于样本的直接确定判别函数方法第三章 概率密度密度的估计4基于样本的Bayes分类器设计uBayes决策需要已知两种知识:各类的先验概率P(i)各类的条件概率密度函数p(x|i)u知识的来源:对问题的一般性认识或一些训练数据u基于样本的两步Bayes分类器设计利用样本集估计P(i)和p(x|i)基于上述估计值设计判别函数及分类器u面临的问题:如何利用样本集进行估计估计量的评价利用样本集估计错误率引言第三章 概率密度
2、密度的估计5基于样本的Bayes分类器训练样本集样本分布的统计特征:概率密度函数决策规则:判别函数决策面方程u最一般情况下适用的“最优”分类器:错误率最小,对分类器设计在理论上有指导意义。u获取统计分布及其参数很困难,实际问题中并不一定具备获取准确统计分布的条件。引言第三章 概率密度密度的估计6直接确定判别函数u基于样本的直接确定判别函数方法:针对各种不同的情况,使用不同的准则函数,设计出满足这些不同准则要求的分类器。这些准则的“最优”并不一定与错误率最小相一致:次优分类器。实例:正态分布最小错误率贝叶斯分类器在特殊情况下,是线性判别函数g(x)=wTx(决策面是超平面),能否基于样本直接确定
3、w?训练样本集决策规则:判别函数决策面方程选择最佳准则引言第三章 概率密度密度的估计7概率密度估计的方法u类的先验概率P(i)的估计:用训练数据中各类出现的频率来估计依靠经验引言u类条件概率密度函数的估计:两大类方法参数估计:概率密度函数的形式已知,而表征函数的参数未知,需要通过训练数据来估计最大似然估计Bayes估计非参数估计:概率密度函数的形式未知,也不作假设,利用训练数据直接对概率密度进行估计Parzen窗法和kn-近邻法神经网络方法第三章 概率密度密度的估计83.2 参数估计u统计量:样本集K=x1,x2,xN的某种函数f(K)u参数空间:总体分布的未知参数所有可能取值组成的集合()u
4、点估计和参数估计u点估计的估计量和估计值:第三章 概率密度密度的估计9估计量的评价标准u估计量的评价标准:无偏性,有效性,一致性无偏性:E()=有效性:D()小,估计更有效一致性:样本数趋于无穷时,依概率趋于:第三章 概率密度密度的估计103.2.1 最大似然估计uMaximum Likelihood(ML)估计估计的参数是确定而未知的,而Bayes估计方法则视为随机变量。样本集可按类别分开,不同类别的密度函数的参数分别用各类的样本集来训练。概率密度函数的形式已知,参数未知,为了描述概率密度函数p(x|i)与参数的依赖关系,用p(x|i,)表示。u独立地按概率密度p(x|)抽取样本集K=x1,
5、x2,xN,用K估计未知参数第三章 概率密度密度的估计11似然函数u似然函数:u对数(loglarized)似然函数:最大似然估计第三章 概率密度密度的估计12最大似然估计最大似然估计第三章 概率密度密度的估计13最大似然估计示意图最大似然估计第三章 概率密度密度的估计14计算方法u最大似然估计量使似然函数梯度梯度为0:最大似然估计第三章 概率密度密度的估计153.2.2 贝叶斯估计-最大后验概率u用一组样本集K=x x1,x x2,x xN估计未知参数u未知参数视为随机变量,先验分布为 p(),而在已知样本集K出现的条件下的后验概率为p(|K)u最大后验概率估计-Maximum a post
6、eriori(MAP)第三章 概率密度密度的估计16贝叶斯决策问题与贝叶斯估计问题u贝叶斯决策问题:样本x决策ai真实状态wj状态空间A是离散空间先验概率P(wj)u贝叶斯参数估计问题:样本集K估计量s真实参数s参数空间S是连续空间参数的先验分布p(s)贝叶斯估计第三章 概率密度密度的估计17贝叶斯(最小风险)估计u参数估计的条件风险:给定x条件下,估计量的期望损失u参数估计的风险:估计量的条件风险的期望uu贝叶斯估计:贝叶斯估计:使风险最小的估计贝叶斯估计第三章 概率密度密度的估计18贝叶斯估计(II)贝叶斯估计u损失函数定义为误差平方:定理 3.1:如果定义损失函数为误差平方函数,则有:第
7、三章 概率密度密度的估计19贝叶斯估计的步骤1.确定的先验分布 p()2.由样本集K=x1,x2,xN求出样本联合分布:p(K|)3.计算的后验分布4.计算贝叶斯估计贝叶斯估计第三章 概率密度密度的估计20贝叶斯学习u贝叶斯学习:利用的先验分布 p()及样本提供的信息求出的后验分布p(|K),然后直接求总体分布p(x|K)方法性能贝叶斯估计参数的贝叶斯学习性质第三章 概率密度密度的估计213.3 正态分布的参数估计u最大似然估计示例u贝叶斯估计示例u贝叶斯学习示例第三章 概率密度密度的估计223.3.1 一元正态分布例解最大似然估计第三章 概率密度密度的估计23一元正态分布均值的估计最大似然估
8、计第三章 概率密度密度的估计24一元正态分布方差的估计最大似然估计第三章 概率密度密度的估计25多元正态分布参数最大似然估计u最大似然估计是一致估计u均值估计是无偏的,协方差矩阵估计是有偏的。u协方差矩阵的无偏估计是:总体均值向量和协方差矩阵最大似然估计第三章 概率密度密度的估计263.3.2 一元正态分布贝叶斯估计例解u总体分布密度为:贝叶斯估计u均值为随机未知变量,的先验分布为:u用贝叶斯估计方法求的估计量u样本集:K=x1,x2,xNu计算的后验分布:第三章 概率密度密度的估计27一元正态分布例解(II)u计算的后验分布:贝叶斯估计计算的贝叶斯估计:第三章 概率密度密度的估计283.3.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第三 概率 密度 估计
限制150内