概率密度函数的参数估计课件.ppt
《概率密度函数的参数估计课件.ppt》由会员分享,可在线阅读,更多相关《概率密度函数的参数估计课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别 概率密度函数的参数估计关于概率密度函数的关于概率密度函数的参数估计参数估计第1页,此课件共61页哦模式识别 概率密度函数的参数估计3.0 引言引言贝叶斯分类器的学习贝叶斯分类器的学习:类条件概率密度函数的:类条件概率密度函数的估计。估计。问题的表示问题的表示:已有:已有c个类别的训练样本集合个类别的训练样本集合D1,D2,Dc,求取每个类别的类条件概率密,求取每个类别的类条件概率密度度 。第2页,此课件共61页哦模式识别 概率密度函数的参数估计概率密度函数的估计方法概率密度函数的估计方法参数估计方法参数估计方法:预先假设每一个类别的概:预先假设每一个类别的概率密度函数的形式已知,而具
2、体的参数未率密度函数的形式已知,而具体的参数未知;知;最大似然估计最大似然估计(MLE,Maximum Likelihood Estimation);贝叶斯估计贝叶斯估计(Bayesian Estimation)。非参数估计方法非参数估计方法。第3页,此课件共61页哦模式识别 概率密度函数的参数估计3.1 最大似然估计最大似然估计独立同分布假设独立同分布假设:样本集:样本集D中包含中包含n个样本:个样本:x1,x2,,xn,样本都是,样本都是独立同分布独立同分布的随机变量的随机变量(i.i.d,independent identically distributed)。对类条件概率密度函数的函数
3、形式作出假设,参对类条件概率密度函数的函数形式作出假设,参数可以表示为参数矢量数可以表示为参数矢量:第4页,此课件共61页哦模式识别 概率密度函数的参数估计最大似然估计最大似然估计第5页,此课件共61页哦模式识别 概率密度函数的参数估计似然函数似然函数样本集样本集D出现的概率出现的概率:对数似然函数对数似然函数:第6页,此课件共61页哦模式识别 概率密度函数的参数估计最大似然估计最大似然估计最大似然估计最大似然估计:寻找到一个最优矢量:寻找到一个最优矢量 ,使得,使得似然函数似然函数 最大。最大。第7页,此课件共61页哦模式识别 概率密度函数的参数估计正态分布的似然估计正态分布的似然估计Gau
4、ss分布的参数分布的参数:由均值矢量:由均值矢量和协方差矩和协方差矩阵阵构成,最大似然估计结果为:构成,最大似然估计结果为:第8页,此课件共61页哦模式识别 概率密度函数的参数估计3.2 期望最大化算法期望最大化算法(EM算法算法)EM算法的应用可以分为两个方面:算法的应用可以分为两个方面:1.训练样本中某些训练样本中某些特征丢失特征丢失情况下,分布参数情况下,分布参数的最大似然估计;的最大似然估计;2.对某些对某些复杂分布模型复杂分布模型假设,最大似然估计很假设,最大似然估计很难得到解析解时的迭代算法。难得到解析解时的迭代算法。第9页,此课件共61页哦模式识别 概率密度函数的参数估计混合密度
5、模型混合密度模型混合密度模型混合密度模型:一个复杂的概率密度分布函数可以:一个复杂的概率密度分布函数可以由多个简单的密度函数混合构成:由多个简单的密度函数混合构成:高斯混合模型高斯混合模型:GMM,Gauss Mixture Model第10页,此课件共61页哦模式识别 概率密度函数的参数估计两个高斯函数的混合两个高斯函数的混合第11页,此课件共61页哦模式识别 概率密度函数的参数估计样本的产生过程样本的产生过程高斯模型样本的产生高斯模型样本的产生:每一个样本都是按:每一个样本都是按照正态分布产生的;照正态分布产生的;GMM样本的产生样本的产生:先按照先验概率:先按照先验概率ai选择选择一个子
6、类,然后按照这个子类满足的正态一个子类,然后按照这个子类满足的正态分布产生样本。分布产生样本。第12页,此课件共61页哦模式识别 概率密度函数的参数估计GMM模型产生的模型产生的2维样本数据维样本数据第13页,此课件共61页哦模式识别 概率密度函数的参数估计GMM模型的参数估计模型的参数估计GMM的参数的参数:参数估计参数估计:已知样本:已知样本x1,xn,估计参数,估计参数。存在的问题存在的问题:每个样本是由哪一个子集产生的:每个样本是由哪一个子集产生的未知。未知。第14页,此课件共61页哦模式识别 概率密度函数的参数估计训练样本:训练样本:来自子类:来自子类:已知已知y的条件下,参数的估计
7、:的条件下,参数的估计:已知参数条件下,已知参数条件下,y的估计:的估计:K-mean算法算法第15页,此课件共61页哦模式识别 无监督学习与聚类K-均值聚类均值聚类1.begin initialize 样本数样本数n,聚类数,聚类数K,初始聚类中,初始聚类中心心1,c;2.do 按照最近邻按照最近邻i分类分类n个样本;个样本;3.重新计算聚类中心重新计算聚类中心1,c;4.until i不再改变;不再改变;5.return 1,c;6.end第16页,此课件共61页哦模式识别 概率密度函数的参数估计存在的问题:样本存在的问题:样本xt可能来自于任何一个子类,但在可能来自于任何一个子类,但在参
8、数估计时只出现在一个子类中。参数估计时只出现在一个子类中。修改计算过程:修改计算过程:EM算法算法第17页,此课件共61页哦模式识别 概率密度函数的参数估计GMM的参数估计算法的参数估计算法(EM)1.随机初始化参数:随机初始化参数:2.计算:计算:3.重新估计参数重新估计参数;4.迭代计算迭代计算2,3步,直到收敛为止。步,直到收敛为止。第18页,此课件共61页哦模式识别 概率密度函数的参数估计基本基本EM算法算法样本集样本集:令:令X是观察到的样本数据集合,是观察到的样本数据集合,Y为丢失的为丢失的数据集合,完整的样本集合数据集合,完整的样本集合D=X Y。似然函数似然函数:由于:由于Y未
9、知,在给定参数未知,在给定参数时,时,似然函似然函数可以看作数可以看作Y的函数:的函数:第19页,此课件共61页哦模式识别 概率密度函数的参数估计基本基本EM算法算法由于由于Y未知,因此我们需要寻找到一个在未知,因此我们需要寻找到一个在Y的所有的所有可能情况下,平均意义下的似然函数最大值,即可能情况下,平均意义下的似然函数最大值,即似然函数对似然函数对Y的期望的最大值:的期望的最大值:E步:步:M步:步:第20页,此课件共61页哦模式识别 概率密度函数的参数估计基本基本EM算法算法1.begin initialize ,T,i0;2.do ii+13.E步:计算步:计算 ;4.M步:步:5.u
10、ntil 6.return第21页,此课件共61页哦模式识别 概率密度函数的参数估计EM算法的性质算法的性质收敛性收敛性:EM算法具有收敛性;算法具有收敛性;最优性最优性:EM算法只能保证收敛于似然函数算法只能保证收敛于似然函数的局部最大值点(极值点),而不能保证的局部最大值点(极值点),而不能保证收敛于全局最优点。收敛于全局最优点。第22页,此课件共61页哦模式识别 概率密度函数的参数估计隐含隐含Markov模型模型(Hidden Markov Model,HMM)应用领域应用领域:识别对象存在着先后次序信息,:识别对象存在着先后次序信息,如语音识别,手势识别,唇读系统等;如语音识别,手势识
11、别,唇读系统等;模式描述模式描述:特征矢量序列。:特征矢量序列。第23页,此课件共61页哦模式识别 概率密度函数的参数估计输入语音波形输入语音波形第24页,此课件共61页哦模式识别 概率密度函数的参数估计观察序列观察序列观察序列观察序列:信号的特征需要用一个特征矢:信号的特征需要用一个特征矢量的序列来表示:量的序列来表示:其中的其中的vi为一个特征矢量,称为一个观察值。为一个特征矢量,称为一个观察值。第25页,此课件共61页哦模式识别 概率密度函数的参数估计一阶一阶Markov模型模型M个状态:个状态:w1,w2,wM时刻时刻t:处于状态:处于状态w(t);经过经过T个时刻:个时刻:WT=w(
12、1),w(T)。第26页,此课件共61页哦模式识别 概率密度函数的参数估计一阶一阶Markov模型的状态转移模型的状态转移Markov性性:模型在时刻:模型在时刻t处于状态处于状态wj的概率完全由的概率完全由t-1时刻的状态时刻的状态wi决定,而且与时刻决定,而且与时刻t无关,即:无关,即:第27页,此课件共61页哦模式识别 概率密度函数的参数估计Markov模型的初始状态概率模型的初始状态概率模型初始于状态模型初始于状态wi的概率用的概率用 表示。表示。模型参数模型参数:一阶:一阶Markov模型可以用参数模型可以用参数 表表示,其中:示,其中:第28页,此课件共61页哦模式识别 概率密度函
13、数的参数估计一阶一阶Markov模型输出状态序列的模型输出状态序列的概率概率输出状态序列的概率输出状态序列的概率:由初始状态概率与各次状态:由初始状态概率与各次状态转移概率相乘得到。转移概率相乘得到。例如:例如:W5=w1,w1,w3,w1,w2,则模型输出该序列,则模型输出该序列的概率为:的概率为:第29页,此课件共61页哦模式识别 概率密度函数的参数估计一阶一阶Markov模型实例模型实例某个城市天气的变化可以采用一阶马尔科夫模型描某个城市天气的变化可以采用一阶马尔科夫模型描述述,每天的天气有每天的天气有4种状态种状态晴、阴、雨、雪晴、阴、雨、雪。第30页,此课件共61页哦模式识别 概率密
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 密度 函数 参数估计 课件
限制150内