(44)--第三章 概率密度函数模式识别.pdf
《(44)--第三章 概率密度函数模式识别.pdf》由会员分享,可在线阅读,更多相关《(44)--第三章 概率密度函数模式识别.pdf(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2019-9-22模式识别第三章1 引言引言最大似然估计最大似然估计贝叶斯估计贝叶斯估计贝叶斯学习贝叶斯学习本章小结本章小结主要内容2019-9-22模式识别第三章2引言引言 2019-9-22模式识别第三章3 iiiPPPPxxx贝叶斯决策公式:贝叶斯决策公式:样本后验概率:(|)ipx()iP 2019-9-22模式识别第三章4利用类条件概率 和先验概率 来设计分类器 存在的问题:存在的问题:u 不知道先验概率不知道先验概率 和类条件概率和类条件概率 u 估计先验概率估计先验概率 通常没有太大困难;通常没有太大困难;u 最大困难在于估计类条件概率密度函数最大困难在于估计类条件概率密度函数
2、,因,因为训练样本不够多,如果特征的维数较大,会产生比为训练样本不够多,如果特征的维数较大,会产生比较困难的多重积分计算复杂度问题。较困难的多重积分计算复杂度问题。就是要寻找某种有效的方法,能利用现有的信息设计出就是要寻找某种有效的方法,能利用现有的信息设计出正确的分类器。正确的分类器。(|)ipx()iP()iP(|)ipx2019-9-22模式识别第三章5 目标:利用已知的笼统和模糊的知识+训练样本 设计分类器2019-9-22模式识别第三章6问题的解决:问题的解决:方法:利用训练样本估计先验概率和条件密度函数利用训练样本估计先验概率和条件密度函数,并把这些估计的结果当作实际的先验概率和条
3、件密度函数,然后再设计分类器。如何从可用的样本数据来推断如何从可用的样本数据来推断(估计估计)总体概率分布的参数?总体概率分布的参数?u 最大似然估计最大似然估计u 贝叶斯估计贝叶斯估计 u最大似然估计把待估计的参数看作是确定的量,只是最大似然估计把待估计的参数看作是确定的量,只是其取值未知;其取值未知;u贝叶斯估计是把待估计的参数看作符合某种先验概率贝叶斯估计是把待估计的参数看作符合某种先验概率分布的随机变量。分布的随机变量。两种方法的区别:参数估计的方法:参数估计的方法:2019-9-22模式识别第三章7 参数估计的分类参数估计的分类u监督参数估计监督参数估计样本所属类别(标签)已知,样本
4、的类条件概率密度函数的形式已知,但参数未知(例如,已知高斯分布,但参数或未知),即已知规律但未知参数。u非监督参数估计非监督参数估计已知总体概率密度函数的形式,但样本所属类别未知,要求推断出概率密度函数的某些参数,称为非监督参数估计。2019-9-22模式识别第三章8 参数估计的基本概念参数估计的基本概念u统计量统计量每一种训练样本都包含着总体的某种信息,一个训练样本集X 包含总体的全部信息,针对不同的参数估计要求构造某种函数以便从样本集X中抽取有关信息,这种函数称为统计量。u参数空间参数空间所有未知参数的可能取值的集合称为参数空间,记为。u 点估计、估计量和估计值点估计、估计量和估计值估计总
5、体分布的一个或几个具体参数叫点估计。针对某未知参数i构造一个统计量作为i的估计,称 为i的估计量;的值叫做i的估计值。ii2019-9-22模式识别第三章9最大似然估计最大似然估计 2019-9-22模式识别第三章10最大似然估计的基本问题最大似然估计的基本问题 在一类中独立地按照概率密度在一类中独立地按照概率密度p(p(x|x|)抽取样本集抽取样本集X X,用来估计出未知参数用来估计出未知参数。基本假设:u参数参数 是未知的确定性的量是未知的确定性的量;u样本集按照类别样本集按照类别w wi i分为分为c c个样本子集个样本子集,这些样本都是从这些样本都是从类条件概率密度为类条件概率密度为p
6、(p(x|wx|wj j)的总体中独立抽取的。的总体中独立抽取的。u类条件概率密度类条件概率密度p(p(x|wx|wj j)具有某种确定的函数形式,只具有某种确定的函数形式,只是其中的参数是其中的参数 未知。未知。u不同类别的参数在函数上是独立的(非耦合),可以不同类别的参数在函数上是独立的(非耦合),可以分别对每一类进行处理。分别对每一类进行处理。2019-9-22模式识别第三章11基本概念和原理基本概念和原理 已知某一类样本集包含已知某一类样本集包含N N个样本,个样本,X=x1,x2,xN,待估待估计的未知参数为计的未知参数为,由于假设样本是独立抽取的,那么,由于假设样本是独立抽取的,那
7、么 为了便于分析为了便于分析(指数分布以及对数函数单调性指数分布以及对数函数单调性),还可以,还可以定义对数似然函数:定义对数似然函数:2019-9-22模式识别第三章122019-9-22模式识别第三章13最大似然估计量最大似然估计量估计值估计值2019-9-22模式识别第三章14极大似然估计的求解极大似然估计的求解求解方法:根据已知的样本集求解方法:根据已知的样本集X X,使似然函数取极大值时,使似然函数取极大值时得到的参数,就是我们要找的估计量。得到的参数,就是我们要找的估计量。一维变量参数的求解:一维变量参数的求解:在似然函数连续、可微的条件下,并且只有一个在似然函数连续、可微的条件下
8、,并且只有一个参数变量的情况下,即参数变量的情况下,即为一维参数,求为一维参数,求 就是求就是求解如下微分方程的解:解如下微分方程的解:或或 0/)(ddl0/)(ddH2019-9-22模式识别第三章15多维变量参数的求解:多维变量参数的求解:若未知参数不止一个,即是由多个未知参数组成的向量时,求解似然函数的最大值,就需要对参数向量 的每一维分量分别求偏导的每一维分量分别求偏导,即用下面的梯度算子:Ts,212019-9-22模式识别第三章160)(H将似然函数或对数似然函数代入,并令其为零,解以上方程组就可得到 的的最大似然估计值,并加以判断。若参数矢量 是s维的,那么得到一组由s个方程组
9、成的方程组:11121ln(|)0ln(|)0ln(|)0NkkNkkNkksp xp xp x2019-9-22模式识别第三章17设i类分布为正态分布、一维模式、概率密度函数为待估计参数为,2。因此,。T21,122若X表示从i中独立抽取的N个样本,则 的似然函数为1()(|)Nkklpx正态分布情况下极大似然估计示例221exp21)|(xxp21221(|)exp22kkpxx其中,2019-9-22模式识别第三章18其对数似然函数为:)|(ln)(ln)(1kNkxPxlH21221ln(|)ln(2)22kkp xx分别对两个未知参数求偏导,得到:kNkxN1112122)(1kNk
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 44-第三章 概率密度函数模式识别 44 第三 概率 密度 函数 模式识别
限制150内