哈工大模式识别课件.pptx
《哈工大模式识别课件.pptx》由会员分享,可在线阅读,更多相关《哈工大模式识别课件.pptx(320页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别模式识别模式识别模式识别第一章第一章 绪论绪论模式识别 绪论一、模式识别的概念一、模式识别的概念p什么是模式识别?什么是模式识别?p模式识别研究的内容?模式识别研究的内容?模式识别 绪论二、模式识别的应用二、模式识别的应用p工业用途:产品质量检验,设备故障检测,智工业用途:产品质量检验,设备故障检测,智能机器人的感知系统;能机器人的感知系统;p商业用途:钱币的自动识伪,信函的自动分拣,商业用途:钱币的自动识伪,信函的自动分拣,电话信息查询,声控拨号;电话信息查询,声控拨号;p医学用途:对心电、脑电、医学用途:对心电、脑电、CT等信号进行处等信号进行处理和识别,自动进行疾病的诊断;理和识
2、别,自动进行疾病的诊断;p安全领域:生理特征鉴别安全领域:生理特征鉴别(Biometrics),网,网上电子商务的身份确认,对公安对象的刑侦和上电子商务的身份确认,对公安对象的刑侦和鉴别;鉴别; 模式识别 绪论二、模式识别的应用二、模式识别的应用p军事领域:巡航导弹的景物识别,战斗单元的军事领域:巡航导弹的景物识别,战斗单元的敌我识别;敌我识别; p办公自动化:文字识别技术和声音识别技术;办公自动化:文字识别技术和声音识别技术; p数据挖掘:数据分析;数据挖掘:数据分析; p网络应用:文本分类。网络应用:文本分类。 模式识别 绪论三、相关领域三、相关领域p人工智能:人工智能:Artificia
3、l Intelligence (AI)p模式识别:模式识别:Pattern Recognition (PR)p机器学习:机器学习:Machine Learningp人工神经网络:人工神经网络:Neural Network (NN)p计算机视觉:计算机视觉:Computer Vision (CV)模式识别 绪论四、模式识别的过程四、模式识别的过程模式识别 绪论什么是特征?什么是特征?模式识别 绪论什么是特征?什么是特征?模式识别 绪论什么是特征?什么是特征?模式识别 绪论特征抽取特征抽取模式识别 绪论特征抽取特征抽取模式识别 绪论特征的分布特征的分布模式识别 绪论特征的分布特征的分布模式识别 绪
4、论五、模式识别系统五、模式识别系统 分类分类训练训练模式识别 绪论六、模式识别问题的描述六、模式识别问题的描述给定一个训练样本的特征矢量集合:给定一个训练样本的特征矢量集合:分别属于分别属于c个类别:个类别:设计出一个分类器,能够对未知类别样本设计出一个分类器,能够对未知类别样本x进行分类进行分类2,dniDR1x xxx12,c ,1,dygRcx模式识别 绪论分类方法分类方法模式识别 绪论模式识别方法的分类模式识别方法的分类p有监督学习(有教师学习):预先已知训有监督学习(有教师学习):预先已知训练样本集中每个样本的类别标号;练样本集中每个样本的类别标号;p无监督学习(无教师学习):预先不
5、知道无监督学习(无教师学习):预先不知道训练样本集中每个样本的类别标号;训练样本集中每个样本的类别标号;模式识别 绪论七、参考书目七、参考书目pRichard Duda, Peter Hart, David Stork, Pattern Classification, 2nd edition, John Wiley, 2001p模式分类模式分类,机械工业出版社,机械工业出版社,Richard O. Dudap模式识别模式识别(第二版),清华大学出版社,边(第二版),清华大学出版社,边肇祺,张学工;肇祺,张学工;模式识别 绪论期刊期刊pIEEE Transaction on Pattern An
6、alysis and Machine Intelligence,PAMI;pPattern Recognition;pPattern Recognition Letter;p模式识别与人工智能;模式识别与人工智能;p讲义下载讲义下载:ftp:/202.118.251.122用户名用户名: prai 密码密码: prai模式识别第二章第二章 贝叶斯决策理论贝叶斯决策理论模式识别 绪论2.1 最小错误率准则最小错误率准则模式识别 绪论各种概率及其关系各种概率及其关系p先验概率:先验概率:p后验概率:后验概率:p类条件概率:类条件概率:p贝叶斯公式:贝叶斯公式:iPiPxiPx iiiPPPPxxx
7、模式识别 绪论两个类别,一维特征两个类别,一维特征模式识别 绪论两类问题的错误率两类问题的错误率p观察到特征观察到特征x时作出判别的错误率:时作出判别的错误率:1221,PP errorPxxx判定判定 两类问题最小错误率判别准则:两类问题最小错误率判别准则:121122,PPPPxxxxxx如果如果模式识别 绪论多类问题最小错误率多类问题最小错误率p判别判别x属于属于i i的错误率:的错误率:1jij iP errorPP xxx 判别准则为:判别准则为:1argmax,jj ciP xix则:则:模式识别 绪论贝叶斯最小错误率准则贝叶斯最小错误率准则 jjjpPPpxxx jjjgpPxx
8、 1argmaxjj cig xixBayes判别准则:判别准则:,则模式识别 绪论贝叶斯分类器的错误率估计贝叶斯分类器的错误率估计11iciiRP errorpdxx1px2px模式识别 绪论例例2.1p 对一大批人进行癌症普查,设对一大批人进行癌症普查,设1 1类代表患癌类代表患癌症,症,2 2类代表正常人。已知先验概率:类代表正常人。已知先验概率:120.005,0.995PP以一个化验结果作为特征以一个化验结果作为特征x: 阳性,阴性阳性,阴性,患癌症,患癌症的人和正常人化验结果为阳性的概率分别为:的人和正常人化验结果为阳性的概率分别为:现有一人化验结果为阳性,问此人是否患癌症?现有一
9、人化验结果为阳性,问此人是否患癌症?120.95,0.01P xP x阳性阳性模式识别 绪论2.2 最小平均风险准则贝叶斯分最小平均风险准则贝叶斯分 类器类器p问题的提出问题的提出 有有c个类别个类别1, 2 ,. , c, 将将i i类的样本判类的样本判别为别为j j类的代价为类的代价为ij。p将未知模式将未知模式x判别为判别为j j类类的平均风险为:的平均风险为: 1cjijiiPxx模式识别 绪论最小平均风险判别准则最小平均风险判别准则p利用利用Bayes公式,构造判别函数:公式,构造判别函数: jjg xx 1cjijiiiPPxx模式识别 绪论贝叶斯分类器贝叶斯分类器模式识别 绪论例
10、例2.2p 对一大批人进行癌症普查,设对一大批人进行癌症普查,设1类代表患癌症,类代表患癌症,2类代表正常人。已知先验概率:类代表正常人。已知先验概率:120.005,0.995PP以一个化验结果作为特征以一个化验结果作为特征x: 阳性,阴性阳性,阴性,患癌症,患癌症的人和正常人化验结果为阳性的概率分别为:的人和正常人化验结果为阳性的概率分别为:判别代价:判别代价: 11 = 0, 22 = 0, 12 = 100, 21 = 25现有一人化验结果为阳性,问此人是否患癌症?现有一人化验结果为阳性,问此人是否患癌症?120.95,0.01PxPx阳 性阳 性模式识别 绪论2.3 贝叶斯分类器的其
11、它版本贝叶斯分类器的其它版本p先验概率先验概率P(i i)未知:极小化极大准则;未知:极小化极大准则;p约束一定错误率(风险):约束一定错误率(风险):Neyman-Pearson准则;准则;p某些特征缺失的决策:某些特征缺失的决策:p连续出现的模式之间统计相关的决策:连续出现的模式之间统计相关的决策:模式识别 绪论2.4 正态分布的贝叶斯分类器正态分布的贝叶斯分类器p单变量正态分布密度函数(高斯分布):单变量正态分布密度函数(高斯分布): 211e x p22xpx 模式识别 绪论11 2211exp22tiiiidipxxx多元正态分布函数多元正态分布函数模式识别 绪论正态分布的判别函数正
12、态分布的判别函数p贝叶斯判别函数可以写成对数形式:贝叶斯判别函数可以写成对数形式: lnlniiigpPxx 类条件概率密度函数为正态分布时:类条件概率密度函数为正态分布时: 111ln2lnln222tiiiiiidgP xxx模式识别 绪论情况一情况一:21,iiPcI 2tiiiigxx x x 判别函数可以写成:判别函数可以写成: 此分类器称为距离分类器,判别函数可以用此分类器称为距离分类器,判别函数可以用待识模式待识模式x与类别均值与类别均值i i之间的距离表示:之间的距离表示: ,iigdxx 模式识别 绪论情况二:情况二:i 11ln2tiiiigPxx x 1101ln2ttt
13、iiiiiiigPwx x w x 判别函数可以写成:判别函数可以写成: 可以简化为:可以简化为:称为线性分类器称为线性分类器模式识别 绪论线性分类器线性分类器 两类问题,两类问题,1维特征,先验概率相同时:维特征,先验概率相同时:模式识别 绪论线性分类器线性分类器 两类问题,高维特征,先验概率相同时:两类问题,高维特征,先验概率相同时:模式识别 绪论线性分类器线性分类器 两类问题,两类问题,1维特征,先验概率不同时:维特征,先验概率不同时:模式识别 绪论线性分类器线性分类器 两类问题,高维特征,先验概率不同时:两类问题,高维特征,先验概率不同时:模式识别 绪论情况三:情况三: 任意任意i 判
14、别函数可以写成:判别函数可以写成: 分类界面为分类界面为2次曲线(面)次曲线(面) 111111lnln222tttiiiiiiiiigP xx x x 模式识别 绪论二次分类曲线二次分类曲线模式识别 绪论二次分类曲面二次分类曲面模式识别第三章第三章 概率密度函数的概率密度函数的参数估计参数估计模式识别 绪论3.0 引言引言p贝叶斯分类器中最主要的问题是类条件概率密贝叶斯分类器中最主要的问题是类条件概率密度函数的估计。度函数的估计。p问题可以表示为:已有问题可以表示为:已有c个类别的训练样本集个类别的训练样本集合合D1,D2,Dc,求取每个类别的类条件,求取每个类别的类条件概率密度概率密度 。
15、ipx模式识别 绪论概率密度函数的估计方法概率密度函数的估计方法p参数估计方法:预先假设每一个类别的概率密度参数估计方法:预先假设每一个类别的概率密度函数的形式已知,而具体的参数未知;函数的形式已知,而具体的参数未知;n最大似然估计最大似然估计(MLE, Maximum Likelihood Estimation);n贝叶斯估计贝叶斯估计(Bayesian Estimation)。p非参数估计方法。非参数估计方法。模式识别 绪论3.1 最大似然估计最大似然估计p样本集样本集D中包含中包含n个样本:个样本:x1,x2, , xn,样,样本都是本都是独立同分布独立同分布的随机变量的随机变量(i.i
16、.d,independent identically distributed)。p对类条件概率密度函数的函数形式作出假设,参对类条件概率密度函数的函数形式作出假设,参数可以表示为参数矢量数可以表示为参数矢量:,iipx模式识别 绪论似然函数似然函数p由独立同分布假设,样本集由独立同分布假设,样本集D出现的概率为:出现的概率为:121,nniip Dppx xx x 定义对数似然函数:定义对数似然函数: 1lnlnniilp Dpx 模式识别 绪论最大似然估计最大似然估计p最大似然估计就是要寻找到一个最优矢量最大似然估计就是要寻找到一个最优矢量 ,使,使得似然函数得似然函数 最大。最大。 arg
17、maxl l 模式识别 绪论正态分布的似然估计正态分布的似然估计pGauss分布的参数由均值矢量分布的参数由均值矢量和协方差矩阵和协方差矩阵构成,最大似然估计结果为:构成,最大似然估计结果为:11ntiiinxx11niinx模式识别 绪论3.2 贝叶斯估计贝叶斯估计p已有独立同分布训练样本集已有独立同分布训练样本集D;p已知类条件概率密度函数已知类条件概率密度函数p(x|)的形式,但参数的形式,但参数未知;未知;p已知参数已知参数的先验概率密度函数的先验概率密度函数p();p求在已有训练样本集求在已有训练样本集D的条件下,类条件概率密的条件下,类条件概率密度函数度函数p(x|D)。模式识别
18、绪论贝叶斯估计与最大似然估计的差别贝叶斯估计与最大似然估计的差别p最大似然估计认为最大似然估计认为是一个确定的未知矢量;是一个确定的未知矢量;p贝叶斯估计认为贝叶斯估计认为是一个随机变量,以一定的概是一个随机变量,以一定的概率分布取所有可能的值。率分布取所有可能的值。模式识别 绪论贝叶斯估计的一般理论贝叶斯估计的一般理论 ,pDpD dppD dxx x 由于参数矢量由于参数矢量是一个随机变量,所以类是一个随机变量,所以类条件概率可以用下式计算:条件概率可以用下式计算: 11niiniippp DppDp Dpdppdx x 根据贝叶斯公式,有:根据贝叶斯公式,有:模式识别 绪论单变量正态分布
19、的贝叶斯估计单变量正态分布的贝叶斯估计2,p xN 已知概率密度函数满足正态分布,其中方已知概率密度函数满足正态分布,其中方差差2 2已知,均值已知,均值未知,假设未知,假设的先验概的先验概率满足正态分布,即:率满足正态分布,即: 200,pN 模式识别 绪论均值的后验概率均值的后验概率 1niip DppDp xpp Dpd202222100111exp22niiNx经推导可得,在已知训练样本集合经推导可得,在已知训练样本集合D的条件的条件下,参数下,参数的分布:的分布:211exp22nnn模式识别 绪论均值的后验概率均值的后验概率均值的后验概率仍满足正态分布,其中:均值的后验概率仍满足正
20、态分布,其中:2200222200nnnnn11nniixn2220220nn 模式识别 绪论均值分布的变化均值分布的变化模式识别 绪论类条件概率密度的计算类条件概率密度的计算 p x Dp xpD d221111expexp2222nnnxd222,1exp22nnnnfx 2222222221,exp2nnnnnnxfdu 模式识别 绪论3.3期望最大化算法期望最大化算法(EM算法算法)pEM算法的应用可以分为两个方面:算法的应用可以分为两个方面:1.训练样本中某些特征丢失情况下,分布参数的最大训练样本中某些特征丢失情况下,分布参数的最大似然估计;似然估计;2.对某些复杂分布模型假设,最大
21、似然估计很难得到对某些复杂分布模型假设,最大似然估计很难得到解析解时的迭代算法。解析解时的迭代算法。模式识别 绪论基本基本EM算法算法p令令X是观察到的样本数据集合,是观察到的样本数据集合,Y为丢失的数为丢失的数据集合,完整的样本集合据集合,完整的样本集合D=X Y。p DpX,Y lnllDlp X,YX,Y 由于由于Y未知,在给定参数未知,在给定参数时,时,似然函数可以似然函数可以看作看作Y的函数:的函数:模式识别 绪论基本基本EM算法算法p由于由于Y未知,因此我们需要寻找到一个在未知,因此我们需要寻找到一个在Y的的所有可能情况下,平均意义下的似然函数最所有可能情况下,平均意义下的似然函数
22、最大值,即似然函数对大值,即似然函数对Y的期望的最大值:的期望的最大值:11,iiQElY X,YX 1argmaxiiQ 1ln,iEpYX,Y X 模式识别 绪论基本基本EM算法算法1.begin initialize ,T,i0;2. do ii+13. E步:计算步:计算 ; ;4. M步:步:5. until 6.return 01iQ 11iiiiQQT 1i1argmaxiiQ 模式识别 绪论混合密度模型混合密度模型p一个复杂的概率密度分布函数可以由多个简一个复杂的概率密度分布函数可以由多个简单的密度函数混合构成:单的密度函数混合构成:1,Miiiipa px x 最常用的是高斯
23、混合模型最常用的是高斯混合模型(GMM,Gauss Mixture Model): 1;Miiiipa Nxx ,11Miia模式识别 绪论GMM模型产生的模型产生的2维样本数据维样本数据模式识别 绪论两个高斯函数的混合两个高斯函数的混合 0.710,20.3 (5,3)p xNN模式识别 绪论混合密度模型的参数估计混合密度模型的参数估计p混合密度模型的参数可以表示为:混合密度模型的参数可以表示为:1212,MMa aa 参数的估计方法:参数的估计方法:1. 利用最优化方法直接对似然函数进行优化,如利用最优化方法直接对似然函数进行优化,如梯度下降法;梯度下降法;2. 引入未知隐变量引入未知隐变
24、量Y对问题进行简化,将对问题进行简化,将Y看作丢看作丢失的数据,使用失的数据,使用EM算法进行优化。算法进行优化。模式识别 绪论GMM模型的参数估计模型的参数估计p首先引入隐含数据集合首先引入隐含数据集合:12,nYy yy 其中:其中: 代表第代表第i个训练样本是个训练样本是由第由第 个高斯函数产生的,将个高斯函数产生的,将Y作为丢失作为丢失数据集合,采用数据集合,采用EM算法进行迭代估计。算法进行迭代估计。1,iyMiy模式识别 绪论GMM参数的参数的EM估计算法估计算法1.设定混合模型数设定混合模型数M,初始化模型参数,初始化模型参数 ,阈值,阈值T,i0;2.用下列公式迭代计算模型参数
25、,直到似然函数变化用下列公式迭代计算模型参数,直到似然函数变化小于小于T为止:为止:01,iimmtmitMiijjtjja pp ma px x x 111,niimttap mnx 111,nittitmnittp mp mxx x 11111,ntiiittmtmitmnittp mp mx xxx 模式识别 绪论EM算法的性质算法的性质pEM算法具有收敛性;算法具有收敛性;pEM算法只能保证收敛于似然函数的局部最大值算法只能保证收敛于似然函数的局部最大值点(极值点),而不能保证收敛于全局最优点。点(极值点),而不能保证收敛于全局最优点。模式识别 绪论隐含隐含Markov模型模型 (Hi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈工大 模式识别 课件
限制150内