模式识别ppt(钟珞).ppt
《模式识别ppt(钟珞).ppt》由会员分享,可在线阅读,更多相关《模式识别ppt(钟珞).ppt(252页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模 式 识 别2023/3/3模式识别2课程对象计算机学院(软件学院)本科生的专业选修课研究生的专业课2023/3/3模式识别3与模式识别相关的学科统计学概率论线性代数(矩阵计算)信号处理机器学习人工智能图像处理计算机视觉2023/3/3模式识别4教学方法着重讲述模式识别的基本概念,基本方法和算法原理。注重理论与实践紧密结合实例教学:主要通过实例讲述如何将所学知识运用到实际应用之中避免陷入过多的、繁琐的数学推导。2023/3/3模式识别5教学目标了解模式识别的基本概念和方法能够运用所学知识和方法解决部分实际问题为深入研究模式识别的理论和方法打下基础 2023/3/3模式识别6教材/参考文献钟珞
2、,模式识别,武汉大学出版社边肇祺,模式识别(第二版),清华大学出版社蔡元龙,模式识别,西北电讯工程学院出版社第一章 绪 论2023/3/3模式识别81.1 模式识别和模式的概念什么是模式识别:模式识别是研究用计算机来实现人类模式识别能力的一门学科。模式识别 直观,无所不在,“物以类聚”周围物体的认知:桌子、椅子人的识别:张三、李四声音的辨别:汽车、火车,狗叫、人语人和动物的模式识别能力是极其平常的,但对计算机来说却是非常困难的。2023/3/3模式识别9什么是模式广义地说,模式是一些供模仿用的、完美无缺的标本。本课程把所见到的具体事物称为模式,而将它们归属的类别称为模式类。模式的直观特性:可观
3、察性可区分性相似性2023/3/3模式识别10模式识别简史1929年 G.Tauschek发明阅读机,能够阅读0-9的数字。30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。50年代 Noam Chemsky 提出形式语言理论傅京荪 提出句法结构模式识别。60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。90年代小样本学习理论,支持向量机也受到了很大的重视。2023/3/3模式识别111.2 模式识别的研究方法模式识别系统识别方法2023/3
4、/3模式识别121.2.1 模式识别系统信息获取预处理特征提取和选取分类器设计分类决策2023/3/3模式识别131 信息获取二维图象 如文字、指纹、地图、照片一维波形 如脑电图、心电图、机械震动波形物理参数和逻辑值2023/3/3模式识别142 预处理目的:去除噪声,加强有用信息,复原信息预处理:包括AD,二值化,图象的平滑,变换,增强,恢复,滤波等,主要指图象处理。2023/3/3模式识别153 特征提取和选取特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征测量空间:原始数据组成的空间特征空间:分类识别赖以进行的空间模式表示:维数较高的测量空间-维数较低的特征空间例如,一幅6
5、4x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。2023/3/3模式识别164 分类器设计是一种分类判别规则。用一定数量的样本确定出一套分类判别规则,使得按这套分类判别规则对待识别模式进行分类造成的错误识别率最小或引起的损失最小。2023/3/3模式识别175 分类决策分类器按已确定的分类判别规则对待识别模式进行分类判别,输出分类结果,这就是分类器的使用过程,又称为分类决策。2023/3/3模式识别181.2.2 识别方法描述模式有两种方法:定量描述和结构性描述。定量描述就是用一组数据来描述模式;结构性描述就是用一组基元来描述模式。两
6、种基本的模式识别方法:统计模式识别方法和结构模式识别方法。2023/3/3模式识别19统计模式识别被研究的模式用特征向量来描述,特征向量中的每一个元素代表模式的一个特征或属性,特征向量构成的空间叫做特征空间。研究统计模式识别方法的任务就是用不同的方法划分特征空间,从而达到识别的目的。2023/3/3模式识别20结构模式识别该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。模式是由一些模式基元按一定的结构规则组合而成,结构分析的内容就是分析模式如何由基元构成的规则。比较成功的是句法结构模式识别。通过检查代表这个模式的句子是否符合事先给定的某一类文法规则,如果符合,那么这个模式就属于这
7、个文法所代表的那个模式类。2023/3/3模式识别21模糊模式识别利用模糊数学的理论和方法分析和解决模式识别问题。具有数学基础,又更接近人的思维。代表方法:模糊K均值、模糊ISODATA算法。2023/3/3模式识别22神经网络神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。神经网络可以实现监督和非监督学习条件下的分类。2023/3/3模式识别231.3 模式识别的应用(举例)生物学自动细胞学、染色体特性研究、遗传研究天文学天文望远
8、镜图像分析、自动光谱学经济学股票交易预测、企业行为分析医学心电图分析、脑电图分析、医学图像分析2023/3/3模式识别24工程产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析、字符识别军事航空摄像分析、雷达和声纳信号检测和分类、自动目标识别安全指纹识别、人脸识别、监视和报警系统模式识别的应用(举例)2023/3/3模式识别25模式分类器的获取和评测过程数据采集特征选取模型选择训练和测试计算结果和复杂度分析,反馈2023/3/3模式识别26训练和测试训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。测试集:在设计识别和分类系统时没有用过的独立样本集。系统评价原则:为了更
9、好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。2023/3/3模式识别27实例:统计模式识别19名男女同学进行体检,测量了身高和体重,但事后发现其中有4人忘记填写性别,试问(在最小错误的条件下)这4人是男是女?体检数值如下:2023/3/3模式识别28实例:统计模式识别(续)待识别的模式:性别(男或女)测量的特征:身高和体重训练样本:15名已知性别的样本特征目标:希望借助于训练样本的特征建立判别函数(即数学模型)2023/3/3模式识别29实例:统计模式识别(续)从图中训练样本的分布情况,找出男、女两类特征各自的聚类特点,从而求取一个判别函数(直线或曲线)。只
10、要给出待分类的模式特征的数值,看它在特征平面上落在判别函数的哪一侧,就可以判别是男还是女了。2023/3/3模式识别302023/3/3模式识别312023/3/3模式识别322023/3/3模式识别33本门课程的主要内容1、模式识别概述2、Bayes决策理论3、线性判别函数与非线性判别函数4、近邻法则5、特征提取和选择6、非监督学习方法(数据聚类)7、统计学习理论8、模式识别应用实例第二章 贝叶斯决策理论2023/3/3模式识别352.1 贝叶斯决策的基本概念随机模式与统计特性贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问题各类别总体的概率分布是已知的要决策分类的类别是一定的如何使分
11、类错误率尽可能小是研究各种分类方法的中心问题有关概念:先验概率、类条件概率密度、后验概率、贝叶斯公式2023/3/3模式识别36作为统计判别问题的模式分类模式识别的目的就是要确定某一个给定的模式样本属于哪一类。可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类。2023/3/3模式识别37作为统计判别问题的模式分类在获取模式的观测值时,有些事务具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生。例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完
12、全可以确定它是不是直角三角形。这种现象是确定性的现象。2023/3/3模式识别38作为统计判别问题的模式分类但在现实世界中,由于许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性。只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性。特征值不再是一个确定的向量,而是一个随机向量。此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小。2023/3/3模式识别39先验概率预先已知的或者可以估计的模式识别系统位于某种类型的概率。2023/3/3模式识别40类条件概率密度函数系统位于某种类型条件下模式样本X出现的概率密
13、度分布函数。同一类事物的各个属性的变化范围,用一种函数来表示其分布密度。2023/3/3模式识别41后验概率系统在某个具体的模式样本X条件下位于某种类型的概率。后验概率可以根据贝叶斯公式计算,直接用做分类判决的依据。2023/3/3模式识别42贝叶斯公式两个事物X与w联合出现的概率称为联合概率。利用该公式可以计算后验概率。2023/3/3模式识别432.2 几种常用的决策规则研究在统计意义下的分类判决。用分类决策规则对模式进行分类。都存在判错的可能;不同的决策规则可能有不同的判决结果。最小错误率决策与最小风险决策。限定错误率的两类判别决策。最小最大决策。2023/3/3模式识别442.2.1
14、最小错误率的贝叶斯决策在模式分类问题中,往往希望尽量减少分类错误的概率,因此需要建立一种能使错误率为最小的决策规则。从这样的要求出发,利用概率论中的贝叶斯公式得出使错误率为最小得分类规则,称之为基于最小错误率得贝叶斯决策。基于最小错误概率的贝叶斯决策理论就是按后验概率的大小作判决的。2023/3/3模式识别45例子1癌细胞识别:只有两类情况,是与否。用d维向量X表示细胞测量数据,1代表正常细胞,2代表异常细胞。目的是要根据X把测量细胞判别为正常细胞或者异常细胞。2023/3/3模式识别46例子1根据大量统计资料,可以对正常细胞与异常出现的比例作出估计。这就是通常所说的先验概率:P(1)与P(2
15、)2023/3/3模式识别47例子1下图是正常细胞的属性分布与异常细胞的属性分布。即类条件概率密度函数。得到样本的观测值x之后,可以根据先验概率和类概率密度得到后验概率。通过后验概率则可以作出分类判断。2023/3/3模式识别48例子1利用贝叶斯公式计算两类的后验概率2023/3/3模式识别49例子1基于最小错误概率的贝叶斯决策理论就是按后验概率的大小作判据,其规则为2023/3/3模式识别50例子2假设某个地区正常细胞1与异常细胞2的先验概率分别为对于某个待识别细胞,其观察值为x,根据类条件概率密度分布曲线上可知请对该细胞进行分类2023/3/3模式识别51例子2利用贝叶斯公式,分别计算1与
16、2的后验概率如下2023/3/3模式识别52例子2根据最小错误率的贝叶斯决策规则,合理的决策是把x归类于正常状态。尽管类别2出现状态x的条件概率高于1出现此状态的概率,但是根据最小错误原则,该细胞被判断为正常。2023/3/3模式识别53证明(最小错误率)假设模式特征x是一个连续的随机变量,显然观察到的x不同,后验概率不同,分类错误率也不同。分类错误概率P(e|x)是随机变量x的函数。观察到大量模式,对它们作出决策的平均错误率P(e)是P(e|x)的数学期望。则可以计算这个随机变量x的函数P(e|x)的数学期望:P(x)为x出现的概率,P(e|x)是观测值为x时的条件错误概率,积分表示整个d维
17、空间上的总和。在一维情况下,x取整个范围。2023/3/3模式识别54证明(最小错误率)对两类问题,从决策规则可知,如果那么决策为第2类,这时x的条件错误概率为所以有如下的公式:2023/3/3模式识别55证明(最小错误率)在例子2的决策中,实际包含了0.182的错误概率。所以如果把作出1决策的区域记为R1,作出2决策的区域记为R2,则在R1内的每个x,条件错误概率为P(2|x),所以有下面的公式。2023/3/3模式识别56证明(最小错误率)下图表示一维模式时的情况。H为R1与R2的分界。H的位置不同,错误率也不同。阴影部分为总的错误率。改变H的位置,可以改变错误率。选取决策面使得:则可消除
18、小面积A,得到最小分类错误概率。这正是贝叶斯决策规则。2023/3/3模式识别572.2.2 最小风险的贝叶斯决策在一些实际问题中,错误率最小并不是一个最佳选择。有时候宁可扩大一些总的错误,也要使总的损失减少。对前面的例子可以看到,我们不仅要考虑到尽可能作出正确的判断,而且还要考虑万一作出了错误的判断后带来的后果,要比较哪一种的风险更小,或者损失更大。2023/3/3模式识别582.2.2 最小风险的贝叶斯决策这里引入一个与损失有关联的,更为广泛的概念:风险。在进行分类决策的时候,要考虑决策所承担的风险。最小风险的贝叶斯决策就是把各种分类错误引起的损失考虑进去的贝叶斯决策法则。期望风险与条件风
19、险。2023/3/3模式识别592.2.2 最小风险的贝叶斯决策决策论中称采取的决定为决策或行动。所有可能采取的各种决策组成的集合称决策空间或行动空间。每个决策都会带来一定的损失,通常是决策和自然状态的函数,用决策表来表示这种关系。决策表的形成是困难的,需要大量的领域知识。2023/3/3模式识别602.2.2 最小风险的贝叶斯决策其基本思想是:在观测值X条件下,对各状态的后验概率求加权和,并根据加权和的大小来进行分类决策。而这个加权和就是所谓的风险。2023/3/3模式识别612.2.2 最小风险的贝叶斯决策如果希望尽可能避免将状态(j)错判为(i),则可以将相应的(j,i)的值选择得大一些
20、。那么可以知道最小风险的判别方法就是根据下面的公式来实现的。找出条件风险最下的。2023/3/3模式识别62例子3在例子2的基础上进一步讨论。如X是2但被判断为1,会有损失用21来表示;如X是1但被判断为2,会有损失用12来表示;将X判断为1与2的风险分别为:2023/3/3模式识别63例子3如果已知11=0,21=6,12=1,22=0,按最小风险贝叶斯该如何分类。2023/3/3模式识别642.2.2最小风险的贝叶斯决策关于最小风险贝叶斯决策规则的一些相关术语。自然状态与状态空间:样本与类别决策与决策空间:决策总数可能大于类别数损失函数与决策表:决策表是一种先验知识期望损失:期望损失的最小
21、值,就是最小风险的贝叶斯决策2023/3/3模式识别652.2.2最小风险的贝叶斯决策最小错误率与最小风险之间的关系定义决策表的损失函数为0-1损失函数根据前面的公式可以知道,最小错误率贝叶斯决策就是在0-1损失函数条件下的最小风险贝叶斯决策。即前者是后者的一个特例。2023/3/3模式识别662.2.3 限定错误率的两类判别决策在两类判别决策问题中,有两种错误分类的可能。这两种错误的概率为P(2)P2(e)和P(1)P1(e)最小错误率贝叶斯决策是使这两种错误率之和最小。实际中,有时要求限制某一类错误率不大于某个常数而使另一类错误率尽可能地小,即令:2023/3/3模式识别672.2.3 限
22、定错误率的两类判别决策这样的决策,就是一个典型的条件极值问题,可以用Lagrange乘子法解决。按此方法建立数学模型:2023/3/3模式识别682.2.3 限定错误率的两类判别决策2023/3/3模式识别692.2.3 限定错误率的两类判别决策满足上面公式的边界面以及最佳,就可以让极小。此时,决策规则可以写为:2023/3/3模式识别702.2.4 最小最大决策在实际中,各类先验概率P(i)往往不能精确知道,或者在分析过程中是变化的。那么此时的判决不是最佳的,实际平均损失会变大。如何解决这种平均损失变大的问题,按决策论的思想,应该立足在最差情况下争取最好的结果。根据这种原则,可以知道最小最大
23、决策是一种稳健的设计方法,也是一种保守的设计方法。2023/3/3模式识别712.2.4 最小最大决策对于两类问题,假设一种分类识别决策将特征空间分为两个区域,平均损失为:2023/3/3模式识别722.2.4 最小最大决策2023/3/3模式识别732.2.4 最小最大决策根据图和公式进行分析,在(0,1)区间内,对先验概率P(1)取若干个不同的值,按最小风险决策确定相应的决策域,从而计算相应的最小风险R,可以得出最小贝叶斯风险与先验概率的关系曲线,如图的曲线部分。图a曲线上A点的纵坐标是对应于先验概率为P*(1)时的最小风险。过A的切线CD,表示在判决面不作调整的情况下,当P(1)变化时,
24、R的变化,是一个线性函数,在(a,a+b)之间变化。2023/3/3模式识别742.2.4 最小最大决策由于没有针对P(1)的变化重新求最佳判决面,所以平均损失要比最佳的判决面大,直线CD在曲线上方说明了此点。可以总结,在作最小决策时,考虑先验概率可能改变,则应选择使最小贝叶斯风险为最大值时的P*(1)来设计分类器,即对应图b中的B点。此时直线平行P(1),能保证在不调整判决面的情况下,不管P(1)如何变化,最大风险都为最小。2023/3/3模式识别752.2.4 最小最大决策具体的设计过程是:按最小损失准则找出对应于(0,1)中的各个不同值的P(1)的最佳决策面,计算相应的最小平均损失,得到
25、曲线函数。找出使R最大的P*(1),最后运用最小损失的决策规则构造似然比函数:2023/3/3模式识别762.2.5 序贯分类方法前面的方法都没有考虑获取特征所花费的代价。有的问题需要考虑其余特征的获取代价是否大于分类错误的代价。解决这个问题的方法是序贯分类方法。先用一部分特征来分类,逐步加入分类特征减少分类损失;并且比较加入特征的花费代价与所降低分类损失的大小。2023/3/3模式识别772.2.6 分类器设计根据所学习的贝叶斯决策规则,可以进行分类器的设计。分类器设计就是在描述待识别对象的d维特征所组成的特征空间内,将其划分为c个决策域。决策域的边界称为决策面;用于表达决策规则的函数称为判
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 ppt 钟珞
限制150内