数字图象处理-第10章模式识别的理论与方法.ppt
-
资源ID:73418066
资源大小:2.43MB
全文页数:61页
- 资源格式: PPT
下载积分:11.9金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
数字图象处理-第10章模式识别的理论与方法.ppt
第第 10 章章 模模 式式 识识 别别 的的理理 论论 和和 方方 法法一个图像识别系统可分为三个主要部分。其框图如图一个图像识别系统可分为三个主要部分。其框图如图(10.1)所示。所示。(1)图像图像信息的获取;信息的获取;(2)信息的加工和处理,抽取特征;信息的加工和处理,抽取特征;(3)判断或分类。判断或分类。图图101 图像识别系统框图图像识别系统框图被识图像被识图像图像获取图像获取信息处理信息处理特征抽取特征抽取判决判决结果结果 10.1 概述概述 模式识别的主要方法可分为两大类模式识别的主要方法可分为两大类:l 统计学方法统计学方法l 语言学方法语言学方法 两类方法的不足:两类方法的不足:l 第一种方法没有利用图像本身的结构关系第一种方法没有利用图像本身的结构关系l 第二类方法没有考虑图像在环境中受噪声的干扰第二类方法没有考虑图像在环境中受噪声的干扰10.2 统计模式识别法统计模式识别法1)常用的决策规则常用的决策规则l 基于最小错误率的贝叶斯决策基于最小错误率的贝叶斯决策 在图像识别中,我们总希望尽量减少分类错误,利用贝叶斯在图像识别中,我们总希望尽量减少分类错误,利用贝叶斯(Bayes)公式能够得到错误率最小的分类规则,这就是基于最小)公式能够得到错误率最小的分类规则,这就是基于最小错误率的贝叶斯决策。错误率的贝叶斯决策。10.21 决策理论方法决策理论方法 设设:为为 状态下观察状态下观察 X 类的条件概率密度;类的条件概率密度;为为 状态下观察状态下观察 X 类的条件概率密度;类的条件概率密度;利用贝叶斯公式:利用贝叶斯公式:得到的条件概率得到的条件概率 称为状态的后验概率。称为状态的后验概率。基于最小错误率的贝叶斯决策规则为:基于最小错误率的贝叶斯决策规则为:如果如果 ,则把,则把X归类为归类为 ;如果如果 ,则把,则把X归类为归类为 。l基于最小风险的贝叶斯决策基于最小风险的贝叶斯决策 最小风险的贝叶斯决策是考虑各种错误造成损失而提出的决策规则。最小风险的贝叶斯决策是考虑各种错误造成损失而提出的决策规则。2 线性判别函数线性判别函数 线性判性判别函数是指判函数是指判别函数是函数是图像所有特征量的像所有特征量的线性性组合,即合,即式中式中 代表第代表第i个判别函数;个判别函数;是系数或权;是系数或权;为常数项或称为阈值。在为常数项或称为阈值。在两类之间的判决界处有下式的形式。两类之间的判决界处有下式的形式。(104)(105)3.最小距离分类器最小距离分类器线性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的线性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的距离作为分类的准则。假设有距离作为分类的准则。假设有m类,给出类,给出m个参考向量个参考向量 与模式类与模式类 相联系。相联系。4.最近邻域分类法最近邻域分类法 在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微扩张一下,一类不能只取一个代表,把最小距离的概念从一个点和一个扩张一下,一类不能只取一个代表,把最小距离的概念从一个点和一个点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法的基本思路。的基本思路。(1020)式式(1020)是一个二次型判别函数。通常二次型判别函数的决策边界是一个是一个二次型判别函数。通常二次型判别函数的决策边界是一个超二次曲面。超二次曲面。5.非线性判别函数非线性判别函数 统计学习理论是一种小样本统计理论,它为研究有限样本情况下统计学习理论是一种小样本统计理论,它为研究有限样本情况下的统计模式识别和更广泛的机器学习问题建立了一个较好的理论的统计模式识别和更广泛的机器学习问题建立了一个较好的理论框架,同时也发展了一种新的模式识别方法框架,同时也发展了一种新的模式识别方法支持向量机,能支持向量机,能够较好地解决小样本学习问题。够较好地解决小样本学习问题。1024 统计学习理论与支持向量机统计学习理论与支持向量机图图1034 机器学习的基本模型机器学习的基本模型 有三类基本的机器学习问题有三类基本的机器学习问题:模式识别模式识别 函数逼近函数逼近 概率密度估计概率密度估计 经验风险最小化并不一定意味着期望风险最小,学习机器的复杂经验风险最小化并不一定意味着期望风险最小,学习机器的复杂性不但与所研究的系统有关,而且要和有限的学习样本相适应。性不但与所研究的系统有关,而且要和有限的学习样本相适应。l支持向量机支持向量机 支持向量机(支持向量机(Support Vector Machines,简称,简称SVM方法)是实现方法)是实现统计学习理论的一种具体方法,其主要内容在统计学习理论的一种具体方法,其主要内容在1992年年1995年间年间才基本完成,目前仍处在不断发展阶段。才基本完成,目前仍处在不断发展阶段。设:线性可分样本为设:线性可分样本为 ,i=1,n,是类别标号。是类别标号。d维空间中线性判别函数的一般为维空间中线性判别函数的一般为 ,分类面方程为,分类面方程为:(10161)而要求分类线对所有样本正确分类,就是要求它满足而要求分类线对所有样本正确分类,就是要求它满足i=1,2,n (10162)因此,因此,满满足上述条件且使足上述条件且使最小的分最小的分类类面就是最面就是最优优分分类类面。面。过两类样本中离分类面最近的点且平行于最优分类面的超平面过两类样本中离分类面最近的点且平行于最优分类面的超平面H1、H2上的训练样本就是式上的训练样本就是式(10162)中使等号成立的那些样本,它们中使等号成立的那些样本,它们叫做支持向量(叫做支持向量(Support Vectors)。)。因为它们支撑了最优分类面,最优分类面的示意图如下图,图中用圆因为它们支撑了最优分类面,最优分类面的示意图如下图,图中用圆圈标出的点为支持向量。圈标出的点为支持向量。图1039 D4和D84组成的纹理图像图1040 D5和D92组成的纹理图像 图1042 自建的测试图像 图1041 D12和D17组成的纹理图像 图1043 自建的测试图像10.3 句法结构模式识别句法结构模式识别统计决策识别法的基本做法是首先从待识别模式中提取特征参数,统计决策识别法的基本做法是首先从待识别模式中提取特征参数,然后用这些特征参数把模式表达为特征空间中的点,然后再根据各然后用这些特征参数把模式表达为特征空间中的点,然后再根据各点之间的距离进行分类和识别。点之间的距离进行分类和识别。缺点:缺点:l 对比较复杂的模式需要较多的特征才能描述它,而特征提取对比较复杂的模式需要较多的特征才能描述它,而特征提取是比较困难的环节,对于同一模式往往有不同的抽取方法,就是比较困难的环节,对于同一模式往往有不同的抽取方法,就目前来看尚没有统一的理论依据。目前来看尚没有统一的理论依据。l简单的分类并不能代表识别,对于复杂的模式,识别的目的并简单的分类并不能代表识别,对于复杂的模式,识别的目的并不是仅仅要求把它分配到某一类别中去,而且还要对不同的对不是仅仅要求把它分配到某一类别中去,而且还要对不同的对象加以描述,在这方面统计决策法就有极大的局限性。象加以描述,在这方面统计决策法就有极大的局限性。l 句法结构模式识别法主要着眼于模式结构,采用形式语言理论来句法结构模式识别法主要着眼于模式结构,采用形式语言理论来分析和描述模式结构,因此,它具有统计识别法所不具备的优点。分析和描述模式结构,因此,它具有统计识别法所不具备的优点。10.3.1 形式语言概述形式语言概述 所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复杂的模式分成若干子模式,如此分下去直至最简单的子模式(或称基杂的模式分成若干子模式,如此分下去直至最简单的子模式(或称基元)为止。元)为止。10.3.2 句法结构方法句法结构方法 预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。基元抽取包括分割、特征(基元)抽取。基元的选择要尽可能少,而且基元抽取包括分割、特征(基元)抽取。基元的选择要尽可能少,而且容易被识别。容易被识别。结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的,结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的,就能得到模式的完整描述,即一个剖析式或剖析树。就能得到模式的完整描述,即一个剖析式或剖析树。句法方法在以下领域多有应用:句法方法在以下领域多有应用:)波形分析;)波形分析;)声音识别与理解;)声音识别与理解;)文字识别;)文字识别;)二维数学表示式;)二维数学表示式;)指纹分类;)指纹分类;)图像分析与理解;)图像分析与理解;)机器部件识别;)机器部件识别;)自动视觉检查;)自动视觉检查;)LANDSAT资源勘探用陆地卫星数据解释等。资源勘探用陆地卫星数据解释等。10.4 模糊集识别法简介模糊集识别法简介在模式识别中,有些问题是极其复杂的,要使计算机识别某一模式,在模式识别中,有些问题是极其复杂的,要使计算机识别某一模式,就要分析综合所有的特征,计算和比较大量的信息后才能作出判断。就要分析综合所有的特征,计算和比较大量的信息后才能作出判断。而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。10.4.1 模糊集合及其运算模糊集合及其运算 1.模糊子集模糊子集l没有明确外延的概念就称作模糊概念没有明确外延的概念就称作模糊概念l论域是指被讨论的全体对象,有时也称为空间,论域元素总是分明的论域是指被讨论的全体对象,有时也称为空间,论域元素总是分明的l论域中元素从属于模糊集合的程序不是绝对的论域中元素从属于模糊集合的程序不是绝对的0或或1,它可介于,它可介于0和和1之间之间l在模糊数学中,把元素对普通集合的绝对隶属关系加以灵活化,提出隶属度的概在模糊数学中,把元素对普通集合的绝对隶属关系加以灵活化,提出隶属度的概念念l隶属度用隶属函数来描述隶属度用隶属函数来描述 1.隶属原则和模糊模式识别的直接方法隶属原则和模糊模式识别的直接方法设设 是论域是论域U上的上的n个模糊子集,若对每一个个模糊子集,若对每一个 都建立都建立一个从属函数一个从属函数 ,对于任一元素,对于任一元素 ,若满足,若满足 (10106)则认为则认为 隶属于隶属于 ,这就是隶属原则。,这就是隶属原则。10.4.2 模糊模式识别的方法模糊模式识别的方法 例子:例子:任何三角形都可用三个边任何三角形都可用三个边a、b、c及三个顶角及三个顶角A、B、C来表示。来表示。把等腰三角形、等边三角形、直角三角形、等腰直角三角形看成是模把等腰三角形、等边三角形、直角三角形、等腰直角三角形看成是模糊集糊集 、。要运用直接方法识别,。要运用直接方法识别,首先要确定它们的从属函数。首先要确定它们的从属函数。取论域:取论域:,其中其中A、B、C表示三角形的三个内角,由此,可定义它们的从属函表示三角形的三个内角,由此,可定义它们的从属函数,进一步求得模糊几何图形的从属度。数,进一步求得模糊几何图形的从属度。设设 、分别为等腰三角形、直角三角形、等边三角形、分别为等腰三角形、直角三角形、等边三角形、等腰直角三角形及非典型一般三角形的从属函数,则有:等腰直角三角形及非典型一般三角形的从属函数,则有:(10107)(10108)(10109)(10110)(10111)如果有三角形甲,其内角分别为如果有三角形甲,其内角分别为 、;三角形乙,其内角分别为;三角形乙,其内角分别为 、,根据隶属原则能确定它们分属哪一类三角形。,根据隶属原则能确定它们分属哪一类三角形。由隶属原则,判定三角形甲是直角三角形。由隶属原则,判定三角形甲是直角三角形。由隶属原则,判定三角形乙是一般三角形。由隶属原则,判定三角形乙是一般三角形。相似系数有夹角余弦、相关系数等几种定义。如果用相似系数有夹角余弦、相关系数等几种定义。如果用 表示样本表示样本 与样本与样本 之间的距离,则也有如下一些距离的定义:之间的距离,则也有如下一些距离的定义:3.模糊聚类分析模糊聚类分析()绝对值距离()绝对值距离 (10125)()欧氏距离()欧氏距离 (10126)()马氏距离()马氏距离 (10127)式中式中V是一个是一个 阶的协方差矩阵,阶的协方差矩阵,其元素为:其元素为:(4)兰氏距离兰氏距离(10128)聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个步骤进行:步骤进行:l第一、计算各样本之间距离,将距离最近的两点合并为一类;第一、计算各样本之间距离,将距离最近的两点合并为一类;l第二、定义类与类间的距离,将最近的两类合并为新的一类;第二、定义类与类间的距离,将最近的两类合并为新的一类;(类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等)(类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等)l第三、反复做第二步,使类与类之间不断合并,最后完成聚类分析。第三、反复做第二步,使类与类之间不断合并,最后完成聚类分析。10.5 模式识别的几种应用模式识别的几种应用模式识别的应用较广,大致可有如下几个方面:字符识别;医学诊模式识别的应用较广,大致可有如下几个方面:字符识别;医学诊断;遥感图像解译;人脸和指纹鉴别;污染监测;自动检查和自动断;遥感图像解译;人脸和指纹鉴别;污染监测;自动检查和自动化;可靠性;社会经济;语音识别和理解;考古等。化;可靠性;社会经济;语音识别和理解;考古等。1051 生物特征识别生物特征识别l 指纹识别指纹识别 指纹具有两大特性指纹具有两大特性:1)没有两个人的指纹是相同的;没有两个人的指纹是相同的;2)当指纹不受损伤时终生不变。当指纹不受损伤时终生不变。首先,指纹分为七类(平斗、左箕、右箕、平弓、帐弓、左双箕、右首先,指纹分为七类(平斗、左箕、右箕、平弓、帐弓、左双箕、右双箕)。第一类再分为十八个小类,然后测量斜率。总的过程是分类、分双箕)。第一类再分为十八个小类,然后测量斜率。总的过程是分类、分层、分窗口,在这个过程中包括细化,连接断线等处理层、分窗口,在这个过程中包括细化,连接断线等处理;尔后整个窗口用一个树代表,树的每一个分支是窗口中的一根隆线,然尔后整个窗口用一个树代表,树的每一个分支是窗口中的一根隆线,然后找出文法后找出文法;最后做一树状自动机。最后做一树状自动机。(1)人脸识别系统的基本组成人脸识别系统的基本组成参数人脸图像库人脸检测定位特征提取和选择训练图像预处理识别特征提取和选择图像预处理人脸检测定位待测人脸图像训练过程识别过程l 人脸识别人脸识别(2 2).人脸识别基本算法人脸识别基本算法基于几何特征的方法基于几何特征的方法 该方法要求选取的特征矢量有一定的独特性,既要反映不同人脸的差该方法要求选取的特征矢量有一定的独特性,既要反映不同人脸的差异,还要具有一定的弹性,以减少或者消除光照差异等影响。几何特征异,还要具有一定的弹性,以减少或者消除光照差异等影响。几何特征向量是以人脸器官的形状和几何关系为基础的特征向量,其分量通常包向量是以人脸器官的形状和几何关系为基础的特征向量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。括人脸指定两点间的欧式距离、曲率、角度等。基于神经网络的方法基于神经网络的方法 早期用于人脸识别的神经网络主要是早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络,自联想映射神经网络,当人脸图像受噪声污染严重或部分缺损时,用当人脸图像受噪声污染严重或部分缺损时,用Kohonen网络恢复完网络恢复完整的人脸的效果较好。整的人脸的效果较好。Cottrell等人使用级联等人使用级联BP神经网络进行人脸神经网络进行人脸识别,对部分受损的、光照有所变化的人脸图像识别能力也较好。识别,对部分受损的、光照有所变化的人脸图像识别能力也较好。基于代数特征的方法基于代数特征的方法 这类算法是采用代数特征向量,即人脸图像在由这类算法是采用代数特征向量,即人脸图像在由“特征脸特征脸”张成张成的降维子空间上的投影。基于代数特征识别的主要原理是利用统的降维子空间上的投影。基于代数特征识别的主要原理是利用统计方法提取特征,从而形成子空间进行识别。计方法提取特征,从而形成子空间进行识别。(3)当前主流算法当前主流算法1 1)特征脸(特征脸(eigenfaceeigenface)算法)算法特征脸方法的优点:特征脸方法的优点:图像的原始灰度数据直接用来学习和识别,不需要任何低级或中图像的原始灰度数据直接用来学习和识别,不需要任何低级或中级处理;级处理;不需要人脸的几何和反射知识;不需要人脸的几何和反射知识;通过低维可以有效的对高维数据进行压缩;通过低维可以有效的对高维数据进行压缩;与其它匹配方法相比,识别简单有效。与其它匹配方法相比,识别简单有效。特征脸方法存在的不足:特征脸方法存在的不足:图像中所有的像素被赋予了同等的地位,可是角度、光照、尺寸图像中所有的像素被赋予了同等的地位,可是角度、光照、尺寸及表情等干扰会导致识别率下降,因此,须先进行尺度归一化处及表情等干扰会导致识别率下降,因此,须先进行尺度归一化处理;理;在姿态和光照变化时识别率明显下降;在姿态和光照变化时识别率明显下降;要求背景单一,;要求背景单一,;学习时间长,只能离线计算。学习时间长,只能离线计算。2 2)弹性图匹配方法弹性图匹配方法 弹性图匹配方法(弹性图匹配方法(Elastic Graph MatchingElastic Graph Matching)是一种基于动态链)是一种基于动态链接结构接结构(Dynamic Link Architecture(Dynamic Link Architecture,DLA)DLA)的方法。它将人脸用的方法。它将人脸用格状的稀疏图(即拓扑图)表示,图中的节点用图像位置的格状的稀疏图(即拓扑图)表示,图中的节点用图像位置的GaborGabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。记。其优点是:其优点是:人脸稀疏图(即拓朴图)的顶点采用了小波变换特征,对光照、人脸稀疏图(即拓朴图)的顶点采用了小波变换特征,对光照、位移、旋转及尺度变化都不敏感。位移、旋转及尺度变化都不敏感。弹性图匹配法能保留二维图像的空间相关信息。而特征脸方法在弹性图匹配法能保留二维图像的空间相关信息。而特征脸方法在将图像排成一维向量后,丢失了很多空间相关信息。将图像排成一维向量后,丢失了很多空间相关信息。(4).人脸识别的统计结果人脸识别的统计结果 根据图根据图5.15.1和图和图5.25.2所示的训练和识别的流程图在所示的训练和识别的流程图在Microsoft Microsoft Visual C+6.0Visual C+6.0环境下编程测试环境下编程测试KPCAKPCA人脸识别效果,采用美国的人脸识别效果,采用美国的YaleYale人脸库,人脸库,图像库中共图像库中共1515人,每人人,每人1111张照片,人脸数目共计为张照片,人脸数目共计为165165。每人。每人1010幅图像作训练,一幅做测试,识别率定义如下:幅图像作训练,一幅做测试,识别率定义如下:其中,其中,n n为正确识别出的人脸个数,为正确识别出的人脸个数,N N为训练集中的人数。利用为训练集中的人数。利用PCAPCA进行人脸识别的实验结果为:进行人脸识别的实验结果为:87.5 42 模式识别在医学上的应用模式识别在医学上的应用 431 印刷电路板自动外观检查装置印刷电路板自动外观检查装置 43 模式识别在自动检测中的应用模式识别在自动检测中的应用 图图10-39 产品质量检测实例产品质量检测实例图图10-40 产品质量检测实例产品质量检测实例图图10-41 汽车牌照识别汽车牌照识别图图10-42 电路板零件缺失检测电路板零件缺失检测