欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数字图象处理模式识别的理论与方法.pptx

    • 资源ID:80050642       资源大小:2.03MB        全文页数:61页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数字图象处理模式识别的理论与方法.pptx

    一个图像识别系统可分为三个主要部分。其框图如图一个图像识别系统可分为三个主要部分。其框图如图(10.1)所示。所示。(1)图像图像信息的获取;信息的获取;(2)信息的加工和处理,抽取特征;信息的加工和处理,抽取特征;(3)判断或分类。判断或分类。图101 图像识别系统框图被识图像图像获取信息处理特征抽取判决结果 10.1 概述 第1页/共61页 模式识别的主要方法可分为两大类模式识别的主要方法可分为两大类:l 统计学方法统计学方法l 语言学方法语言学方法 两类方法的不足:两类方法的不足:l 第一种方法没有利用图像本身的结构关系第一种方法没有利用图像本身的结构关系l 第二类方法没有考虑图像在环境中受噪声的干扰第二类方法没有考虑图像在环境中受噪声的干扰第2页/共61页10.2 统计模式识别法第3页/共61页1)常用的决策规则l 基于最小错误率的贝叶斯决策 在图像识别中,我们总希望尽量减少分类错误,利用贝叶斯(Bayes)公式能够得到错误率最小的分类规则,这就是基于最小错误率的贝叶斯决策。10.21 决策理论方法第4页/共61页 设:为 状态下观察 X 类的条件概率密度;为 状态下观察 X 类的条件概率密度;利用贝叶斯公式:得到的条件概率 称为状态的后验概率。第5页/共61页基于最小错误率的贝叶斯决策规则为:如果 ,则把X归类为 ;如果 ,则把X归类为 。l基于最小风险的贝叶斯决策 最小风险的贝叶斯决策是考虑各种错误造成损失而提出的决策规则。第6页/共61页 2 线性判别函数 线性判性判别函数是指判函数是指判别函数是函数是图像所有特征量的像所有特征量的线性性组合,即合,即式中式中 代表第代表第i个判别函数;个判别函数;是系数或权;是系数或权;为常数项或称为阈值。在为常数项或称为阈值。在两类之间的判决界处有下式的形式。两类之间的判决界处有下式的形式。(104)(105)第7页/共61页 3.最小距离分类器最小距离分类器线性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的线性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的距离作为分类的准则。假设有距离作为分类的准则。假设有m类,给出类,给出m个参考向量个参考向量 与模式类与模式类 相联系。相联系。第8页/共61页第9页/共61页 4.最近邻域分类法 在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微扩张一下,一类不能只取一个代表,把最小距离的概念从一个点和一个扩张一下,一类不能只取一个代表,把最小距离的概念从一个点和一个点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法的基本思路。的基本思路。第10页/共61页 (1020)式(1020)是一个二次型判别函数。通常二次型判别函数的决策边界是一个超二次曲面。5.非线性判别函数第11页/共61页 统计学习理论是一种小样本统计理论,它为研究有限样本情况下的统计模式识别和更广泛的机器学习问题建立了一个较好的理论框架,同时也发展了一种新的模式识别方法支持向量机,能够较好地解决小样本学习问题。1024 统计学习理论与支持向量机第12页/共61页图1034 机器学习的基本模型第13页/共61页 有三类基本的机器学习问题:模式识别 函数逼近 概率密度估计 经验风险最小化并不一定意味着期望风险最小,学习机器的复杂性不但与所研究的系统有关,而且要和有限的学习样本相适应。第14页/共61页l支持向量机 支持向量机(Support Vector Machines,简称SVM方法)是实现统计学习理论的一种具体方法,其主要内容在1992年1995年间才基本完成,目前仍处在不断发展阶段。第15页/共61页设:线性可分样本为 ,i=1,n,是类别标号。d维空间中线性判别函数的一般为 ,分类面方程为:(10161)第16页/共61页 而要求分类线对所有样本正确分类,就是要求它满足i=1,2,n (10162)因此,满足上述条件且使最小的分类面就是最优分类面。过两类样本中离分类面最近的点且平行于最优分类面的超平面H1、H2上的训练样本就是式(10162)中使等号成立的那些样本,它们叫做支持向量(Support Vectors)。第17页/共61页 因为它们支撑了最优分类面,最优分类面的示意图如下图,图中用圆圈标出的点为支持向量。第18页/共61页图1039 D4和D84组成的纹理图像图1040 D5和D92组成的纹理图像 第19页/共61页图1042 自建的测试图像 图1041 D12和D17组成的纹理图像 第20页/共61页图1043 自建的测试图像第21页/共61页10.3 句法结构模式识别统计决策识别法的基本做法是首先从待识别模式中提取特征参数,统计决策识别法的基本做法是首先从待识别模式中提取特征参数,然后用这些特征参数把模式表达为特征空间中的点,然后再根据各然后用这些特征参数把模式表达为特征空间中的点,然后再根据各点之间的距离进行分类和识别。点之间的距离进行分类和识别。缺点:l 对比较复杂的模式需要较多的特征才能描述它,而特征提取是比较困难的环节,对于同一模式往往有不同的抽取方法,就目前来看尚没有统一的理论依据。l简单的分类并不能代表识别,对于复杂的模式,识别的目的并不是仅仅要求把它分配到某一类别中去,而且还要对不同的对象加以描述,在这方面统计决策法就有极大的局限性。第22页/共61页l 句法结构模式识别法主要着眼于模式结构,采用形式语言理论来分析和描述模式结构,因此,它具有统计识别法所不具备的优点。10.3.1 形式语言概述 所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复杂的模式分成若干子模式,如此分下去直至最简单的子模式(或称基杂的模式分成若干子模式,如此分下去直至最简单的子模式(或称基元)为止。元)为止。第23页/共61页 10.3.2 句法结构方法 预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。基元抽取包括分割、特征(基元)抽取。基元的选择要尽可能少,而且基元抽取包括分割、特征(基元)抽取。基元的选择要尽可能少,而且容易被识别。容易被识别。结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的,结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的,就能得到模式的完整描述,即一个剖析式或剖析树。就能得到模式的完整描述,即一个剖析式或剖析树。第24页/共61页句法方法在以下领域多有应用:)波形分析;)声音识别与理解;)文字识别;)二维数学表示式;)指纹分类;)图像分析与理解;)机器部件识别;)自动视觉检查;)LANDSAT资源勘探用陆地卫星数据解释等。第25页/共61页10.4 模糊集识别法简介在模式识别中,有些问题是极其复杂的,要使计算机识别某一模式,在模式识别中,有些问题是极其复杂的,要使计算机识别某一模式,就要分析综合所有的特征,计算和比较大量的信息后才能作出判断。就要分析综合所有的特征,计算和比较大量的信息后才能作出判断。而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。第26页/共61页10.4.1 模糊集合及其运算 1.模糊子集l没有明确外延的概念就称作模糊概念没有明确外延的概念就称作模糊概念l论域是指被讨论的全体对象,有时也称为空间,论域元素总是分明的论域是指被讨论的全体对象,有时也称为空间,论域元素总是分明的l论域中元素从属于模糊集合的程序不是绝对的论域中元素从属于模糊集合的程序不是绝对的0或或1,它可介于,它可介于0和和1之间之间l在模糊数学中,把元素对普通集合的绝对隶属关系加以灵活化,提出隶属度的概在模糊数学中,把元素对普通集合的绝对隶属关系加以灵活化,提出隶属度的概念念l隶属度用隶属函数来描述隶属度用隶属函数来描述 第27页/共61页1.隶属原则和模糊模式识别的直接方法设设 是论域是论域U上的上的n个模糊子集,若对每一个个模糊子集,若对每一个 都建立都建立一个从属函数一个从属函数 ,对于任一元素,对于任一元素 ,若满足,若满足 (10106)则认为则认为 隶属于隶属于 ,这就是隶属原则。,这就是隶属原则。10.4.2 模糊模式识别的方法 第28页/共61页例子:任何三角形都可用三个边a、b、c及三个顶角A、B、C来表示。把等腰三角形、等边三角形、直角三角形、等腰直角三角形看成是模糊集 、。要运用直接方法识别,首先要确定它们的从属函数。取论域:取论域:,其中其中A、B、C表示三角形的三个内角,由此,可定义它们的从属函表示三角形的三个内角,由此,可定义它们的从属函数,进一步求得模糊几何图形的从属度。数,进一步求得模糊几何图形的从属度。第29页/共61页设设 、分别为等腰三角形、直角三角形、等边三角形、分别为等腰三角形、直角三角形、等边三角形、等腰直角三角形及非典型一般三角形的从属函数,则有:等腰直角三角形及非典型一般三角形的从属函数,则有:(10107)(10108)(10109)第30页/共61页 (10110)(10111)如果有三角形甲,其内角分别为如果有三角形甲,其内角分别为 、;三角形乙,其内角分别为;三角形乙,其内角分别为 、,根据隶属原则能确定它们分属哪一类三角形。,根据隶属原则能确定它们分属哪一类三角形。第31页/共61页第32页/共61页 由隶属原则,判定三角形甲是直角三角形。由隶属原则,判定三角形乙是一般三角形。第33页/共61页 相似系数有夹角余弦、相关系数等几种定义。如果用 表示样本 与样本 之间的距离,则也有如下一些距离的定义:3.模糊聚类分析()绝对值距离 (10125)()欧氏距离 (10126)第34页/共61页()马氏距离 (10127)式中V是一个 阶的协方差矩阵,其元素为:第35页/共61页(4)兰氏距离(10128)第36页/共61页 聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个步骤进行:步骤进行:l第一、计算各样本之间距离,将距离最近的两点合并为一类;第一、计算各样本之间距离,将距离最近的两点合并为一类;l第二、定义类与类间的距离,将最近的两类合并为新的一类;第二、定义类与类间的距离,将最近的两类合并为新的一类;(类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等)(类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等)l第三、反复做第二步,使类与类之间不断合并,最后完成聚类分析。第三、反复做第二步,使类与类之间不断合并,最后完成聚类分析。第37页/共61页10.5 模式识别的几种应用模式识别的应用较广,大致可有如下几个方面:字符识别;医学诊模式识别的应用较广,大致可有如下几个方面:字符识别;医学诊断;遥感图像解译;人脸和指纹鉴别;污染监测;自动检查和自动断;遥感图像解译;人脸和指纹鉴别;污染监测;自动检查和自动化;可靠性;社会经济;语音识别和理解;考古等。化;可靠性;社会经济;语音识别和理解;考古等。第38页/共61页 1051 生物特征识别l 指纹识别 指纹具有两大特性指纹具有两大特性:1)没有两个人的指纹是相同的;没有两个人的指纹是相同的;2)当指纹不受损伤时终生不变。当指纹不受损伤时终生不变。第39页/共61页 首先,指纹分为七类(平斗、左箕、右箕、平弓、帐弓、左双箕、右首先,指纹分为七类(平斗、左箕、右箕、平弓、帐弓、左双箕、右双箕)。第一类再分为十八个小类,然后测量斜率。总的过程是分类、分双箕)。第一类再分为十八个小类,然后测量斜率。总的过程是分类、分层、分窗口,在这个过程中包括细化,连接断线等处理层、分窗口,在这个过程中包括细化,连接断线等处理;尔后整个窗口用一个树代表,树的每一个分支是窗口中的一根隆线,然尔后整个窗口用一个树代表,树的每一个分支是窗口中的一根隆线,然后找出文法后找出文法;最后做一树状自动机。最后做一树状自动机。第40页/共61页第41页/共61页(1)人脸识别系统的基本组成参数人脸图像库人脸检测定位特征提取和选择训练图像预处理识别特征提取和选择图像预处理人脸检测定位待测人脸图像训练过程识别过程l 人脸识别第42页/共61页(2 2).人脸识别基本算法基于几何特征的方法 该方法要求选取的特征矢量有一定的独特性,既要反映不同人脸的差异,还要具有一定的弹性,以减少或者消除光照差异等影响。几何特征向量是以人脸器官的形状和几何关系为基础的特征向量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。第43页/共61页基于神经网络的方法 早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络,当人脸图像受噪声污染严重或部分缺损时,用Kohonen网络恢复完整的人脸的效果较好。Cottrell等人使用级联BP神经网络进行人脸识别,对部分受损的、光照有所变化的人脸图像识别能力也较好。第44页/共61页 基于代数特征的方法 这类算法是采用代数特征向量,即人脸图像在由“特征脸”张成的降维子空间上的投影。基于代数特征识别的主要原理是利用统计方法提取特征,从而形成子空间进行识别。第45页/共61页(3)当前主流算法1 1)特征脸(eigenfaceeigenface)算法特征脸方法的优点:图像的原始灰度数据直接用来学习和识别,不需要任何低级或中级处理;不需要人脸的几何和反射知识;通过低维可以有效的对高维数据进行压缩;与其它匹配方法相比,识别简单有效。第46页/共61页特征脸方法存在的不足:图像中所有的像素被赋予了同等的地位,可是角度、光照、尺寸及表情等干扰会导致识别率下降,因此,须先进行尺度归一化处理;在姿态和光照变化时识别率明显下降;要求背景单一,;学习时间长,只能离线计算。第47页/共61页2 2)弹性图匹配方法 弹性图匹配方法(Elastic Graph MatchingElastic Graph Matching)是一种基于动态链接结构(Dynamic Link Architecture(Dynamic Link Architecture,DLA)DLA)的方法。它将人脸用格状的稀疏图(即拓扑图)表示,图中的节点用图像位置的GaborGabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。第48页/共61页其优点是:人脸稀疏图(即拓朴图)的顶点采用了小波变换特征,对光照、位移、旋转及尺度变化都不敏感。弹性图匹配法能保留二维图像的空间相关信息。而特征脸方法在将图像排成一维向量后,丢失了很多空间相关信息。第49页/共61页(4).人脸识别的统计结果 根据图5.15.1和图5.25.2所示的训练和识别的流程图在Microsoft Microsoft Visual C+6.0Visual C+6.0环境下编程测试KPCAKPCA人脸识别效果,采用美国的YaleYale人脸库,第50页/共61页 图像库中共1515人,每人1111张照片,人脸数目共计为165165。每人1010幅图像作训练,一幅做测试,识别率定义如下:其中,n n为正确识别出的人脸个数,N N为训练集中的人数。利用PCAPCA进行人脸识别的实验结果为:87.5 第51页/共61页 42 模式识别在医学上的应用 第52页/共61页431 印刷电路板自动外观检查装置 43 模式识别在自动检测中的应用 第53页/共61页第54页/共61页第55页/共61页第56页/共61页图10-39 产品质量检测实例第57页/共61页图10-40 产品质量检测实例第58页/共61页图10-41 汽车牌照识别第59页/共61页图10-42 电路板零件缺失检测第60页/共61页感谢您的观看!第61页/共61页

    注意事项

    本文(数字图象处理模式识别的理论与方法.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开