第一章模式识别-绪论.pptx
《第一章模式识别-绪论.pptx》由会员分享,可在线阅读,更多相关《第一章模式识别-绪论.pptx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、参考书:Ruchard O.Duda等模式分类(Pattern Classification)机械工业出版社,2004年课程要求课程要求17:391第1页/共46页1.模式与模式识别的概念2.模式识别的主要方法3.监督模式识别与非监督模式识别4.模式识别系统的典型构成5.模式识别系统应用举例第一章第一章 绪论绪论2第2页/共46页一、模式识别 1.1 模式与模式识别的概念模式与模式识别的概念直观,无所不在儿童认数字:数字符号的识别读书看报:文字识别汽车、火车,狗叫、人语:声音识别人群中寻找一个人:根据面像、形体或其他特征进行识别人类的模式识别能力是极其平常的,时刻在完成某种模式识别的任务。随着
2、社会活动以及生产科研的发展,需要识别的对象种类越来越多,内容越来越复杂和深入,要求越来越高。为了减轻工作强度,希望计算机代替人来完成识别工作;有些场合环境恶劣、存在危险或人类不能接近,需要借助机器、运用分析算法进行识别。17:393第一章第一章第一章第一章 绪论绪论绪论绪论第3页/共46页17:3941.1.模式识别模式识别(Pattern Recognition):(Pattern Recognition):使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程。模式识别作为一门学科,是研究用机器完成自动识别事物的工作;研究内容:使计算机做以前只能由人类才能做的事,具备人所具
3、有的、对各种事物或现象进行分析、描述与判断的部分能力。模式识别学科形成于5060年代,与众多学科有联系,尤其与人工智能和图像处理关系密切。1.1 模式与模式识别的概念模式与模式识别的概念2.模式与模式类:l模式:需要识别且可测量的对象的描述。这些对象与实际的应用有关,如:字符识别的模式每个字符图像 人脸识别的模式每幅人脸图像l模式类:当用一定的度量来衡量两个模式,而找不出它们之间的差别时,它们在这种度量条件下属于同一等价类,就说它们是同一模式类。例如:数字识别有10个类别,每个数字就是一个类。不同模式类之间是可以区分的,应有明确界限。第4页/共46页17:3951.1 模式与模式识别的概念模式
4、与模式识别的概念3.识别最基本的方法:计算 计算机根据已研制的识别算法,把输入的未知模式划入正确类别中,从而实现自动分类。识别算法中的关键环节就是要对待识别事物与标准“模板”的相似程度进行计算。特征向量表示法:特征向量表示法:将对事物进行度量的指标排成向量的形式。将对事物进行度量的指标排成向量的形式。一维表示 X1=1.5 X2=3 二维表示 X1=(x1,x2)T=(1,2)T X2=(x1,x2)T=(2,1)T 三维表示 X1=(x1,x2,x3)T=(1,1,0)T X2=(x1,x2,x3)T=(1,0,1)T 苹果(重量,直径,颜色)4.模式描述方法第5页/共46页图像的向量表示方
5、法:在计算机里分析的称为数字图像,它由排列整齐的二维网格组成,分为若干行与若干列,相当于一个二维数组,或称矩阵。我们称每个元素为像素。左图为57的数字图像;一个数字就用57共35个网格是黑是白来表示;如令是黑为“1”,是白为“0”,那么一个数字就可用35维的二进制向量表示。这就是典型的特征向量表示法 1.1 模式与模式识别的概念模式与模式识别的概念 结构表示法:由事物的组成成分与相互关系表示在右侧的图中八个基元分别表示0,1,2,3,4,5,6,7,八个方向和基元线段长度。则右侧样本可以表示为 X1=006666这种方法将在句法模式识别中用到。第6页/共46页二、模式识别简史二、模式识别简史1
6、929年 G.Tauschek发明阅读机,能够阅读0-9的数字。30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。统计模式识别是模式识别的主要理论。50年代 Noam Chemsky 提出形式语言理论傅京荪 提出句法结构模式识别。60年代 提出了模糊集理论,模糊模式识别方法得以发展和应用。80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。90年代小样本学习理论,支持向量机受到了很大的重视。2000年,流形学习(manifold learning):流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形
7、,并求出相应的嵌入映射,以实现维数约简或者数据可视化.2005年,稀疏表示(sparse representation):近年来有关生理学的研究成果表明:人类的视觉系统具有对图像的稀疏表示特性,神经元对于输入图像的激活机制具有高度的稀疏性.1.1 模式与模式识别的概念模式与模式识别的概念第7页/共46页三.关于模式识别的国内、国际学术组织1973年 IEEE发起了第一次关于模式识别的国际会议“ICPR”,成立了国际模式识别协会-“IAPR”,每2年召开一次国际学术会议。1977年 IEEE的计算机学会成立了模式分析与机器智能(PAMI)委员会,每2年召开一次模式识别与图象处理学术会议。国内组织
8、:中国自动化学会:模式识别与机器智能(PRMI)专业委员会,1981年成立,IAPR成员组织;人工智能与模式识别专业委员会;中国人工智能学会国内学术机构:中科院模式识别国家重点实验室,中科院计算所,微软研究院,清华大学等。17:3981.1 模式与模式识别的概念模式与模式识别的概念模式识别学科位置模式识别:计算机科学与电子工程交叉学科中国:“控制科学与工程”一级学科二级学科:控制理论与控制工程、模式识别与智能系统、系统工程等西方:没有自动控制系自动控制:电子工程系、机械工程系模式识别:电子工程系、计算机科学系第8页/共46页四、模式识别的应用 多媒体数据检索(文档、图像、视频、音乐检索)字符识
9、别(印刷体字符的识别;手写体字符的识别(脱机/联机),信函分拣、支票查对、自动排板、稿件输入等)医疗诊断(心电图,脑电图,染色体,癌细胞识别,疾病诊断等)工程(产品缺陷检测、自动导航系统、污染分析)军事(航空摄像分析、雷达和声纳信号检测和分类、自动目标识别等)安全监控(基于生物特征的身份识别、视频监控、交通监控、音视频监听)1.1 模式与模式识别的概念模式与模式识别的概念第9页/共46页现有生物特征识别类型17:39101.1 模式与模式识别的概念模式与模式识别的概念第10页/共46页1.2 模式识别的主要方法模式识别的主要方法l 基于知识的方法(Knowledge-based)AI、专家系统
10、(Expert Systems)句法(结构)模式识别(Syntax PR or Structural PR)(基于结构性描述)l基于数据的方法(Data-based)统计模式识别方法(Statistical PR)(基于特征向量表示方法)人工神经网络(ANN)支持向量机(SVM)统计模式识别方法:在确定了描述样本所采用的特征之后,收集一定数量的已知样本,用这些样本作为训练集来训练一定的模式识别机器,使之在训练后能够对未知样本进行分类。这是基于数据的机器学习中研究最多的一个方向。第11页/共46页统计模式识别用函数表示:Y=F(X)X的定义域取自特征集Y的值域为类别的标号集F是模式识别的判别方法
11、有监督模式识别分类(classification)给出若干已知答案的样本(训练样本 training samples)由机器从这些样本中进行学习(训练 training/learning)学习的目的在于从这些样本中总结规律,使之能够对新的样本进行判断无监督模式识别聚类(clustering)所面对的只有未知答案的样本由机器从这些样本中进行学习(自学习)学习的目的在于从这些样本中发现规律,这种规律应该是某种固有的关系,或者依据这种规律对对象的分类有某种功用1.3 监督模式识别与非监督模式识别监督模式识别与非监督模式识别第12页/共46页第13页/共46页1.模式识别系统:执行模式识别的计算机系统
12、。1.4 模式识别系统的典型构成模式识别系统的典型构成2.模式识别系统组成:信息获取与预处理,特征提取与选择、分类或聚类、后处理等四个部分。第一章第一章第一章第一章 绪论绪论绪论绪论第14页/共46页1.4 模式识别系统的典型构成模式识别系统的典型构成第15页/共46页1.4 模式识别系统的典型构成模式识别系统的典型构成第16页/共46页1.4 模式识别系统的典型构成模式识别系统的典型构成监督模式识别系统组成:数据获取,预处理,特征提取选择、分类器设计以及分类决策五部分。训练过程:对作为训练样本的量测数据进行特征选择与提取,得到它们在特征空间的分布,依据这些分布决定分类器的具体参数,也就是设计
13、分类器的过程。识别过程:分类决策的过程,则是在特征空间中用统计方法把被识别对象归为某一类别。3.3.监督模式识别系统构成及功能监督模式识别系统构成及功能第17页/共46页(1)信息获取:用不同形式的传感器构成,实现信息获取与信息在不同媒体之间的转换,非电信号转换成电信号。用话筒将声音信号转换成电信号,表现出电压(电流)随时间变化的复杂波形。景物信息在摄像机靶面成像并转换成二维的象素矩阵,每个像素(矩阵元素)的电信号与物体表面反射的光强或颜色信息呈现函数关系一般输入对象的信息有三种类型:二维图象,如文字、指纹、地图、照片等 一维波形,如脑电图、心电图、机械震动波形等 物理参量和逻辑值,如疾病诊断
14、中病人体温,各种化验数据;或对症状有无描述,如疼与不疼(0/1)1.4 模式识别系统的典型构成模式识别系统的典型构成第18页/共46页(2)预处理去除所获取信息中的噪声,增强有用的信息,及一切必要的使信息纯化的处理过程。预处理这个环节内容很广泛,与要解决的具体问题有关,例如,从图象中将汽车车牌的号码识别出来,就需要先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。做到这一步以后,才能对每个数字进行识别。以上工作都应该在预处理阶段完成。(3)特征选择和提取p功能:对所获取的信息实现从测量空间到特征空间的转换。将将所所获获取取的的原原始始量量测测数数据据转转换换成成能能反反映映事事物
15、物本本质质,并并将将其其最最有有效效分分类的特征表示类的特征表示。输入:原始的量测数据(经过必要的预处理),例如由声波变换成的电信号,表现为电压电流幅度随时间的变化,二维图像每个像素所具有的灰度值等。输出:将原始量测数据转换成有效方式表示的信息,从而使分类器能根据这些信息决定样本的类别。1.4 模式识别系统的典型构成模式识别系统的典型构成第19页/共46页l特征选择和提取:选择什么样的方法来描述事物,从而可以有效、牢靠地把事物正确地区分开。如令是黑为“1”,是白为“0”,那么一个数字就可用35维的二进制向量表示。这就是典型的特征向量表示法。另一种方法则是将数字用笔划表示,也就是将它分成一横加上
16、一斜杠表示。这种表示方法属于结构表示法范畴。这种方法没有前一种方法的缺点,但提取这种结构信息也不是一件容易方便的事。缺点:这种表示与网格的尺寸有关,与字的笔划粗细有关,更主要的是字在网格中的不同位置与转向有关。这个字在网格中略为偏一点,其特征向量表示就会有很大的不一样。这就说明了这种表示的稳定性差。例:印刷体数字大多通过扫描仪输入,或从图像中获取。这样,一个数字往往用一个NM的数组表示。如果N5,M7,则一个数字就用57共35个网格是黑是白来表示。1.4 模式识别系统的典型构成模式识别系统的典型构成第20页/共46页(4)分类器设计与分类决策分类器设计:将该特征空间划分成由各类占据的子空间,确
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 模式识别 绪论
限制150内