基于C---MATLAB的图像识别技术的仿真研究--本科毕业设计.doc
《基于C---MATLAB的图像识别技术的仿真研究--本科毕业设计.doc》由会员分享,可在线阅读,更多相关《基于C---MATLAB的图像识别技术的仿真研究--本科毕业设计.doc(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 编 号: 审定成绩: 重庆邮电大学毕业设计(论文)设计(论文)题目:基于C+/MATLAB的图像识别技术的仿真研究学 院 名 称 :通信与信息学院学 生 姓 名 :专 业 :电子信息工程班 级 :学 号 :指 导 教 师 :答辩组 负责人 :填表时间:2016年 5 月重庆邮电大学教务处制重庆邮电大学本科毕业设计(论文)摘 要图像识别是一种针对图像的模式识别。图像识别的目的是使得计算机拥有像人类一样能从图片中认识事物分析事物的能力。本文对图像识别的技术进行了调研,并列举出了图像识别核心技术。图像识别系统分为三个部分:预处理、特征提取和模式识别。MATLAB是算法设计和仿真实验的有力工具,而C
2、/C+语言是最常见的编程语言。本文简单地介绍了MATLAB与C/C+混合编程方法,并举例说明了如何进行混编。最后还开展了两组有代表性的图形识别仿真实验人脸识别和手写数字识别。在两组实验中,应用了不同的特征提取技术和模式识别技术,并对不同方法进行了对比,对不同实现方式进行了优劣进行了讨论。仿真中主要用到的技术有概率神经网络、SVD降维和深度神经网络等。【关键词】图像识别 人脸识别 手写数字识别 pnn svd dnnABSTRACTImage recognition is a pattern recognition for an image. The purpose is to make ima
3、ge recognition computer, like humans have the ability to understand things from the picture analysis of things. In this paper, the image recognition technology research, and outlines the core image recognition technology. Image recognition system is divided into three parts: preprocessing, feature e
4、xtraction and pattern recognition. MATLAB is a powerful tool for algorithm design and simulation, and C / C + programming language is the most common language. This article briefly introduces the MATLAB and C / C + mixed programming, and illustrates how mixed. The last two groups have also carried o
5、ut a representative simulation of pattern recognition - recognition and handwriting digit recognition. In two experiments, the application of different feature extraction and pattern recognition technology, and the different methods were compared for different ways to achieve the advantages and disa
6、dvantages are discussed. Simulation technology is mainly used in probabilistic neural network, SVD depth dimension reduction and neural networks.【Key words】Image Recognition Face Recognition Handwritten Digital Recognition pnn dnn目 录前 言1第一章 图像识别技术概述2第一节 图像处理和分析技术介绍2一、图像处理核心工具列举2二、图像分析核心技术简介4第二节 模式识别
7、技术介绍5一、模式与特征概念简介5二、分类器设计简介6第三节 本章小结8第二章 MATLAB与C/C+混合编程简介9第一节 MATLAB与C/C+混合编程特点9一、MATLAB M 语言特点9二、C/C+语言特点9三、MATLAB与C/C+混合编程优点10第二节 MATLAB与C/C+混合编程优点的主要方式10一、通过MEX文件实现混合编程10二、通过dll实现混合编程10三、MATLAB Coder实现混合编程11四、调用C/C+程序生成可执行文件11五、一些次要混编方法Active X、COM 、NET11第三节 MATLAB与C/C+混编开发环境介绍12第四节 mx-API介绍及混合编程
8、举例12一、接口数据类型及接口函数介绍12二.举例介绍13第五节 本章小结14第三章 图像识别仿真与结果15第一节 手写数字识别仿真研究15一、意义和难点15二、实验内容简介15三、实验步骤17四、实验结果18五、讨论与分析19第二节 人脸识别仿真研究19一、研究意义与难点19二、实验内容介绍19三、实验步骤20四、实验结果20五、讨论与分析21第三节 本章小结21结 论22致 谢23参考文献24附 录25一、英文原文:25- 53 -前 言人类通过眼、耳、喉、鼻和舌等各种感官接受外界的刺激和信息,其中超过83%的信息来自于眼睛。俗话说“百闻不如一见”,就是在说语言描述不如视觉的一目了然。随着
9、数字图像处理技术的发展和实际应用的需求,许多问题不再要求计算机只输出处理后的图片,而是将经处理的图片再进行分割和描述,并提取主要特征,进而加以判决分类,这种技术就是基于图像的模式识别即图像识别。图像识别技术是利用计算机对图片数据的处理,以模仿人类视觉系统,达到人类所具有的对图片内容进行认识的能力,以代替人去完成某些信息分别和辨别的能力。图像识别属于当代计算机科学研究的重要领域,已经发展成为一个独立的学科。这学科发展相当迅猛,应用范围越来越广泛,几乎涵盖了所有生产部门。目前,光学字符识别OCR,以及生物特征识别(指纹、人脸和虹膜等)已经在日常生活中广泛应用。光学字符识别(Optical Char
10、acter Recognition,OCR)的目标是在复杂环境下识别机器读取的字符信息。OCR处理的信息可分为三大类:文字信息识别、数据识别信息和条形码识别信息。生物特征识别则是采用某种技术和手段对人的身份进行标识,从而依据标识对人进行身份识别的技术。最常见的生物特征识别是人脸识别、指纹识别和虹膜识别,这些身份识别方式都是通过人的生物特征实现的,这些特征有不易丢失、不易伪造、易携带、不易破解等优点。本文即使要对这两类图像识别进行深入调研,并寻找解决方法。本文组织形式如下:第一章:定义图像识别,并介绍图像识别系统需要的技术种类。第二章:具体的介绍了几种图像识别技术,并介绍这些技术在图像识别中的作
11、用。第三章:介绍了MATLAB与C/C+混合编程方法,并距离说明了如何实现混编。第四章:介绍了实验软硬件平台,进行并讨论了两组实验。结 论 :最后总结了仿真实验过程中获得的经验和遇见的难题。第一章 图像识别技术概述图像识别是一种针对图像的模式识别。人类具有对各种事物和现象进行分析、描述和判断的能力,而图像识别就是通过输入图像使计算机拥有类似自动分析事物的能力。图像识别贯穿了图像处理、图像分析和模式识别三个不同层次。本章将从这三个方面来简单介绍这些技术。总的来讲,图像处理是从原始图像到处理后图像的处理过程;图像分析是从图片到目标表达的过程,这些目标最终是以特征的形式提取表现出来的;模式识别是从目
12、标表达到分类和辨别的过程。第一节 图像处理和分析技术介绍图像识别的过程中少不了运用图像处理和分析的很多知识。图像处理的目的就是将输入图像处理成输出图像,从而达到图像增强、图像恢复等目的。图像识别需要对样本图片进行一定的图像处理,为之后的图像分割、特征提取做准备。一、图像处理核心工具列举1.灰度变化(1)灰度映射(图像求反、对比度增强和动态范围压扩)(2)直方图变化(直方图均衡化和直方图规定化)图1.1: 从左到右分别是原图、动态范围扩展结果和直方图均衡化结果2.模板操作模版操作把局部信息为依据,二维卷积(模版卷积)为工具,实现图像处理的多种目标。它可以实现线性滤波与锐化、非线性滤波与锐化、局部
13、直方图增强等。其中基于梯度算子的锐化还可用于边缘检测。图1.2左图为原始图像cameraman;右图为利用正交梯度算子进行边缘检测。3.变换域操作变化域操作就是将图像从最开始的空间域变换到另一个域比后,进行一定操作后实现图像处理的目的。比如最常见的例子就是频域滤波。图1.3频域滤波过程示意图图1.4从左至右依次是原始图像、原始图像频谱图、滤波函数空域图和滤波后图片4.图像消噪与恢复与模板操作和频域操作相比,消噪与恢复更像是一种目的。模板操作和频域操都是消噪与恢复的重要工具。5.放射变换放射变化是一种分别对每个像素重新计算坐标的几何变化,主要包含放缩、旋转、剪切和平移。二、图像分析核心技术简介1
14、.图像分割在图像分析和理解中,很多时候我们只关心图像中的一部分目标。目标一般对应图像特定的具有独特特性的区域。区别不同目标以及区别目标和背景是进一步分析图像和特征提取的前提。图像分割就是指把图像分成各具特色的区域并提取出感兴趣的目标区域的技术和过程。边缘检测是所有基于边界的图像分割方法的第一步。最基础的边缘检测算法有正交梯度算子、二阶导数算子、阀值化等。常用典型的分割技术有SUSAN检测算子法、分水岭分割法、聚类法等。图2.1就是利用正交梯度算子进行边缘检测的2.图像表达图像表达就是要对图像中的目标采取合适的数据结构来进行表达。根据不同的目标图像选择不同的方式表达才能构建出合理的特征空间,最终
15、才能使模式识别发挥作用。常见的图像表达主要有基于轮廓的方式和基于区域的方式。图1.5 图像表达距离:横竖线交点法上图就是一个手写数字目标表达的例子,图中每个数字与三个横线相交,又与两个竖线相交。形成的焦点数量就是每个目标特征,例如对于0来说特征可以表达为交点数量(2,2,2,2,2)。这是一种基于目标像素空间分布的表达方式。3.数学形态学工具数学形态学是以形态为基础对图像进行分析的工具,是图像处理和分析的重要工具。它的基本思想是用具有一定形态的结构元素,去量度和提取图像中的对应形状,来实现图像分析和识别的目的。按照处理对象不同,形态学又分成二值形态学和灰度形态学。我们这里主要介绍二值形态学的一
16、些基本工具和典型应用。二值形态学的基本工具有膨胀和腐蚀,这两个基本工具的反复组合和迭代就构筑了形态学的高楼大厦。由膨胀和腐蚀组合起来的工具有开启、闭合和击中-击不中变化等。数学形态学的基本应用有区域凸包、细化、粗化和剪切等,复杂的典型应用有消噪、角点检测和骨架计算等。图1.6 从左至右分别是原图像,腐蚀后图像、开启后图像、细化后图像和骨架化图像第二节 模式识别技术介绍模式识别是图像识别的主要工具和核心难点。人类具有对各种事物和现象进行分析、描述和判断的能力,而模式识别就是使计算机拥有类似自动识别事物的能力。人类对模式的识别在生活中很常见,比如人类能对同类脸上的表情做出判断,像是炒股的人们凭借着
17、市场各种指数和累计的经验能预测未来走势,又或是下棋的两个人对棋局形势的优劣能做出判断。模式识别对人来说是如此的直观、如此的无所不在,对人来说这就是与生俱来的一种能力,然而对于计算机来说却不是那么容易实现。如何让计算机能像人一样具有识别、分类的能力就是模式识别所要研究的。一、模式与特征概念简介模式(Pattern)广义的来讲就是一种完美的概念,通常是从某类事物中归纳总结出来的一种认识。举个例子我们要在一群人中找到威猛的壮汉们,这就要求我们之前对壮汉有一定的认识,也就是我们具有壮汉的概念。有了这样的概念我们就有了判断一个人是不是壮汉的工具和切入点。但这对于计算机可并不容易,计算机可不能像我们一样形
18、成一个壮汉的概念。这就涉及到了模式的描述问题了。计算机不懂壮汉甚至不懂人是什么,于是我们就要对观察目标进行描述。我们要描述一个人而且要能让计算机理解就需要使用矩阵的知识。表1.1 特征空间举例说明样品编号性别年龄血型握力800米成绩实心球是否单身高数成绩1男18O39kg32010是662女21AB25kg35011是773女23A23kg3309是884男34B31kg4108否995女31O33kg4058否33上表中样本的性别、年龄、血型等8个属性就是我们用来描述一个人的特征。这样我们就能用上表中每一行信息来描述每一个样本。这就是样本描述方法,通过样本的不同属性,也就特征来描述一个样本。
19、我们的目的是要区别一个人是否是壮汉,这就要求我们设计出来的计算机系统能根据对一个样本的描述来判断一个样本是属于壮汉还是非壮汉。如果将上表中的用来描述人的一行行信息看作是一个向量。这个向量的维数则由我们选取的特征数确定,这个向量所属空间就叫特征空间。同时,每个人即每个样本就是空间中的某个点。要描述一个的特征的数量非常多,远不止上表中列出的8个特征,不可能全部都利用起来,更何况有些特征与我们的目标找到壮汉完全没有任何关系,例如上表中的高数成绩。这就要求我们通过对目标的认识,选择出一套合理的特征。这个找出合适特征的过程叫做特征选择与优化,这是实现模式识别的关键一步。通常情况下我们需要降低特征数量,也
20、就是降低特征空间维数。二、分类器设计简介在选取好合适的特征后,我们要解决的问题就好似将特征空间中的每个点分成两类壮汉和非壮汉。我们设计分类算法的过程又叫做分类器设计。在分类器设计设计过程中我们需要一些已经分好类的样品集合来使计算机认识到不同类别的区别,这个样品集合就叫训练集。分类器设计的基本做法就是在训练集的基础上确定分类的判断方法,并通过对未知的测试样本分类情况不断修正或优化分类判断方法。图1.7分类器设计过程示意图下面介绍下模式识别的常见方法。1.模板匹配模板匹配的基本原理很简单,就是使用已知的样本作为模板,与测试样本进行比较,从而识别目标。将待分类的样品与每类的一个或者多个标准模板进行比
21、较,看跟哪个类的模板匹配程度好,这样就能为测试样本分类了。匹配识别需要计算测试样品与各个模板的相似程度,并寻找最相似模板。假如是人脸识别,对于每一个测试样本,都需要计算这个测试样本到每个模板的距离。在模板数量很大时,这个缺点越明显。因此,虽说近邻法判决在原理上很简单,但是计算量很大。模板匹配主要应用于对图像中对物像位置的检测,运动物体跟踪等。模版匹配的另一个缺点是由于匹配的点很多,虽然理论上可以达到最优解,但在实际中却很难做到。2.判别函数设计判别函数的形式有两种:基于概率统计的分类法和几何分类法。(1)基于概率统计的分类法这种方法需要使用到贝叶斯决,策决策者虽不能控制客观因素的变化,但却掌握
22、其变化的可能状况及各状况的分布概率,并利用期望值即未来可能出现的平均状况作为决策准则。要使用贝叶斯决策就需要得到关于样本的总体分布,包括各类的先验概率以及各类条件概率函数,计算的出样品的后验概率,并以此作为产生判别函数的必要数据,设计出相应的判别函数与决策面。这种分类器对特征空间的各类样品分布已经很清楚,一旦测试样本特征向量已知,就可以确定样品X对各类的后验概率,也就可以按照一定准则进行分类了。(2)基于几何的分类法在完成特征选取后,每个模式的特征全部量化为每一维的坐标值,这就使得每个特征变为了特征空间上的一个点。几何分类法就是要在不同的模式点之间找到一些分界面,以分离不同类的点集。几何分类的
23、分类函数即是分开不同类的点集合。3.神经网络人工神经网络是种对生物神经系统的模拟的算法。它将若干个神经元(处理单元)通过一定互连模型连接成一个网络,这个网络通过一定的机制可以模仿神经系统的动作过程,已达到分类的目的。这种分类法最大的特点是对带识别目标不需要进行深入的了解和分析,具有一定智能化处理的特点,特别适用于处理需要考虑多种因素和条件的、不精确和模糊信息处理问题。神经网络可以看作是输入空间到输出空间的一个非线性映射,它通过调整权重和阀值来“学习”或者发现输入输出之间的关系。优点是可以处理一些环境信息非常复杂,背景知识还不完备,推理规则还不明确的问题,允许样品有较大的缺损和畸变。缺点是目前能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 MATLAB 图像 识别 技术 仿真 研究 本科 毕业设计
限制150内