基于SVM和BP神经网络的手写数字识别(共64页).docx
《基于SVM和BP神经网络的手写数字识别(共64页).docx》由会员分享,可在线阅读,更多相关《基于SVM和BP神经网络的手写数字识别(共64页).docx(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上摘 要科技发展日新月异,智能识别推陈出新。如今是信息化时期,数字识别在很多智能领域上运用广泛,拥有普遍的使用远景,因此探索这项技术有其重要的实际意义。由于手写数字在写法上千差万别,且数字间字形差别相对较小,使得识别系统的开发具有很大的挑战性。当前手写数字识别采用的技术有Bayes判别法、决策树法、神经网络和支持向量机(Support Vector Machines,SVM)等。诞生于20世纪90年代的SVM技术是机器学习研究的热点,因其良好的泛化性能成为了数字识别领域的热门方法。本开发系统借助MATLAB平台实现完成SVM的手写数字识别功能,同时与BP神经网络的识别作
2、对比,并利用了MNIST数据库作扩展与分析。对识别的结果进行探究,得出使识别精准度出现误差的主要因素有手写体数字的规范程度、笔画字迹粗细和清晰,以及训练样本的数量等。关键词 手写数字识别;神经网络;SVMAbstractTechnological development changes rapidly, and intelligent recognition innovates constantly. In the information era, numeral recognition has broad application prospects in many pattern areas
3、 with a common vision, so it is of great practical significance to explore this technology. As a result of handwritten numeral vary widely in the wording and digital shape difference is relatively small, making recognition system development is a great challenge.At present, Bayes discriminant analys
4、is, decision tree method, neural network and support vector machine (referred to as SVM) are the main methods of recognition of handwriting. SVM technology, which was born in 1990s, is a hot topic in machine learning research. Because of its good generalization performance, it has become a popular m
5、ethod in the field of numeral recognition.The system uses the MATLAB to realize the handwritten numeral recognition based on SVM, at the same time with the recognition of BP neural network for comparison, and using the MNIST database to extend and analysis. To research the results of recognition, it
6、 comes to conclusion that the main factors affecting the accuracy of the recognition include the specification of the handwritten numeral, the thickness and the clarity of the strokes, and the number of the training samples.Keywords handwritten numeral recognition; neural network; SVM专心-专注-专业目 录第1章
7、绪论1.1 课题研究的背景和意义数字识别主要有印刷体与手写体识别,由于存在人体差异和个人习惯的不同,即使是同一个数字,每个人书写的情况都会千差万别。手写数字识别技术在不同的数字数据库实验中已得到了较为满意的识别辨认效果,然而将其使用到手写文档中,其识别的精准度仍难以达到实际要求。手写数字是借助电子仪器去自动辨别人手写出来的数字。尽管由于笔画、字型等因素还未能在计算机上做到全部都正确识别,但其在各方面应用早已十分广泛,多存在于办公和教学自动化、银行票据自动识别、邮政自动分拣等技术领域当中。在日常生活和工作中,每天都会接触大量的数字信息,尤其是处理各种各样的数字文档工作,如账单、邮编、电话号码、物
8、流编号等,一些极其关键的数字信息的误判往往极易造成巨大损失,在要求较为苛刻的国防、金融等领域更是不能出现丝毫差错。如何利用现代化技术,使人们从这些繁重且细致繁琐的工作中解放出来,提高识别正确率、记录准确率及其效率已成为一个亟待解决的问题。智能识别在当代科技应用中日趋普及,科学技术以及物质需求的持续抬高,数字识别的准确率和速度都有了更大的提升。数字不仅构建了数学基础,也承载着信息内容;不仅在数学上发挥着作用,也是人们沟通、交流和学习的主要工具。由数字组合成的各种代码或符号应用广阔,是人类生活和科技进步不可或缺的组成部分,基于这个原因,手写数字的智能识别就具有重大的实际意义1。1.2 国内外研究现
9、状及分析20世纪初期,德国科学家运用光学相互对比技术第一次实现了机器识别文字符号;50年代起,西方国家为了更好进行信息的处理、保存和保密,开始着手对西文光学字符识别(OCR)的研究;20世纪中叶,全球很多国家开始了探索数字识别。美国科技巨头IBM公司最早开发了相关的产品,这款产品只能认识制定好的字符所印刷出来的文字或符号。1970年左右,我国初步对符号的识别作综合探索。清华大学在1989年推出了OCR软件,着手对汉字和数字的识别进行研究,并在手写汉字和数字识别等领域上取得了巨大的成功。1963年, Vapnik首次提出了支持向量(SV)方法;历经20年磨练,美国研究者随后在有限样本的机器学习问
10、题上挖掘了(SVM)。跟随科技发展和国外研究的步伐,我国的SVM理论研究在性能优化和训练识别上也取得了一定进展。历经几十年,数字识别技术在不断的改进下已经得到了很大进步,判断准确度也越来越高。利用作识别已经在各类数据库里获得了较好的成果。分析目前在这方面取得的进展,比对海内外研究的成果和关注的方向,手写数字识别需深入研究解决存在的两大难点,即速度与准确性都需达到更高的水平2。假以时日若对该算法进行相应改进及优化,该技术就能获得更长远的进步。1.3 课题研究的主要内容本次设计研究的主要内容包括:1、手写数字识别方法综述。介绍常用的几种方法,并进行简要比较。2、支持向量机、神经网络的简介。介绍对比
11、两种方法的发展、技术原理和特点,分析支持向量机如何进行学习和实现,BP神经网络的构建和参数确定,为应用在手写数字识别进行可行性讨论。3、手写数字识别的设计与实现。借助MATLAB平台编程作仿真实验,首先对手写数字图像进行标准化预处理,建立算法进行参数寻优,最后对测试集进行识别和结果分析。4、Mnist数据库的扩展识别。筛选部分图像,借助SVM法对其作识别和比较分析。1.4 本章小结本章扼要概述该课题的研究背景、近况及主要内容,并从多个角度叙述对其研究的重要意义。第2章 手写数字识别综述手写数字识别过程大致分成、等几个过程,预处理为能获得正确的有关数字的特性作了基础,而得到有关的数字特征则保证了
12、最后分类的有效性3。 2.1 预处理技术预处理技术,包括了尺寸和位置归一化等多个方面,通常借助它来消除数字图像中包含的噪音、压缩并剔除多余的且与判别无关的数据信息,为进一步提取特征做出不可或缺的铺垫,提升整个系统性能、判别准确率和速率4。预处理包括了以下几个方面,如图2-1。图2-1 预处理过程2.1.1 图像二值化二值化是把灰度图像转变成黑白两个等级,根据其像素的种类再进一步选择具体操作措施。通过二值化将图像中的数字目标从图像中提取出来。将原有图像中那些能够体现其轮廓特征作射影处理后,再保存下来,把那些体现不了的部分全部都作剔除处理。经过这一步操作处理之后,就能获得该图像中有关构成数字的轮廓
13、和特征的有用信息。2.1.2 图像去噪锐化反色操作后噪声来源一般有:数字图像本身就存在的污损、孤立点;图片本身存在的底色在作二值化处理后造成了新噪声出现。图片本身导致的噪声干扰能借助自适应二值化算法去优化;图像中存在的笔划的凹凸、孤立墨点的情况,可以通过选择适当的结构元素去消除,或利用小波变换的时频局部化及小波基剔除图像局部高频化的噪声。数字图像的模糊边沿可以采用锐化来实现快速聚焦,改善清晰度。2.1.3 图像分割细化图像分割是指依照图像中的各部分像素划分成互不相同的子区域,更方便更有效地对数字后续作进一步单独处理和对数字包含信息的提取,常见的分割方法有阈值分割、区域分割和边缘检测分割等。细化
14、是为了去除输入噪音,保留初始图像特有的几何特性,在保留最初笔划的连续性和特征的前提下,从字符边界逐层移除轮廓黑点像素。手写数字由于存在着书写位置高低、角度位置偏差等人为不可抗拒因素,都会明显增大训练的包袱还会影响识别辨认效果,分割细化后仍需对数字再作出位置矫正逼近处理。2.1.4 归一化 由于原有图片中的数字大小都各有不同,故而需要作归一化操作,以便让其得到统一。归一化是对每个不同大小尺寸的数字子图像进行缩放射影到统一大小的字符样本中,使其能够具有大概相同的尺寸,便于后续作特征提取和分类识别。2.2 特征提取技术该部分是整个操作的重中之重,其特性信息量的获得直接关系到最终的效果。提取的方法有:
15、结构特征和统计特征。结构特征识别方法是从字符的结构或者造型中获取到最能够代表其形状的某类基本信息,类似如横竖撇捺、左右弯钩、交叉等。这种方法能够很好地识别字符笔画的细小改变,但文法相对复杂、对背景复杂的图像识别率较低。统计特征识别方法是对字符信息进行全体统计学分析比较,采用像素密度特征、数形变换、模板适配等技术,识别相对稳定,抗噪声强,但不能检测到字符的笔画变化情况、字符复杂的几何和拓扑结构,识别出错的概率依然不小。综合以上两种方法的优劣所在,现阶段手写数字特征提取技术已逐渐趋于对结构与统计特征方法的相结合。本设计采取了统计的方法,即把数字图片作反色处理后,再对像素进行统计分析获取其特性。特征
16、提取技术如图2-1所示。图2-2 特征提取技术 2.3 手写数字识别方法2.3.1 决策树法一种从上到下的树形结构。其基本思想如图2-3所示。 图2-3 决策树基本思想 用一个逻辑判断说明其内部节点(非叶节点),如:形式为。其中: 图2-4 决策树结构图 决策树优点有:准确性高、速度快,易于解释和理解;基本上无需对要作判别的数据作处理,即使需要,该准备工作也是很容易处理,而其它方法必须先作剔除冗余的操作。 然而,其缺点也是很明显,主要表现在:当存在信息类别多且数目不统一情况时,出错的速度在某种程度上会出现很大幅度的增加。内部节点的判别具有明确性,这种明确性可能会带来误导。2.3.2贝叶斯判别法
17、贝叶斯(Bayes)判别方法是按照Bayes统计思想的应用,根据最小风险代价判决或最大似然比进行判决。Bayes决策法主要有以下两类。(1)基于最小错误率的Bayes决策依照样本库中样本的密度函数,借助Bayes算出待识变量在各状态的概率。在哪个状态下最大就把它划为哪一类。、(能看作是其指数、所有取数),借助经验或估计可得:的先验概率分别为、。 显然有: (=1,2,)且 (2-1)各总体对应的维、,在得到一个样本的情形后,借助Bayes公式计算该样本来自第个总体的后验概率: (2-2)当存在: 时,则:判来自第个总体。(2)基于最小风险的Bayes决策依照样本库中样本的及损失函数,借助Bay
18、es得到概率,再根据后验概率和损失函数计算出各种辨认结果的损失,其中错判损失最小的即为最后的识别结果。把错判成第个总体的平均损失定义为: (2-3):损失函数,表示将样品错判的损失。当时,有:=0;当时,有:0 。当存在:,则:判来自第个总体。实际上,错判造成的损失认为是等同的,即: (2-4)识别流程图如下图2-5。图2-5 Bayes判别法的流程图2.3.3 神经网络人工神经网络(ANN)简称(NN),该系统是按照彼此之间某些相连的关系互相衔接组成。作为效果明显的智能方法,被以受重用者的身份普遍地应用于识别等领地。神经网络因训练时间和分类时间太长,一般不用于大字符集的直接分类。网络的辨认能
19、力并不会受到层数目太大的作用,但在一定程度上增加层数,能够使得,能更加迅速地把连接值约束并收拢到满足要求为止5。常见网络结构有以下三类。1、前馈神经网络神经元单向传输,且无回馈存在。常见的BP 神经网络即属于该类型。结构如下图2-6所示。图2-6 前馈神经网络结构2、反馈神经网络非单向传输,有回馈传到输入,运行一定时长后才能趋于稳定。典型的反馈型神经网络有: Hopfield 网络、Elman 网络、波耳兹曼机。该网络结构图如下图2-7所示。图2-7 反馈神经网络结构3、自组织神经网络一种“无师自通”的网络模型,自动寻求样本中的本质属性和内在的规律,对网络的参数和结构进行改动。Kohonen映
20、射网络就是属于该类神经网络。自组织神经网络结构如图2-8所示。图2-8自组织神经网络结构2.3.4 支持向量机该算法是由Vapnik等人在基于原则,对线性提出的最佳设计准则。最开始的应用即是在手写字符的识别上。美国邮政服务局利用邮政标准的手写数字库做了测试对比,发现SVM方法比其他复杂的神经网络算法效果好,从而推广了SVM在模式识别和函数拟合等领域的运用。具体将在第3章作详细介绍。2.4 本章小结本章简要介绍了预处理、特征提取技术以及决策树、Bayes判别法、神经网络和支持向量机等分类器的原理,为选择SVM 和BP神经网络作为设计的平台建立了基础。第3章 支持向量机3.1 SVM概述1963年
21、, 首次提出了支持向量(SV)方法;几年后重建,并初步实现了推广SVM走向非线性分化;1990年前后,美国贝尔实验室研究者,在有限习问题上建立了支持向量机6。3.1.1 VC维 描述集合的大小或丰富度的定量指标。假设中函数对个区分类别,若想将之分两类,可以有,说明能将数量为的。VC维置信区间就是可以被。3.1.2 结构风险最小原理对于分类问题,训练样本集由个样本(,)(,;= 1,2,)构成,借助,得到分类方程:,令其损失函数为: (3-1)其中:结构风险最小在于: (3-4)图3-1 结构风险最小化原则如图3-1,:。 3.2 SVM的原理作为一种分类器,当给定一些标记好的训练样本,支持向量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SVM BP 神经网络 手写 数字 识别 64
限制150内