脱机手写体字符识别优秀PPT.ppt

上传人：ylj18****41534

文档编号：71676775

上传时间：2023-02-04

格式：PPT

页数：16

大小：745.50KB

( 4.5 )

《脱机手写体字符识别优秀PPT.ppt》由会员分享，可在线阅读，更多相关《脱机手写体字符识别优秀PPT.ppt（16页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、概述由于有些场合，不能接受书写板等专用的输入设备输入文字，或文字信息已经是以手写体的形式存在，假如要利用计算机进行文字识别，就只能进行脱机手写体字符识别。OCR概念 OCR技术是光学字符识别（Optical Character Recognition）的缩写，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以运用的计算机输入技术。图像的输入原始文稿通过光电扫描仪或数码相机等输入设备转换成原始的二维图像信号，可以是彩色图像、灰度图像（grayscale image）或二值图像（binary image）。这个模块仅仅须

2、要的是在获得图像过程中，尽可能的保证原始文稿的二维图像有比较好的质量，从而有利于后面识别模块的识别。预处理预处理是脱机手写识别系统中须要解决问题最多的一个模块。预处理通常包括以下几个过程：1、二值化2、消退干扰3、细化原图像二值化细化版面分析版面分析与理解是文字识别的前处理技术之一。它是利用图像处理、人工智能等技术完成文档图像文件中的文字域的分拣工作。其难度取决于版面的困难程度，是文字识别系统提高好用化水平的主要技术指标之一。1、图像定位2、倾斜校正原图像校正后字符的分割1、行切割对于输入的二值化文字图像，首先要逐行地把各文字行图像切割出来，行切割的方法是：对二值化图像从上到下逐行扫描并

3、同时计算每个扫描行的像素，以获得图像的水平投影，依据水平投影值确定文字行的位置，利用文字行间空白间隔造成的水平投影空白间隙，即可将各行文字分割出来2、字切割子切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。汉字的构造确定了字切割是更为困难的文字归一化1.位置归一化为了消退汉字点阵位置上的偏差，须要把整个汉字点阵图形移动到规定的位置上，这个过程被称作为位置归一化两种方法：1、基于质心的位置归一化 2、基于文字外边框的位置归一化2.大小归一化对不同大小的文字做变换，使之成为同一尺寸大小的文字

4、，这个过程被称做大小归一化。通过大小归一化，很多特征就能够用于识别不同字号混排的文字。两种方法：1、将文字的外边框按比例线性放大或缩小成为规定尺寸的文字 2、依据水平和垂直两个方向文字黑像素的分布进行大小归一化特征提取稳定特征的抽取是整个识别系统的核心之一，它确定了识别系统的性能。用于脱机手写字符识别的统计特征，依据特征抽取屈居的不同可粗略地分为全局统计特征和局部统计特征两大类。全局统计特征是将整个汉字点阵作为探讨对象，从整体上抽取特征。局部统计特征是将字符点阵图像分割成不同区域或网络，在各个小区域内分别抽取统计特征识别识别也即分类器的设计，良好性能的分类器的设计也是整个识别系统的核心之一

5、，它干脆确定了识别系统的性能。识别的方法很多，多方案集成是近年来文字识别领域的一个主要探讨方向，任何一种特征、任何一种识别方法都有其优点和局限性，借鉴印刷体字符识别的成功阅历，走多特征融合、多方案集成的道路，是脱机手写字符识别系统走向好用化的有效途径。后处理文本识别后处理是指对单字识别的结果，利用词义、语义等上下文先验信息进行识别结果的确认或纠错。通常，在识别实际文本时，须要对单字识别的结果进行基于上下文关系的识别后处理。利用后处理技术，应当能够实现对单字识别结果的确认或纠错，并进一步区分相像字。脱机手写体字符识别系统结构待识别文档扫描仪或数码相机灰度图或二值图预处理预处理图像版面分析文字块

6、图像行分割文字行图像字符分割单一字符图像识别单词后处理修正后的单词结果字符特征特征提取手写识别中存在的问题及困难由于手写变形的存在，使得手写体中相像字符的区分比印刷体要困难的多，因不同人书写风格的差异造成手写字符的变形很大，具体变现在以下几个方面：（1）基本笔画变更。横不平，竖不直，直笔变弯，折笔的拐角变成圆弧等。（2）笔画模糊，不规范，该连的不连，不该连的却相连。（3）笔画与笔画之间、部件与部件之间的位置发生变更。（4）笔画的倾斜角、笔画的长短、部件的大小发生变更。（5）对于脱机手写字符，不同人运用不同的书写笔可能造成笔画的粗细变更。参考文献1张宏林 Visual C+数字图像模式识别技

7、术及工程实践(其次版)人民邮电出版社 2008.52陈念一种基于复合特征的脱机手写体字符识别方法自然科学报 2008.13宋佳模式识别综述及汉字识别的原理科技广场 2007.94 Ahmed M.Elgammal And Mohamed A.Ismail.A Graph-Based Segmentation and Feature Extraction Framework for Arabic Text Recognition5.Manjunath Aradhya V N*,Hemantha Kumar G,Shivakumara P An Efficient and Rotation Invariant 4-step thinning Algorithm for Binary Document Images.Proceeding of the Internation Conference on Information and Automation,December 15-18,2005

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 脱机手写体字符识别优秀 PPT

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：脱机手写体字符识别优秀PPT.ppt
链接地址：https://www.taowenge.com/p-71676775.html