脱机手写体字符识别优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《脱机手写体字符识别优秀PPT.ppt》由会员分享,可在线阅读,更多相关《脱机手写体字符识别优秀PPT.ppt(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概述 由于有些场合,不能接受书写板等专用的输入设备输入文字,或文字信息已经是以手写体的形式存在,假如要利用计算机进行文字识别,就只能进行脱机手写体字符识别。OCR概念 OCR技术是光学字符识别(Optical Character Recognition)的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以运用的计算机输入技术。图像的输入 原始文稿通过光电扫描仪或数码相机等输入设备转换成原始的二维图像信号,可以是彩色图像、灰度图像(grayscale image)或二值图像(binary image)。这个模块仅仅须
2、要的是在获得图像过程中,尽可能的保证原始文稿的二维图像有比较好的质量,从而有利于后面识别模块的识别。预处理 预处理是脱机手写识别系统中须要解决问题最多的一个模块。预处理通常包括以下几个过程:1、二值化2、消退干扰3、细化原图像二值化细化版面分析 版面分析与理解是文字识别的前处理技术之一。它是利用图像处理、人工智能等技术完成文档图像文件中的文字域的分拣工作。其难度取决于版面的困难程度,是文字识别系统提高好用化水平的主要技术指标之一。1、图像定位2、倾斜校正原图像校正后字符的分割1、行切割 对于输入的二值化文字图像,首先要逐行地把各文字行图像切割出来,行切割的方法是:对二值化图像从上到下逐行扫描并
3、同时计算每个扫描行的像素,以获得图像的水平投影,依据水平投影值确定文字行的位置,利用文字行间空白间隔造成的水平投影空白间隙,即可将各行文字分割出来2、字切割 子切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。汉字的构造确定了字切割是更为困难的文字归一化1.位置归一化 为了消退汉字点阵位置上的偏差,须要把整个汉字点阵图形移动到规定的位置上,这个过程被称作为位置归一化两种方法:1、基于质心的位置归一化 2、基于文字外边框的位置归一化2.大小归一化 对不同大小的文字做变换,使之成为同一尺寸大小的文字
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 脱机 手写体 字符 识别 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内