一种基于噪声建模技术的手写体数字去噪方法.pdf
《一种基于噪声建模技术的手写体数字去噪方法.pdf》由会员分享,可在线阅读,更多相关《一种基于噪声建模技术的手写体数字去噪方法.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一种基于噪声建模技术的手写体数字去噪方法一种基于噪声建模技术的手写体数字去噪方法【摘要】:文章研究的是在手写体数字字符图像上的孤立噪声移除问题,提出了一种基于噪声建模技术的新方法。新方法主要针对于难以处理的斑块状噪声的移除,通过模型判断并移除噪声。一种基于投影算法的模型用于移除位于字符两边的噪声,而一种基于神经网络的模型用于移除字符中间的噪声。另外,新方法对字符形态没有改变,保留了数字的原始信息。我们对约 4000 张带噪字符集进行实验,平均去噪错误率小于 0.7%。【关键词】:噪声移除;噪声建模;手写体数字一、引言在光学字符识别(OCR)系统中,当识别带有噪声的字符图像时,往往分类器的表现会
2、大打折扣。尤其是对基于结构技术设计的分类器而言,更是一个必需解决的问题1。所以,出现了很多方法用来移除噪声或降低噪声的干扰。主要分为下面两种技术:1滤波:滤波作用主要是用于平滑图像或背景,使之能够更好地进行后续处理。滤波主要包括卷积操作和形态学操作。一般来说,滤波运算更适合移除面积较小的椒盐状噪声。2噪声建模:主要通过一些测度量来检测并移除噪声。由于引入噪声的情况很多,诸如光学扫描和书写时的人为因素,复杂背景下的阈值运算等等,各种因素使得噪声具有很大的随机性,所以对噪声建模的研究十分有限1,2。基于上述情况,文章提出了一种基于噪声建模技术的新方法。该方法用于移除难以处理的斑块状噪声,同时可以保
3、留破损字符的笔划。第 2 节中,描述了从 MNIST 字库中抽取并建立了两个子集,约 4000 张带噪字符图像,用于噪声移除实验。同时定义了用于建模的特征因子,还提出了用于评估方法效果的测度参数。在第3 节,我们提出了两个噪声模型:一个基于投影模型,用于移除字符两边的噪声;另一个基于神经网络(ANN)模型,用于移除混淆于字符中的噪声。第 4 节给出了移除噪声的全部算法框架。通过实验证明了该算法的鲁棒性,其错误率小于 0.7%,可靠性大于 99%。最后,第 5 节对方法进行了总结。二、数据集和测度参数在一幅手写体数字图像中,我们将一块前景连通域称为一个物体。据统计,拥有最大面积的物体总是属于数字
4、本身,或数字的一部分,称为主物体。小于这个面积的物体,我们称之为副物体(图 1)。图 1:带噪数字字符图像中的主物体和副物体。黑色部分是一个数字的主物体,而灰色部分是一个数字的副物体。其中,左边数字有2 个副物体,右边数字有 3 个副物体。2.1 数据集MNIST 是一套著名手写体数字字库。其中,每张样本图像均为 2828 大小的灰度图。为了研究问题的方便,我们在 MNIST 字库中提取并组合出两套带噪的子字符集,设为 MB1 和 MB2。首先,我们使用全局最大方差阈值4对 MNIST字库进行了二值化,并抽取结果中所有带噪图像,组成MB1。又对MNIST 字库使用局部阈值算法进行二值化,对结果
5、取出所有带噪图像,组成 MB2。带噪图像的判断方式是,检测一幅图像中存在的物体(连通域)数目。如果物体数目大于 1,我们认为是一幅带噪图像。最后 MB1 共 1702 张样本,MB2 共 2945 张样本。这里我们采用的二值化算法分别为,全局方差阈值和局部 8-邻域均值阈值。和前者相比,后者对布局信息的敏感程度更高,从而会保留更多像素,但这样会使得边缘轮廓锯齿状增多,并引入的更多的孤立噪声点。2.2 特征参数我们对一幅数字字符图像抽取了下列特征参数:(1)物体数(NOM):即在一幅图像 M 中,物体的总数。(2)物体面积(Sk):第 k 个物体 Ok 的面积:Sk=count(p(x,y),(
6、p(x,y)Ok),其中 p(x,y)为坐标(x,y)处的像素点。(3)物体高度(Hk):第 k 个物体 Ok 的高度:Hk=|ybottom-ytop|,其中 ybottom为物体最低点的 y 轴坐标,ytop 为物体最高点 y 轴坐标。(4)物体宽度(Wk):第 k 个物体 Ok 的宽度:Wk=|xright-xleft|,其中 xright为物体最右边点的 x 轴坐标,xleft 为物体最左边点 x 轴坐标。(5)距离(Dkj):Dkj 指为一个物体 k 到另一个物体 j 之间的欧式距离,并以像素为单位。2.3 去噪效果评估参数一般来说,评估去噪方法的效果和可靠程度,需要下列参数:(1)
7、去噪率去噪总数样本总数;(2)拒绝率拒绝总数样本总数;(3)正确去噪率正确去噪数样本总数;(4)错误去噪率错误去噪数样本总数;(5)可靠率正确去噪数去噪总数;(6)失误率错误去噪数去噪总数。三、噪声建模首先一幅带噪图像中,孤立噪声都有可能存在这些情况:存在面积较小的椒盐状噪声;存在面积较大的斑点状噪声。另外还存在一些更大面积副物体,它们主要是进行阈值或分割数字区域时保留下来的背景或边框,也属于一种噪声。一般情况下,引入斑块状噪声的情况复杂,并且这类噪声和破损数字的部分笔划具有相似性,所以移除这类噪声的工作非常困难。目前少有方法能处理这种情况。3.1 预处理基于对斑块状噪声建模的需要,对于面积较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 噪声 建模 技术 手写体 数字 方法
限制150内