一个基于神经网络在线汉字识别-外文翻译.docx
《一个基于神经网络在线汉字识别-外文翻译.docx》由会员分享,可在线阅读,更多相关《一个基于神经网络在线汉字识别-外文翻译.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、A.2 译文一个基于神经网络在线汉字识别现有一个基于神经网络在线汉字识别的系统(OLCCR)。在此提出了一种反向传播神经网络系统,它用来解决系统中的模式匹配问题,而不是那些非神经网络算法。这个OLCCR系统将使我们能够实时识别手写汉字。每一个认识的过程包括两个主要阶段:(A)特征提取阶段,其中一个特征向量信息的基础上参考行程可以提取,和(B)字匹配阶段,其中一个特征向量与匹配组标准的中文参考字符特征向量。实验结果表明,大约需要0.25秒来识别手写字符,可以达到约91%的识别率。1、简介最近,在人工神经网络模型中产生出大量的有关此领域的演讲和模式识别。一个典型的神经网络模型包含了许多平行非线性计
2、算的元素,这些元素在模式中紧密相连,这会使人联想到生物学的神经网络。Hopfield l, Rumelhart et al. 2, Sejnowski and Rosenberg 3,Feldman and Ballard 4, Carpenter and Grossberg 5, and Kohonen 6 近期的工作在一定程度上导致了这个领域研究的复苏。在过去的二十年里,许多科学家致力于手写汉字字符识别的研究。像在许多统计模式识别的问题一样,最困难的任务是提取特征向量和开发分类(聚类)算法。因为其转移不变性和循环不变性的性能,一套使用笔画分析的功能最近变得很受欢迎。在本文中,提出了一种基于
3、OLCCR系统的BP神经网络来对手写汉字实时识别的相关问题进行探讨,并期待对未来的研究提出可行的改进。2、回顾BP神经网络模型在1969年,Minsky和Papert提出了一种BP技术用来解决信贷分配问题。一个BP神经网络系统就是一个位于输入层和输出层之间的一个或多个层次的隐藏的单位组成的前馈网络。图一显示的就是包含两个隐藏的层次的一个BP神经网络。它是由许多处理部件(PU)组成,在这些处理部件中暗中输入了非线性变换的线性组合。从图二可以看出,第i个PU的输入可以等效于单层次的神经网络如下: (1) 其中是第j层输入和第i个PU之间的差值。 它的传递函数可以表示为: (2)一个多层感知器网络中
4、的隐藏单位可作为特征探测器使用,用来反映输入节点和输出装置之间的映射关系,并且以此来克服单层网络的局限性。然而,在一个多层网络中,该部位的形成就像那些混合形成的分布分类器的加权一样复杂。同时,训练的问题是更加复杂的。误差信号在许多突出的不同层次形成。因为隐藏层的隐藏性质,其中的误差信号无法直接计算。由于缺少有效地学习算法,多层网络不被广泛使用。最近,这个通过一个被称为广义三角洲规则的互动的梯度学习过程算法发生了改变(附录1,根据要求提供)。该算法是在输出设备上基于误差的一种配方,目的是调整连接权。这些误差会在通过隐藏层到输入层的过程中滞后,在那里根据输出单元中期望值和实际值之间的差异根据增量调
5、整权重,并将之迭代,直到所有投入产出模式双相匹配为止。因此,这个新技术已经广泛用来有效地解决许多复杂的和确定性的问题,如XOR问题,语音合成和肯定及模式识别。图1 含两个隐藏层的BP网络示意图 图2 第i个PU的输入等效的单层神经网络3、基于网络的神经OLCCR系统的构架如图3所示,OLCCR的神经网络已经在手写汉字的实时识别中得到了使用。如图4a的例子中所示,在每一个认识过程中,一个手写数字字符识别系统是由输入到笔迹数据点的数字化。预处理过程使这些数据点变稀少变平滑。这个使其稀少的过程就是通过比较原数据点和之后的数据点之间的差异后消除一些不必要的数据点来完成。然后,无论(或)或(或)的时候,
6、否则就丢弃。必须足够大,可以消除数据冗余点,必须足够小,可以足以保存本质的特征。平滑的过程即遵循变稀少后的数据点进一步消除噪音。由和来确定第k个平滑点。图4b中给出,和的示例。因此,我们的OLCCR系统的两个主要单元得以实施。图3 OLCCR系统框图手写字符输入字符图片预处理特征提取模式匹配特征数据库识别后的字符输出(A)特征提取单元链码上常用的就是手写字符12,13的字符。链码的使用与分割可能涉及到人类的辨认和书写字符中的一个最基本的机制。人类视觉和感觉上的研究表明本地特色的出现比在人类相对位置的视觉感知中更占主导地位。在我们的工作中,一个输入字符的特征提取是指总笔画的数目和笔画的类型标识的
7、序列。笔画识别的四项主要工作是(1)分割,(2)流向,(3)尖端检测,(4)笔画类型:图4 手写汉字特征(a)原型(b)平滑细化处理(c)分割后(1) (1) 轨迹曲率是最明显的特点。Freeman通过利用预处理后的数据点生成的量化方向提出了一个有用的近似曲率。基于Hanaki的递归方法,手写的数字14的每一个笔画都近似为一些线段。在每个笔画中,一个数据点代表从起始点到终点的最大距离。然后,笔画的数据点被分为两个系列: 和。这样的程序将被迭代至没有数据点满足条件为止(附录2,根据要求提供)。距离阀值必须足够大,以减少到最低的分割操作,然而足够小,以保存笔画的原始特征。在我们的系统中,阀值是自适
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一个 基于 神经网络 在线 汉字 识别 外文 翻译
限制150内