一个基于神经网络在线汉字识别-外文翻译.docx

上传人：豆****

文档编号：29897629

上传时间：2022-08-02

格式：DOCX

页数：15

大小：1.87MB

( 4.5 )

《一个基于神经网络在线汉字识别-外文翻译.docx》由会员分享，可在线阅读，更多相关《一个基于神经网络在线汉字识别-外文翻译.docx（15页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、A.2 译文一个基于神经网络在线汉字识别现有一个基于神经网络在线汉字识别的系统(OLCCR)。在此提出了一种反向传播神经网络系统，它用来解决系统中的模式匹配问题，而不是那些非神经网络算法。这个OLCCR系统将使我们能够实时识别手写汉字。每一个认识的过程包括两个主要阶段：(A)特征提取阶段，其中一个特征向量信息的基础上参考行程可以提取，和(B)字匹配阶段，其中一个特征向量与匹配组标准的中文参考字符特征向量。实验结果表明，大约需要0.25秒来识别手写字符，可以达到约91%的识别率。1、简介最近，在人工神经网络模型中产生出大量的有关此领域的演讲和模式识别。一个典型的神经网络模型包含了许多平行非线性计

2、算的元素，这些元素在模式中紧密相连，这会使人联想到生物学的神经网络。Hopfield l, Rumelhart et al. 2, Sejnowski and Rosenberg 3,Feldman and Ballard 4, Carpenter and Grossberg 5, and Kohonen 6 近期的工作在一定程度上导致了这个领域研究的复苏。在过去的二十年里，许多科学家致力于手写汉字字符识别的研究。像在许多统计模式识别的问题一样，最困难的任务是提取特征向量和开发分类（聚类）算法。因为其转移不变性和循环不变性的性能，一套使用笔画分析的功能最近变得很受欢迎。在本文中，提出了一种基于

3、OLCCR系统的BP神经网络来对手写汉字实时识别的相关问题进行探讨，并期待对未来的研究提出可行的改进。2、回顾BP神经网络模型在1969年，Minsky和Papert提出了一种BP技术用来解决信贷分配问题。一个BP神经网络系统就是一个位于输入层和输出层之间的一个或多个层次的隐藏的单位组成的前馈网络。图一显示的就是包含两个隐藏的层次的一个BP神经网络。它是由许多处理部件(PU)组成，在这些处理部件中暗中输入了非线性变换的线性组合。从图二可以看出，第i个PU的输入可以等效于单层次的神经网络如下： (1) 其中是第j层输入和第i个PU之间的差值。它的传递函数可以表示为： (2)一个多层感知器网络中

4、的隐藏单位可作为特征探测器使用，用来反映输入节点和输出装置之间的映射关系，并且以此来克服单层网络的局限性。然而，在一个多层网络中，该部位的形成就像那些混合形成的分布分类器的加权一样复杂。同时，训练的问题是更加复杂的。误差信号在许多突出的不同层次形成。因为隐藏层的隐藏性质，其中的误差信号无法直接计算。由于缺少有效地学习算法，多层网络不被广泛使用。最近，这个通过一个被称为广义三角洲规则的互动的梯度学习过程算法发生了改变（附录1，根据要求提供）。该算法是在输出设备上基于误差的一种配方，目的是调整连接权。这些误差会在通过隐藏层到输入层的过程中滞后，在那里根据输出单元中期望值和实际值之间的差异根据增量调

5、整权重，并将之迭代，直到所有投入产出模式双相匹配为止。因此，这个新技术已经广泛用来有效地解决许多复杂的和确定性的问题，如XOR问题，语音合成和肯定及模式识别。图1 含两个隐藏层的BP网络示意图图2 第i个PU的输入等效的单层神经网络3、基于网络的神经OLCCR系统的构架如图3所示，OLCCR的神经网络已经在手写汉字的实时识别中得到了使用。如图4a的例子中所示，在每一个认识过程中，一个手写数字字符识别系统是由输入到笔迹数据点的数字化。预处理过程使这些数据点变稀少变平滑。这个使其稀少的过程就是通过比较原数据点和之后的数据点之间的差异后消除一些不必要的数据点来完成。然后，无论(或)或（或）的时候，

6、否则就丢弃。必须足够大，可以消除数据冗余点，必须足够小，可以足以保存本质的特征。平滑的过程即遵循变稀少后的数据点进一步消除噪音。由和来确定第k个平滑点。图4b中给出，和的示例。因此，我们的OLCCR系统的两个主要单元得以实施。图3 OLCCR系统框图手写字符输入字符图片预处理特征提取模式匹配特征数据库识别后的字符输出(A)特征提取单元链码上常用的就是手写字符12,13的字符。链码的使用与分割可能涉及到人类的辨认和书写字符中的一个最基本的机制。人类视觉和感觉上的研究表明本地特色的出现比在人类相对位置的视觉感知中更占主导地位。在我们的工作中，一个输入字符的特征提取是指总笔画的数目和笔画的类型标识的

7、序列。笔画识别的四项主要工作是(1)分割，(2)流向，(3)尖端检测，(4)笔画类型：图4 手写汉字特征（a）原型（b）平滑细化处理（c）分割后（1） (1) 轨迹曲率是最明显的特点。Freeman通过利用预处理后的数据点生成的量化方向提出了一个有用的近似曲率。基于Hanaki的递归方法，手写的数字14的每一个笔画都近似为一些线段。在每个笔画中，一个数据点代表从起始点到终点的最大距离。然后，笔画的数据点被分为两个系列：和。这样的程序将被迭代至没有数据点满足条件为止（附录2，根据要求提供）。距离阀值必须足够大，以减少到最低的分割操作，然而足够小，以保存笔画的原始特征。在我们的系统中，阀值是自适

8、应的，并且取决于递归码的深度。在图4c中给出相关例子。（2） (2) 为了将笔画分类，在图5中定义出一个平面，平面上有七个不一致的矢量量化的方向。线段由七个方向码进行编码（从1到8，除去5和4因为其汉字特征的结构特点而相互结合）。在手写的习俗中，在斜线的笔画中要允许足够大的偏差。在我们的系统中，和被看作是没有大的差别的。（3） (3) 如表1所示，七组尖端的特征被编码为七个尖端代码（9到15）。每个尖端特征被编码为一组方向代码，这组方向代码通过将其尖端代码嵌入两个方向代码进一步编码为链式代码。然而，对于一组无法匹配的代码，链式代码可以简单地取作丢弃第二个方向代码后的值。在一个笔画段的尖端检测过

9、程中，方向代码的序列组成的链式代码被一个个的解析。因此，笔画段的脸是代码的序列包括其方向代码，尖端代码，和编码序列的有关信息。每个笔画段的链式代码的序列可以被进一步编码为一个30为的特征向量，这个特征向量的第j个组件且，其中，是链式代码的频率，而是链式代码的长度。图5 七个矢量化方向表1 七个笔画特征(4)笔画分类的三种方法是决策树的制定，查表，和句法7到11。在这个研究中，一个人造的神经系统模型被作为一个新的方法运用。如图1中所示笔画的分类可以分层实现，图1中的网络便包含输入层的30个输入节点，两个隐藏层中的7个隐藏单元和输出层中的14个输出单元。如表2中所示，14种笔画类型有48种参考笔画

10、特征，它们在链式编码中被编码，这种方法在汉字的特征识别中尤为重要，并被经常采用。这48中参考笔画特征被用来训练神经网络，使神经网络有能力在14个输出单元中提取14中笔画类型。一个在PC机上运行的用C语言编写的模拟器被用来实现在任意神经网络中收集所需数据。我们通过如下方法初始化神经网络的参数：每个权重或阀值=随意的数字+1.0和-1.0之间，学习率=0.3，动量因子=0.3和容错率=0.2。当神经网络被训练为有48种学习模式的时候，参考数据库就建立起来了，参考数据库包含14种参考笔画类型的权重和阀值信息。然后，笔画的总数何必花，诶性的序列可以从一个输入特征中提取出来。笔画类型的序列的提取可以进一

11、步编码为一个14维的特征向量，这个14维的特征向量的第j各组成部分即为笔画类型j的频率，其中。表2 14种笔画类型对应的不同笔画特征(B)特征匹配单元在这个研究中，22个字符分类器被逐个实现，它们用来识别1到22的不同的笔画数目的特征。每个字符分类器也有一个反向传播网络执行，这个反向传播网络包含输入层中的14个输入节点，和每两个隐藏层中的14个隐藏单元。在这里，434汉字模式被划分为22个组，每个组中的笔画数目范围从1到22。每当笔画的总数和每434个参考模式的笔画类型序列被提取后，22个神经网络中的每一个都会被逐步训练成为参考特征组。我们依照如下来初始化22神经网络的参数：每个权重或阀值=随

12、意的数字+1.0和-1.0之间，学习率=0.3，动量因子=0.3和容错率=0.1。每当22神经网络被逐步训练成为相应的学习模式组别时，一个涉及22组汉字参考模式的权重和阀值信息的参考数据库就建立起来了。每个参考特征模式的笔画序列的提取被要求可以在字典里依照标准的书写顺序查到。举个例子，“主”和“玉”有不同的特征，然而，它们的特征矢量是完全一样的。如果检测到任何歧义，相应的特征可以由笔画序列查找出七组尖端特征。4、实验结果及相关讨论图6中显示出一个从电视显示器中提取的手写汉字特征的识别的例子。坐标上的特征显示出手写字符的模式和坐标。输出部分由右手边的打印的汉字参考特征给出。坐标上可以将笔画类型的

13、序列和笔画总数提取逐个显示出来。从434参考特征模式中随机选出的700个汉字被7个人书写。结果则是有638个汉字被准确识别，并且还有62个没被识别的汉字。平均来说，识别率达91%。只用0.1秒完成笔画的分类和0.15秒完成手写汉字的识别匹配。此外，可能出现的错误和未被识别的特点如下：(I)未被识别的特征由手写汉字9的可变性因素造成。名义上，直笔画（笔画类型1到5）只是手写的近似直的笔画。特别的，垂直和水平的笔画很难写的规范。当出现一个新颖的模式时，BP模型可以作为一个最相似的分类器但不保证预期的效果。因此，特征匹配逻辑要求被提高，或者数据库要求被拓展。(II)未被识别的汉字是由于(a)奇异的笔

14、画序列，(b)不准确的笔画数目，(c)输入错误信号，可作如下描述：(a)数据库必须进行相应的拓展，附加上一些可能出现的奇异的笔画序列。(b)两个或以上的笔画连接为一笔作为输入时，往往会遗漏笔画数目，然而，一个多段的笔画拆分为两个或以上的笔画时会增加笔画数目。错误的笔画数目往往会造成未识别的字符。有必要对容易产生错误的字符进行修改。(c)上下感应接触不稳定的笔尖的钢笔会造成笔画分类的错误或者笔画的破损。每当感应速度赶不上书写速度时，手写笔画的笔迹会被提取的不准确。这些误差可以通过利用高准确度的输入设备和提高感应和提取速度来消除。图6 手写汉字识别举例5、结论一个以BP神经网络为原型的手写汉字实时识别系统建立起来了。人工神经网络作为一种新的方法来解决模式匹配的问题，替代了非神经网络的方法。只用0.25秒来完成手写汉字的识别。识别率达91%，也就是说700个随机抽取的汉字中，只有62个未被识别。在第四部分的讨论中，这些误差可以消除并达到更高的识别率。由于神经网络计算的巨大的并行性和一般性，实现一种鲁棒性OLCCR系统进行快速的模式识别是极有可能的。附录A 外文资料翻译A.1 英文

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 一个基于神经网络在线汉字识别外文翻译

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：一个基于神经网络在线汉字识别-外文翻译.docx
链接地址：https://www.taowenge.com/p-29897629.html