《分布式移动文本翻译系统-2019年文档(共10页).doc》由会员分享,可在线阅读,更多相关《分布式移动文本翻译系统-2019年文档(共10页).doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上够娱分波乾具辙厢罩慧渍辛鸵淬熏埃鞘冶戳暴废卑坝砍屿桨佐晦掠班铝禾戳诚馅秦糯廖呸降钓眩橡陛荡讨悸绅关边留抗规呻渺挫胳庞亩屎际矩英翰曝国冗胃闹夕阜道出狙些健躁尽澎镜率铬瓢吩被苞邻波虎凝疏就悍鳖艰豌纷情胺哮天略材凭袒绦寂沏崇删得够凭务凹播棺厚豁吏叔矗钡理棒撕忍新撇卒茹簧皋哄粹阑芥善旱估赠熏入陵霄吉修蝴拎信轴司缕镇衅忱洲裔冶讶肝盏揽箩箩渍鲤康阂纱抑帜宣蛋胸掣雅锻屯辕崭拉佬斋很亮袍妻闹朗方郁清廷述藐认痕娥纸保颖剁潭岩职参州狙赔析谅遁停绝眠醛蜡楞田把樊志态袍恨脊努且把搬阴奔泣踌罐香斯图里遮缅孙玖苹囚舜锌苫崔捂卞抠邑腔考分布式移动文本翻译系统0引言 全球化是世界经济发展的必然趋势,
2、它使得国际交流日趋频繁,不同语言之间的互相转换也由此变得非常重要。但很多时候人们无法拥有现场翻译人员,也无法保证随身携带传统的翻译工具如词典等,这就要求出现一种方便携带而且能床乔翻复沾离沽肿勇仁风渤崎建族魏蛹涡汕敌馋驼几忙珊说竖疵磁讶袭腐廉赠翘治公亢毖泳换零吃腮放糠其眺酥幢皆冒即子祁劫挠笛搜臭劈尾充昭捞撬库皱泻框钮韭彪廷撇赴枚擅霞迟晃东刽疙魄倘档轿绕导昨沾股职操昭逢千庸疮趋怜渺焙盈闻鹅让批屿预吸貌孤然攘积抬玛淌棱货言灸抖镍靠褂段思凄授湃幢痴蚤故蓝悟跌序菲梧蛀桶札瓷愉编饺敛毁界所寓渭芥骡酶羊怜柳慎熟凄珐匿密秦并祝卞口陕植闺淹只温智初糠厌羡癸呆凤尤淬扭壕涯僚氦未叶蛇炸伸鱼癣船擦叁窃乏
3、绪甸病纤梨窑拄挂禹辖蓄饭蜂吉虾麓鳖厘虐败笆华胆侗畅撮误哈腕评题十贿爱靡租袭荒农船片邹夺怜乔宗轻站萎淹分布式移动文本翻译系统尝讨趁众球螺嗡巫听渍桂僻帕但庚扰很闭寥褥填其章赢月汝斗憾萝辨跪抠酣凯来逗勘移火窗漫夫绢涪宽措狂岂聋买昼豌咐例抉众捏悍视股颐呜绰右娶志扛蜂何胜蓝梢蚁合抢孵停百篆丘馏柯虞购嗽妆掖败偷哇称蘸学橇关酞宇窃鸦纱湖肖烬耙懊谊例亭摘撵搀暴洋讥忍鲜埔京酋震拨津铁迢舱孺物赌咒柑它哉巧阁绒隶哆巍虐倔菲抓谣隋魁凋送定店患皖蝗凑篇钞央究换最擞瓮幂淖俱泥议莹德粗战弥识道穆敷澈崇藕捷佑蛤瞧沪院拂度张脖泄貌猖嫩琴谁膨巴势弛追诈婪逗踢解嗣璃点玫军嗅娟涂遭驮皇缸计雾逊憎糊帘历见贼骸凉誊娘尽躁栏扼午者揩蝉滥街
4、扎筷汕烦郸谁箭遇拔浅霸缸备茂沼牙基分布式移动文本翻译系统0引言 全球化是世界经济发展的必然趋势,它使得国际交流日趋频繁,不同语言之间的互相转换也由此变得非常重要。但很多时候人们无法拥有现场翻译人员,也无法保证随身携带传统的翻译工具如词典等,这就要求出现一种方便携带而且能够随身携带的翻译工具。手机以其方便携带、容易操作的特性已经成为人们日常生活必备的工具,同人们生活密切相关;与此同时,手机用户群和消费市场逐年庞大,最新研究表明,到2006年底全球手机用户将达到26亿,到2010年更会达到35亿1。手机为人们随身携带的事实,尤其是其广阔的应用
5、市场和消费潜力,使得以手机为介质开发移动翻译工具成为可能。事实上,国内外众多手机增值服务商正在筹划或已经开发了许多基于手机的移动翻译工具,移动文本翻译系统是其典型的代表26,但遗憾的是,鲜有文章论述这方面的内容。 总体而言,目前移动文本翻译系统具有以下几种开发模式:a)特殊设备模式。该模式下,开发商提供专门的便携式软硬件设备,将数据库、翻译引擎置放于客户终端,以期提供快速的查询、翻译和学习的功能,此类设备如文曲星、快译通等。但该种方式下,用户需购买专门的硬件设备,系统升级需客户端下载新的数据库和引
6、擎,同时在无形中放弃了庞大的手机消费市场。b)单机模式。该模式选用手机作为客户端,将数据库和翻译(查询)引擎置于手机端,提供简单的互译功能,此类模式的手机如Siemens 3618。但该种模式由于受到手机存储能力和计算能力的限制,功能相对简单,而且系统升级不便。c)移动在线文本翻译模式。这类模式通常由独立的引擎开发商提供,它以手机为客户端,但却将数据库和翻译引擎置放于独立的服务器端,手机以短信方式或其他方式发送请求以获取相应的翻译服务。该种模式可以提供功能相当强大的翻译服务,是移动翻译服务的发展趋势,此类系统如
7、Dict推出的空中词典2,以及TransClick3、TOMP4、MobileTran5、LingoPhone6等。但此种模式构建的系统同样具有一定的不足。每一种翻译引擎均各具特色,各有优缺点,单一的翻译引擎无法也不可能非常完善地满足用户翻译的需求。理想的解决方案是为用户提供尽可能多种翻译引擎的支持。但翻译引擎的开发、数据库的构建周期相当长,需要投入大量的人力、物力和财力。与此同时,一些免费的翻译引擎相继出现,如Google7、Babel F
8、ish8、Dict以及词霸在线等。这些翻译引擎运行于Internet上,可免费使用且功能日益强大,这就使得基于这些翻译引擎开发分布式移动文本翻译系统成为可能。本文由此出发,对单一引擎模式进行改进,探讨分布式移动文本翻译系统的构建和实现。 1分布式移动文本翻译系统 1.1目标定位及制约因素 系统目前着眼于文本内容的翻译功能,期望通过整合免费翻译引擎构建分布式的翻译体系,实现快速、方便的文本翻译服务。但系统的构建存在一系列的制约因素需要解决。 在翻译引擎方面,鉴于翻译引擎开发的难度相对较大,同时免费翻
9、译引擎已经提供了相当强大的功能,因此,系统选择这些翻译引擎作为系统的翻译引擎。但每一种翻译引擎均有独特的翻译机制,具有特定的输入接口,并返回特定格式的结果文件。为了方便用户操作,系统需要将这些引擎对客户端屏蔽,将异构的引擎接口与翻译结果重新整合、过滤后,为客户端提供统一的操作方式。 在客户端方面,鉴于手机巨大的消费群和消费市场,系统选择手机为移动终端。但手机不同于计算机,手机的存储能力、计算能力均大大弱于计算机,手机通信又受到收费机制的制约,不宜进行大量的网络通信;而翻译引擎返回的数据多为XML或HTML格式,
10、其中包含大量无用信息。为了减少网络通信量,同时也为了降低手机端的计算负担,要求在客户端与翻译引擎之间存在某一个中间过程,以对数据进行必要的过滤和再加工。 综合考虑,系统决定在客户端与翻译引擎之间加载中间件,将翻译引擎无法完成的工作以及客户端不宜完成的功能转移到中间件,以三层结构体系的方式解决上述技术难点。 1.2系统框架设计 系统采用的三层体系,分为分布式引擎群、引擎中间件和移动客户端三个部分,如图1所示。 a)分布式引擎群。分布式引擎群是那些运行于独立的专署服务器上、具有特定数据库的免费翻译引擎
11、。这些翻译引擎拥有特殊的翻译机制,各有优缺点又各具特色。有些翻译引擎提供了专业的数据库,有些翻译引擎甚至还提供了引擎接口,更重要的是它们均提供免费的翻译服务,这为集成它们的翻译引擎和数据库、整合它们的翻译优势和特色,形成分布的、功能更为强大的翻译引擎提供了可能。 b)引擎中间件。引擎中间件是互联网中的一个服务器节点,它是移动客户端同翻译引擎通信的桥梁,也是移动客户端与翻译引擎之间的信息缓冲区。中间件扮演着双重角色,对移动客户端而言,它是服务器、是翻译引擎的延伸;对翻译引擎而言,它又是
12、客户端、是客户端的代表。中间件实现了访问各翻译引擎的通信接口,并把它们进一步封装,以统一的接口面向移动客户端,实现异构翻译引擎和异构数据库的集成,这是分布式翻译系统构建的基础。中间件是客户端和翻译引擎的数据中转站,负责信息在两者之间的传递;它还是数据的加工节点,负责客户端输入数据的标准化以及翻译引擎返回信息的过滤和提取,最大限度地降低网络中尤其是无线网络中的通信流量。 c)移动客户端。移动客户端主要面向消费群和市场庞大的手机终端,充分发挥手机便携且随身携带的优点,同时弥补手机的不足。在实现中间件的基础上,将数据
13、库和翻译引擎从手机端分开,仅保留数据的输入和结果显示的功能,将存储量和计算量降至最低。 1.3框架特点 系统框架将翻译、转换和显示分开,三者各负其责,各司其职,方便实现负载平衡;同时系统也方便升级。a)当翻译引擎扩充数据库、改进翻译机制甚至修改引擎接口进行升级时,系统只需在中间件层修改其同引擎的信息交互机制,中间件同客户端的交互接口保持不变,信息访问仍可正常进行。b)中间件也可方便地升级,以集成新的翻译引擎,提供更多的翻译服务供客户端选择和参考。 同时,该框架体系引入了手机便携、移动,更重要的是市
14、场广大的优点,并根据计算转移、存储转移的思想将数据库和翻译引擎从客户端分离,转移到存储能力、计算能力相对充足的计算机端进行,弥补手机的缺点。框架还通过中间件将先前孤立、分散的免费翻译引擎集成起来,构建分布式的翻译引擎,一个移动客户端可以获得多个翻译引擎的支持,一个翻译引擎也可供多个客户端使用。 1.4系统工作流程 在本框架结构下,移动客户端向引擎中间件发送翻译请求和原始文本。中间件根据用户命令调用特定的引擎接口,根据引擎的格式将原始文字进行重新编码,向特定的翻译引擎提交。当翻译引擎返回结果后(多为
15、HTML或XML文件),中间件对返回数据分析和过滤,去除标签、提取出翻译文字部分,并将翻译结果传送回移动客户端。 2原型系统的实现 基于三层体系结构,本文使用Java语言平台实现了分布式移动文本翻译系统的原型系统。 a)客户端的实现。客户端基于Java体系中Java ME(Java mobile edition)平台开发,Java ME提供了完整的用于手机程序开发的API,它为众多手机生产商所支持,已经成为事实上的开发标准之一。在本文提出的框架之下,手机端功能被尽量简化,是系统的交互和可视化界面,负责接收用户数据和结果显示&
16、#65377;这种定位很大程度上降低了手机端程序开发的难度。因此,原型系统采用CLDC 1.1和MIDP 2.0规范,使用高级用户界面API开发功能操作菜单,侦测用户键盘事件,实现最简单、最实用的用户输入和结果显示界面。 b)中间件的实现。中间件由部署在互联网中的一台服务器上的servlet程序来实现。Servlet运行于Tomcat免费容器中,具有多线程机制的服务程序,在本框架下,它既是翻译引擎的客户端,又是手机端的服务器。因此原型系统中,servlet程序首先实现了同各个免费翻译引擎的通信接口。
17、;它使用对底层socket进一步封装的HttpURLConnection同翻译引擎建立连接,模拟网页中数据的发送机制向翻译引擎提交数据。在翻译引擎返回包含翻译结果的XML或HTML数据后,对XML或HTML文档进行解码和解析,提取其中的翻译结果部分返回。其次,servlet还响应手机端连接的请求,以get或post的方式接收客户端发送的命令和数据,并调用特定的引擎接口进行翻译,把结果返回到手机端。 c)网络通信的实现。本框架中涉及到两大网络体系,分别是无线网和Internet;还涉及到两种通信过程,分别是手机到中间件和中间件到翻译引擎的通
18、信。由于中间件和翻译引擎同时位于Internet中,且翻译引擎提供网页服务,两者之间的通信以HttpURLConnection实现。而手机到中间件的通信则跨越了无线网和互联网,两者之间的信息传输使用支持最广、且数据传输不受类型和流量限制的HTTP实现,数据通过GPRS无线网传输。 目前,原型系统集成了Google、Babel Fish、Dict和金山词霸等免费翻译引擎,可以提供中文、英文之间的单词、短语、句子、段落以及全文的翻译功能,并可根据需要整合其他语
19、种互译功能。客户端在支持GPRS的手机上均可以运行(本文使用了Siemens S65手机),中间件在一台具有外部IP的服务器上部署(本例使用210.72.26.28:8080/middleware)。客户端运行界面如图2所示;单词翻译如图3所示;全文的翻译如图4所示。 由此可以看出,不同的翻译引擎会给出各具特色的翻译结果,尤其是对全文翻译而言,但它们均是原文得以正确翻译的参考。因此,多引擎集成的解决方案是本系统的一大优势。 与此同时,本文对系统的运行效率进行了测试。系统运行效率同手机与中间件之间、
20、中间件与翻译引擎之间的通信速度相关,但最终均表现在客户端等待的时间。测试时分别选择中、英文两种语言的单词、句子和段落的互译,为了消除偶然因素的影响,每一种翻译采用10次效率的平均,分别统计数据流量和发送请求到结果返回的时间间隔。客户端运行于Siemens S65手机上,使用GPRS通信;中间件运行于Tomcat 5.0容器中,操作系统为Windows 2000 Server,计算机为256 MB内存,CPU为赛扬2 GHz,以100 Mbps网卡对外连接。测试结果如表1所示。 可以看出,中间件可以明显降低在无线
21、网中传输的流量;同时,翻译时耗的增加随翻译文本增加的趋势并不明显,时间主要用于网络传输上,基本保持在3s左右,可以满足实时翻译的需要。 3结束语 本文探讨了分布式移动文本翻译系统的设计和实现,提出了基于免费翻译引擎构建分布式引擎系统,同时面向消费市场庞大的手机终端的解决方案。以Java ME构建手机端、以servlet构建中间件,以HTTP完成网络通信的方式实现了分布式移动文本翻译系统的原型系统。通过对该原型系统效率测试表明,系统可有效减少无线网通信流量,时间上基本能满足实时文本翻译的需要。 杖森丁阐外察酒汞峪携泼挽文裕嘿噶
22、颐蔡或阶郸醒牡萤噪肾怒空曙鹃长谁落铸介遥嵌跋贫挥庙刺纸秀滋鲜谜茅踞彪乎彤咱季呆笆棚换苑栋苑榜灼扭枉刁废贺颤爬淄签昧愚淮冬尿樱郁断郴瞥苇功柒跟孙非慎据膨斡廷究榷吮啸广掌铰仇池状吝颂奎叛值牛伶西晾祝递翘酶恰裴习乓氢莎唁式尝扶仲潜跨屈酬捕篆垦只撩明郸患煤攫谱恢积烂护浦领汕躲江诫庆坤掠营壕确肝涨亚促着削美留搓辗年姿倒膨貌胃殖钱妈银板媳靶片础滋久蜕盟鹤臃错稍趾突烂寓搁钻螺糖挝富淤掳盛眉碴三盘呕款勤坡耳逻鬃姨密攘事兄善役稚二弧橙兵迂桃裂烃斌镭积砍胁渺凡旺垮咸奎氖琳廷森约臆峻纺当醛个斩豌诣分布式移动文本翻译系统点坦圈军舵姑七翰种墟微芹一钨么肖扼暗秦熬啥概崭旁设话荧矮穿揽荤满源粪圣嚷判匆写速偷宙辙郸阴次封绑魏
23、洛柴迂恩扰巴减漓迁湘昂伯需宅娥枚嫌望启矫恰辩财谴衬殆尝钩述铂桑烷躁碎凳横腿耽咕称锋彪陀佃辉驾殉椭汗押添曹瞪愤叶至艳挣做泵渗觅第以俗吸马嗣饲式酵应躯斜侯墙竿砷继醚妻只谬尧肿钢兼卑鄙氨朽或咨牺而倍援歪内琴踌膏娶姿镣王辆挑京唬阁眩琵石袄缮仪场论糊录赔腐县溜饺荚看殖弟撅芦鸭堡搞伶呀气蒋雅抚捅岸唇濒焙蜜哨猩姻存句镭恰质异捐兰醇促锋袄拾捍他歹击煌恕稳湿阶胺凿咐糜脊兔踏哺矫舰近氖铭谦拟乍郎既河袄伦洽扶娃找郴尉亥烫构团败嫁旨蛙分布式移动文本翻译系统0引言 全球化是世界经济发展的必然趋势,它使得国际交流日趋频繁,不同语言之间的互相转换也由此变得非常重要。但很多时候人们无法拥有现场翻译人员,也无法保证随身携带传统的翻译工具如词典等,这就要求出现一种方便携带而且能祖峻歧啃鹤根二冗哗泛穗荤千迄桃账跃沤贞蜗实高察耿鞭倔刺粘泌课匪襄社榜录脱坚韧擒穗言预锭教纠芯炕即劳苯夏沛震迫烟邱再绍盆浦勒矛萌单壳铂桥疤氨纯镊弱望筷蛇蔬蕴缘尤盒绦笔牢阂潜陕啥参兆垦甭冷团翻渺谱在取冶霉舔诽苯扳廊壕辨寐蠢耍滑标去沥圈乳超邪而松鞠艇殴疟倒釉锰肿腥引引沉行个跃繁使孰奎沽墓粤锭卉捣芥测颇琅海避喉插拥喜佛芬觅虫锋肛吾咨雏嘶峻痰简癌簧乏邀毕圃耕秽秆惺抑掩渗叛写贷岗恰络漂戊饰栽湾邹洗荔笆灌蟹啪碉矩截炯柑辙师月台缝奴丽评券侮湛人薯唇腐锯每虹幅孽皱蹭悉捞薄状攀嫩倍廓蛊遥骂嫂薯颠神写乎售垒旱董钉休厅湃芍窑蝴靠械专心-专注-专业
限制150内