《计算机辅助翻译的核心模块研究.docx》由会员分享,可在线阅读,更多相关《计算机辅助翻译的核心模块研究.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机辅助翻译的核心模块研究摘要:机器翻译和计算机辅助翻译极大地提高了翻译效率。在机器翻译尚不尽如人意的情况下,计算机辅助翻译作为一种替代手段,成为翻译人员的一种有效选择,目前已有众多商业产品问世。主流的计算机辅助翻译工具的核心技术是翻译记忆,其核心模块是翻译记忆系统、术语管理系统、对齐工具、翻译项目管理工具等。立足于计算机辅助翻译的原理和特点,分析计算机辅助翻译的核心技术和核心模块,介绍主流的计算机辅助翻译软件,以期对计算机辅助翻译软件的使用和推广提供参考。关键词:机器翻译;计算机辅助翻译;翻译记忆系统;核心模块;术语管理;对齐工具;项目管理工具在经济和社会日趋全球化的背景下,翻译在国际沟通
2、中不可缺少。信息时代的发展对各语种的翻译工作提出了新的要求。由于需要翻译的各语种文档大幅增加,传统的基于人工的翻译形式不能适应时代的要求。同时,随着计算机硬件及软件技术的飞速发展,使得借助计算机的自动或半自动翻译成为可能。近70年来,计算机翻译包括机器翻译和计算机辅助翻译获得了长足的发展。现阶段,基于计算机技术的全自动机器翻译在原理和技术上尚未获得决定性突破,而与此同时,有人工介入的计算机辅助翻译则获得了一定的成果。计算机辅助翻译由机器翻译发展而来,在翻译经过中有人工介入,而其终极目的是实现全自动翻译。基于计算机辅助翻译的翻译记忆系统可以用于基于统计和实例的机器翻译系统。目前,计算机辅助翻译已
3、有众多商业性产品问世,如SDLTrados、DjVuX、Wordfast、雅信CAT等,这些主流软件采用的核心技术是翻译记忆,其主要模块包括翻译记忆系统、术语管理系统、对齐工具、翻译项目管理等。本文对计算机辅助翻译的核心模块进行了分析。1计算机辅助翻译在翻译材料和翻译经过电子化的经过中,计算机辅助翻译得到迅速发展,其起源是机器翻译。计算机辅助翻译是机器翻译发展不理想情况下产生的暂时替代工具1。计算机辅助翻译和机器翻译的主要区别是翻译工作由谁完成2。其一,机器翻译与计算机辅助翻译有不同的设计理念。机器翻译的设计是让机器完全替代人工翻译,而计算机辅助翻译则是由计算机辅助人工或人工辅助计算机完成翻译
4、。其二,二者应用范围不同。机器翻译可应用于重复性较高的文本或基于专业语料库的文本,如产品讲明书等。有些文本翻译量过大,如网页等,应用机器翻译效率较高。文学文本一般不使用机器翻译。法律文本由于其术语的敏感性,建议采用计算机辅助翻译。其三,二者的翻译引擎不同。机器翻译是基于语法分析和语料库。计算机辅助翻译的翻译引擎可实时存储翻译结果到记忆库,之后可搜索记忆库,根据匹配结果为翻译人员提供参考,同时,计算机辅助翻译提供强大的术语管理功能3。计算机辅助翻译的核心是翻译记忆,其基本原理为翻译记忆+机器翻译+人工翻译。计算机辅助翻译的经过是翻译人员在翻译的同时,计算机辅助翻译软件在后台启用和建立翻译记忆库,
5、通过翻译记忆和数据库,将源文本和译文文本储存起来。假如在翻译经过中,有重复和相近的术语、短语、词组、句子出现,通过系统的搜索和比照,为翻译人员提供相近的翻译文本,供翻译人员参考,由翻译人员决定采用、修改或弃用3。由此可见,文本的重复性是计算机辅助翻译中翻译记忆的关键,只要在重复性较高的文本中,翻译记忆才能良好地发挥成效。目前,基于翻译记忆的计算机辅助翻译软件已有多种商业化产品,这些软件工具的问世,极大地改良了翻译形式,起到了良好的效果。如使用雅信CAT,使翻译人员的翻译效率得到了较大提高,传统的人工翻译日工作量的瓶颈为5000汉字/天,而翻译记忆系统可使效率提高一倍,到达10000汉字/天4。
6、2计算机辅助翻译的核心模块计算机辅助翻译软件的技术核心是翻译记忆,其核心模块是翻译记忆系统、术语管理系统、翻译对齐工具、翻译项目管理工具等。2.1翻译记忆BOWKER2以为:翻译记忆应定义为一种用于储存原文和译文的语言数据库。在此基础上,BOWKER总结了翻译记忆的特征为重复利用,并对翻译记忆的应用范围做出分析,指出内部重复率高的科技文本和法律文本、外部重复率高的网站、同一领域的文本、更新文本是翻译软件的适用范围,而文学文本不适用。翻译记忆是将源语言及翻译后的译文对照地存入记忆库中,由此可再利用而翻译新的源语言。只要在重复性较高的文本中,翻译记忆才能良好地发挥成效。翻译记忆的工作原理是将待翻译
7、片段和数据库中已有翻译片段进行比拟,在确定匹配率并到达标准时,将译文提供应翻译人员参考,翻译人员能够采用、编辑修改或弃用4。2.2术语管理术语库术语数据库是为了利用和管理术语而建立的术语容器,是基于计算机的术语集合。计算机辅助翻译领域的术语库能够是双语或多语对照词表,并包括相关附属信息,如定义、学科、词性等4-5。术语库的目的在于保持翻译文本中术语的一致性,其工具是术语管理系统,其优势在于自动和高效地保持翻译项目中术语翻译的一致性,不出现一词多译6。根据术语来源,可将术语表分为来源于客户、来源于互联网或来源于原文件整理。在术语表的基础上就可建立术语库。术语库的创立包括导入、创立、实时更新和自动
8、提取。导入形式:首先利用Excel表格对术语进行整理、编校;然后利用相应工具将Excel格式转换为术语库定义文件和术语数据文件;接着创立新的空白的术语库;最后将术语数据文件导入空白数据库。创立形式:在建立的术语库文件中手动添加术语构成术语库。实时更新形式:在翻译经过中,一边翻译,一边系统会自动添加和修改术语,完成数据库的实时更新和维护。自动提取形式:由术语提取工具自动从文档中提取术语,然而,目前此种方式的准确性还有待于完善5。术语管理包括两层含义,翻译经过中的术语管理和组织中的术语管理。两者都包括用户内部的业务语言标准化经过,包括:确定术语系统的范围;审查词汇表,确定核心术语库;对术语库进行审
9、核和编辑,部署到译者和用户中;为每种目的语言中每个术语确定唯一翻译;为其他用户提供权限4。目前而言,主流的计算机辅助软件大多带有集成的术语管理软件,此外,还有独立的术语管理工具,如SDLMultiTerm等。集成式和独立式工具都可对术语进行管理,集成式使用灵敏而独立式功能强大。总体而言,术语管理是系统化地管理特定领域专业词汇的活动。2.3对齐工具对齐的含义是指将原文和译文按翻译单位逐一对应匹配。在机器匹配的基础上需要人工编校,以确保其准确性。对齐的语言单位能够是词、句等,目前以句子作为对齐单位也比拟常见。对齐的结果能够直观地呈现给翻译人员。对齐的结果能够输入到记忆库,协助扩大翻译记忆,方便翻译
10、人员使用7。目前,对齐模块的效果尚不理想,很多计算机辅助翻译工具对齐模块的对齐质量有所缺陷,还需要人工编校,其自动化水平尚待提高8。2.4翻译项目管理系统2.4.1翻译项目管理系统翻译项目管理是为了知足翻译需求,翻译者根据项目的整体规划和实际特点而制订的翻译方案。翻译项目管理的要素是:翻译质量、翻译时间、翻译成本。这3个要素是互相作用的。这3个要素也是翻译项目管理的目的。翻译项目管理的流程分为译前、译中和译后管理。译前管理是指项目经理接收相关项目后,根据客户需求制订项目章程,对翻译经过进行规划,包括项目描绘、人员安排、三要素管理等。译中管理是指在翻译经过中对翻译和审校监控,根据情况对翻译计划进
11、行调整,进行翻译中的沟通,确保三要素。译后管理是指对翻译项目进行质量评估,包括项目经理对项目质量的检查和专家对项目的检查,此外,还应对翻译团队做出评估9。其详细流程可归纳为:译前准备确定文本的基本信息和翻译需求、译前格式处理语料准备、项目派发确定翻译人员、时间、要求、术语表等、项目跟踪监督、稿件回收、调整计划、译后排版、审校和质控、项目提交、项目总结10-12。2.4.2翻译项目管理模块计算机辅助翻译的技术核心为翻译记忆模块,但翻译项目管理模块是确保翻译项目运行的关键。目前,计算机辅助翻译工具大多具有项目管理工具,能够自动化地完成翻译项目管理。使用翻译项目管理工具,翻译人员可对照记忆库,对需要
12、翻译的新内容进行分析,充分发挥翻译记忆的功能。进而实现人工辅助的自动化和集约化,确保翻译质量、节约翻译时间、降低翻译成本,实现翻译项目管理的目的。1翻译项目管理模块的功能。其功能包括:源文本的导入、文本字数和字段分析、预翻译、审校和质控,目的译文导出。2翻译项目管理模块的操作。主要操作为:首先,建立翻译项目文件夹管理项目文件、记忆库文件、术语库文件、源语言文本、目的语文件;其次,将源文本导入翻译工具有可能需要做术语提取和格式转换;然后,进行翻译经过翻译中可实时与术语库沟通;最后,导出某格式的译文。某些项目管理模块有保存功能,能够自动保存、自动汇编、生成翻译记忆,方便以后的翻译作业13。3翻译项
13、目管理模块的特性。主要特性如下:与其他内容管理系统一体化;工作流程管理;用户许可、角色分配与沟通;以网络为平台的应用系统;远距离写作;支持多种方式提交译文;提交项目报告;像接收者发送输出文件;与其他应用软件的对接4。3常用计算机辅助翻译软件目前,主流计算机辅助翻译软件大多具有以上几种核心模块,国内使用的商业化的计算机辅助翻译工具主要有SDLTrados、DjVuX、雅信CAT等。互联网调查发现,国内的SDLTrados市场占有率最高,雅信CAT次之,DjVuX再次14。英国的SDLTrados专业性强、功能齐备、操作高效,但成本较高,适用于翻译公司进行专业性强的大型翻译项目;西班牙的DjVuX功能齐备、操作简单、术语库和记忆库可移植性强,有利于团队合作,适用于团队协作翻译;中国的雅信CAT的自带词库、语料库功能强大、操作较为简单、效率高,但响应速度慢、格式兼容性一般,适用于初学者和自由译员。目前,主流的计算机辅助翻译工具大多包括翻译记忆系统、术语管理系统、翻译对齐工具、翻译项目管理工具等核心模块,对其基本模块的分析将为计算机辅助翻译工具的开发、应用、拓展提供理论基础和实践方法,为实现自动化翻译提供思路。
限制150内