美军国防语言研究的主要方向和特色,应用语言学论文.docx
《美军国防语言研究的主要方向和特色,应用语言学论文.docx》由会员分享,可在线阅读,更多相关《美军国防语言研究的主要方向和特色,应用语言学论文.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、美军国防语言研究的主要方向和特色,应用语言学论文随着我们国家综合国力的提升和国家利益的拓展,语言能力日益成为实力的重要组成部分。 在情报整编、反恐维稳、国际合作等众多事务中,语言能力的高低已经成为影响甚至决定战斗力的重要因素。作为语言能力建设起步较早的国家,美国在语言政策的制定与施行、语种的统筹和规划、语言人才的储备与管理、语言研究的引导与支持等方面有很多经历体验值得我们借鉴。然而,以往国内学者在讨论美军语言能力时,主要集中研究美国的国防语言战略,却较少关注语言研究在推动美军语言能力中发挥的重要作用。针对这种情况,本文将通过分析美国军方赞助的语言研究项目,梳理美军国防语言研究的主要方向和特色,
2、以期对我军语言能力建设提供借鉴。 一、研究方式方法 (一)数据来源 本研究所用数据来自于美国国防科技情报中心(The Defense Technical Information Center,简称DTIC)。该中心从属于美国国防部,是美国最大的国防信息服务机构,其潜在用户为美国国防部工作人员以及与国防部合作的承包商、大学和研究所。该中心收录了与国防科技相关的各类资料和数据,包括技术报告、项目进展报告、学位论文、以下为参考文献等,华而不实部分非密级信息面向公众开放。通过分析该中心收录的科研项目信息,能够较全面地揭示美军对现实语言需求的认知与把握,以及美军语言研究的主要方向和应用领域。 (二)数据
3、处理 我们以language、linguistic和linguistics作为本文关键词语,在美国国防科技情报中心数据库中检索出所有与语言相关的研究报告,共1990篇。出于保密等考虑,该数据库仅公开华而不实1000条数据信息。这会在一定程度上影响分析结果的全面性,但并不阻碍我们针对总体趋势进行探寻求索性的分析。 每一条数据信息主要包括下面内容:报告编号(Accession Number)、题目(Title)、报告类别(Descriptive Note)、作者单位 (Corporate Au-thor)、作者姓名 (Personal Author)、报告日期(Report Date)、报告内容摘
4、要(Abstract)、本文关键词语(De-scriptors)、学科类别(Subject Categories)。我们将以上信息逐条拷贝下来,组成本研究的基础数据。需要指出的是,部分年代较为长远的研究报告,在数据库中仍然以PDF格式存储,需要我们手工将华而不实的关键信息摘取出来。在数据收集经过中,我们发现1000篇文献有一定的重复。去除重复数据后,共得到821条数据,数据的年代最早是上世 纪60年代,它们组成了本研究的数据来源。 (三)数据分析 本研究主要采用聚类分析的方式方法,将所收集的文献数据分成若干代表不同研究领域的子集。 在聚类之前,首先对文本进行了预处理,主要包括停用词过滤、词形复
5、原、矩阵生成等步骤。然后,利用CLUTO工具进行自动聚类。参照Zhao Karypis,本研究采用的是重复二分法(repeatedbisection)和h2判别标准作为聚类分析的基本算法组合。在经过若干次比对后,我们最终将聚类数目定为12。 根据聚类质量由高到低,表1列出了12个聚类的基本信息,分别是聚类编号、文本数目、内部类似度、内部类似度标准差、外部类似度、外部类似度标准差。 二、研究结果 在文本聚类后,我们对各聚类的项目内容摘要逐一仔细研读,以总结美军语言研究的主要方向和特点。在梳理经过中,我们发现聚类0和聚类9的研究内容高度类似,因而将其合并。聚类8中的研究项目主要是关于计算机编译语言
6、,我们以为该聚类不属于语言研究的范畴,因而将其剔除。 最终,我们得到了代表下面10个研究方向的项目聚类。 (一)语音辨别研究 (聚类0和聚类9)美国军方早在上世纪60年代以前就开场赞助有关语音辨别的研究。 1974年兰德公司的一份项目报告,就已经对语音辨别技术的应用前景表示足够的乐观。1960年代的语音辨别研究,主要关注的是语音信号的辨别,即语音信号向对应语言符号的转换。研究者从发声学、音位学、声学、听觉语音学等多个角度对英语、俄语、德语、汉语、日语、朝鲜语等多种语言的语音特征进行描绘叙述和分析。1970年代,语音辨别已经从语音信号的辨别发展到语音意义的理解上。自然语言处理技术(如词性标注、句
7、法分析等)开场更多地融入语音辨别研究中。 1980年代,正如兰德公司的预测,语音辨别技术已经开场应用到众多军事领域,各研究机构和大学相继开发出牵涉语音辨别技术的人机交互系统,如IBM公司的MASTOR系统(语音翻译系统)、卡耐基梅隆大学的SPHINX系统、麻省理工学院的VOYAGER系统、SRI国际公司的ATIS系统(Air Travel Information Sys-tem)等。 1990年代,基于统计的方式方法开场在语音辨别研究中广泛应用。2000年以后,几乎所有受军方赞助的语音辨别项目都与语音数据库建设有关。研究者们意识到,缺乏基础语音数据库,尤其是在特殊条件下或面 向 特殊用 途 的
8、语音数据库,严重制约了语音辨别技术的发展。 (二)语言、文化与区域知识研究(聚类1)上世纪60年代,美国国防分析研究院的一份报告阐述了美军在越 南 战场上 遇 到的语言问题。 此后20年间,没有在美国国防科技情报中心的公开数据中发现类似的研究报告。 1980年代末至1990年代初,陆军行为及社会科学研究所和陆军战争学院针对语言能力建设提出了很多建设性的意见,如提高全体人员的语言意识、建立语言学习奖励机制、追踪人员语言水平、开展不间断语言评测等。这些建议基本都成为了日后美国国防语言政策的重要组成部分。 2000年以后, 9.11事件 和反恐战争促使美军愈加重视语言能力建设,同时文化能力被赋予了与
9、语言能力同等重要的地位。 2007年,陆军指挥参谋学院的一份报告指出,国防语言变革道路图(Defense Language Transfor-mation Roadmap)和美国国防部章连贯问题。 2000年以后,白话人机对话系统的开发,以及人机对话系统的鲁棒性、可移植性等问题陆续成为该领域关注的焦点。 (九)认知语义研究(聚类10) 与聚类4类似,该聚类的主要目的也是让计算机能够理解和处理自然语言。但该领域的研究重心是语义的形式表征,而不是语法的形式分析。 研究者们关注的是怎样使用计算机可处理的物理符号来表征抽象的语义知识。由于语义的复杂性,该领域是一个牵涉心理学、认知科学、计算机科学、语言
10、学、哲学等众多学科的穿插领域。研究者们大量借鉴相关学科的研究成果,提出了一大批语义表征模型,如1960年代的语义网络模型,1970年代的概念依存语法、优选语义学、个人因果律理论、HOS理论、语言记忆系统形式化模型,1980年代的联通理论,1990年代的构造建造框架理论、模糊语义学,2000年以后的ACT-R理论、社会网络分析、双反响理论等。从研究对象来看,该领域关注各种特殊语言现象的概念表征问题,如隐喻、语用、信念、空间、时间、因果关系、花园途径现象、指示代词、名词短语、动词元语义等。 2000年以后,语义表征的对象开场从语言拓展到图像、事件、人类行为、社会行为、组织演变、动态信息系统等,研究
11、的重心也开场从静态的语言理解向动态的系统模拟转变。 (十)信息检索研究(聚类11) 该领域研究以信息检索为主,但也牵涉信息的加工、管理和应用。1960年代,信息检索的对象多是构造化的信息,如某种特定的情报信息、地理位置信息、海事信息等。1970年代,在国防高级研究计划局的高级命令与控制构造试验平台项目中,信息处理技术开场应用于海军指挥控制系统。 1980年代,信息检索技术开场应用在一些愈加高级的复杂系统中,如麻省理工学院的自动问答系统、杰伊科公司的自动内容摘要系统、优利国防系统公司的PUNDIT自然语言处理系统、南加州大学的Penn系统等。这些系统融合了信息检索、机器翻译、自然语言生成等技术,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内