语料与英语词典编撰溯源.doc
《语料与英语词典编撰溯源.doc》由会员分享,可在线阅读,更多相关《语料与英语词典编撰溯源.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、语料与英语词典编撰溯源中国人民大学外语学院 张卫平1张卫平,中国人民大学外语学院教授,研究领域:语言与文化,词典编撰;电话:010-(O) 许葵花2许葵花,中国人民大学外语学院讲师,研究领域:认知语言学,语料库语言学。通讯地址:中国人民大学外语学院,邮政编码:,联系电话:010-;电子邮件:xukuihua,xukuihua。提 要:语料与词典编撰息息相关。词典编撰经历了词典语料、先电子语料和电子语料三个阶段。语料从词典编撰的后台走到前台,与其的依附关系变成了引领关系。基于电子语料库的英语词典编撰已蔚然成风。电子语料库使词典编撰进入一个新时代,改变了词典编撰原则、形式、时间等,使其更具有科学性
2、和时效性。关键词:语料 英语词典编撰在词典学的历史中,语料一直起着很重要的作用。词典的编撰必须要有语料来源。那么,什么是语料呢?根据韦伯斯特大学词典的定义,语料是知识体或知识的汇集,尤其是作为描述性语言分析基础的在录话语收集。在牛津高级学习者词典中,语料是指用于研究的材料汇集(例如,对于语言学家来说,语料就是口语及书面语的用法汇集)。在郎曼语言教学和应用语言学词典中,语料被定义为用于特殊目的的材料集合。例如,用于分析、比较的一套教材或用于分析语言学特征的例句或话语范例。韦伯斯特大学词典强调了口语语料的重要性。郎曼语言教学和应用语言学词典和牛津高级学习者词典的释义具有普遍意义。一般来说,语料是指
3、用于任何研究的语言材料集合。例如手工记录语料、词典、文本以及计算机出现后的电子语料库。语料尤其广泛地应用于各种语言研究中,当然也包括词典编撰。英语词典编撰与语料息息相关。在英语词典编撰的初期,语料就以这样或那样的形式存在着。英语词典编撰的最初语料来源是词典版本。在词典编撰历史中,这一阶段的语料摄取方法被戏称为“掠夺”。由Robert Cawdrey编定并于1604年出版的第一部英语词典词汇表(A Table Alphabeticall)囊括了 Edmund Coote 的英语学校通(English School Master)一本带有简略意义的语法祈祷书90%的内容,它另有三千词条来源于Tho
4、mas Thomas的拉英双语词典( Dictionarium Linguae et Anglicanae)。而之后, 1616年John Bulloka的英语讲解(An English Expositor)又挪用了Cawdrey 和Thomas词典中的许多词。1623年Henry Cockeram的英语词典(The English Dictionarie)或叫做英语难词解析(An Interpreter of Hard English Words)无情地抄袭了 Bullokar的词序表和定义并把 Cawdrey 词典中Bullokar忽视的部分全部抄过来。反过来,作为一种公平竞争, Bull
5、okar 1663版的词典又囊括了Cockeram 的百科词条;而Cockeram在他的下一版中从 Bullokar词典中抄取了更多。1656年Thomas Blount的词汇注释表(Glossographia)多半来源于 Thomas的词典和 Holyoke的词源词典(Dictionarium Etymologicum)。两年后Edward Philips的英语词汇新世界(The New World of English Words)又与 Blount 的版本相似。之后,该词典被Stephen Skinner大量借用编定了英语词源( Etymologicon Linguae-anglarae
6、)。另一部在Philips词典基础上编定又大大扩充的是1676年Elisha Coles的英语词典(An English Dictionary)。这种以现有词典为蓝本的词典编撰是由当时的英语语言状况所决定的。十七世纪,在文艺复兴的影响下,古典语言拉丁语在词典编撰中倍受青睐,英语词典编撰也遵循了难词传统。这一方面是词典编撰家出于对英语词汇量少,描写匮乏的考虑;另一方面是词典编撰者们为知识而知识的学究至上主义。再者,古典拉丁语语词丰富,可以提供了英语中没有的描述用词,因此成为英语词典编撰家们借用的主要来源。大量拉丁语中的难词被引进英语土语中并英语化,成为现代英语语汇的一部分。例如,Cockeram
7、词典中abequitate, bullulcitate和sullevation等都是从拉丁语借来的。难词传统的另一个体现是收录陈旧的老词。例如,Coles的词典收录了几千个Chaucer时期的老词。同时,词典中的词条除了定义还有词源标注,兼或有百科知识类材料的收录。这也是这一时期的特色。英语词典的编排也大体上仿照了拉丁语词典的模式。英语词典收词量也不断扩大。最初,Cawdrey的词典收词仅3000条,十多年后,Bullokar的词典收词大约是他的两倍,而之后Edward Philips的词典收词量突破10,000,共有11,000词。而在不久之后的七十年代,Elisha Coles的词典收词量
8、又翻了一番还多,收有25,000词。到了十八世纪早期,词典编撰的主要语料来源很多还是词典版本。但这时“难词”传统最终让位给了“普通用词”。词典是为广大普通读者服务的。因此,这一时期John Kersay 的新英语词典(1702)及其修订版,还有后来Nathan Bailey 的全球英语词源词典在参考多部词典的基础上都注重普通用词的选录。这一时期收录词最高达48,000个词条。1755年Johnson的煌煌巨作英语词典出版。Johnson的词典一方面当然也得益于其他的词典。他尤其提到了Bailey, Philips和 Ainsworth ;另一方面,由于这一阶段词典编撰还一直受规约主义的影响,他
9、的词例来源颇为考究,广泛引经据典引用过去和当时最伟大作家的作品,唯名家是尊。名家作品成为他的词典的语料来源之一。这在当时语言使用混乱的情况下起到了规范语言的作用。他的词典被看作是标准语言的典范。随着英语的不断传播和发展,英语的区域性发展越来越得到使用者们的重视。到了十九世纪,Webster 的简明英语词典(A Compendious Dictionary of the English Language)和之后的美国英语词典收录了很多在美国形成或使用的词和定义。他把美国英语视作一种独立的语言,与英国英语不同,有自己独特的特点。因此,他的词典语料来源就有很多是美国本土收录的真实语言。而同时久赋盛名
10、的牛津英语词典虽然从历时角度编撰,其语料的收集堪称艰苦。五百万的引证收集工作经历了二十年(18581881),然后进行分检,再由编辑分析、定义、收录具有代表性的例证。正如希腊格言所说“一本大部头的书就是一个恶魔。”词典编撰中语料的收集、汇编更是“苦之又苦,枯燥之又枯燥”。但这也并不是说所有的语料都可以收入到词典中。词典编撰在这一时期还具有个人倾向性。由于编撰牛津词典的是一个由上层社会通晓数门知识的学者组成的集团军,商业和工业用词由于不合他们的口味而未被采用。美国本土语言当然也未受重视。二十世纪,随着人们对语料的不断重视,出现了专门的真实语言语料收集库先电子语料库。第一个现代、大规模英语语料库是
11、Edward L. Thorndike的450万词的词表。词表在1921年作为教师词汇用书出版,后达到18,000,000词,由此出版了教师词汇用书30,000词。它的语料来源于杂志和青少年读物。另一个具有一定规模的语料库是 Ernest Horn于1926年出版的基础写作词汇:10,000常用词,它的语料来源主要是出版的或未出版的私人信件。到了二十世纪三十年代,语料的研究又有了提高。真实语言备受重视,词典的形式也多样化。例如,Harold Palmer, Michael West 和Lawrence Faucett在 A.S.Horby 的帮助下出版的词汇选择临时报告(The Interim
12、 Report on Vocabulary Selection )就考虑了Thorndike 词汇研究中忽略的语法功能和意义。而随后,Michael West 在他人研究基础上,在他的通用英语词汇一览表(A General Service List of English Words)中增添了语义的使用频率。这对于词典编撰中的语料研究有着举足轻重的作用。到了四、五十年代,又有了 Charles C.对词汇用法的语料研究。他的美国英语语法( American English Grammar )(1940)是对几千封书信文体研究的成果。他的另一部出版于1952年的英语结构:英语句式建构简介(The
13、Structure of English: an Introduction to the Construction of English Sentences)则来源于对电话谈话记录的分析研究。在先电子语料时期,词典编撰家们通过对真实语料的分析研究,丰富了对词汇的研究。在过去,词典编撰家单纯注重词义和词源,在他们的研究中又增添了多种意义分类、词频、义频及用法等各项,把词典的词汇意义学习功能扩大到帮助学习者掌握词汇用法的层次上。但限于当时有限的科技条件,语料的收集、统计、分析也是小范围、单一的。而在此基础上出版的词典也是小型的。七十年代以后,计算机的使用使词典编撰进入了一个崭新的阶段电子化时期。1
14、970年在多伦多就有了为“古英语词典”课题而设立的古英语电子文本检索系统。自1980年以来,它就以缩影单片的形式供人们使用。第一个具有代表性的基于计算机的语料库是布朗语料库。作为电子语料库第一代,收词量为1,000,000。尽管美国词典出版公司不久意识到了它的价值并要求购买,但它对词典编撰的方法没有即时的影响。之后,它与Quirk 和Svartvik的伦敦-隆德口语语料库和LOB 语料库共同做为现代英语语法的基础。从年代早期到中期,计算机更广泛地得到运用。但中心计算机(main frame computer)的不菲价格及庞大的体积使词典编撰者们不能够在家中工作。这也阻碍了词典编撰。随着计算机技
15、术的进一步发展,大量电子文本出现,较经济地储存大量数据也成为可能;检索软件的大大提高又加快了信息存取的过程,也使许多复杂的语言分析工具诸如组织搭配、搜索和语法附码等得到应用。除此之外,普通的个人电脑如今不仅以百万字节衡量而且以十亿字节衡量,不久可能就会出现太(拉)字节。语料库的发展使语言有了前所未有的实证研究的基础,这势必带动与之息息相关的词典编撰的变化。“如果不建立在语料库研究的基础上,没有什么新的、重要的本族语言亦或是外语学习者词典能够希望得到重视。“(Sidney,2001)为此,目的为编定新的外语学习者高级词典Collins-COBUILD英语语言词典的COBUILD课题在1980年启
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料 英语词典 编撰 溯源
限制150内