语料库驱动下的外语在线自主学习模式.pdf
网络外语教育研究语料库驱动下的外语在线自主学习模式梁红梅,尹晓霞,李宇庄,叶邵宁(华南农业大学 外国语学院,广东广州 510642)摘 要:语料库驱动下的外语在线自主学习模式是指通过词汇或语法结构、语料库和语料库索引工具提供的语境共现、语料库的文本展现(部分有音频或有音和视频)、网络互动的有机结合为学习者提供自下而上(bottom2up)语言学习环境,从而促进学习者对外语的自主和协作学习。本文探讨了提出该模式的现实背景及其理论基础,介绍了适合大学英语学习者自主学习的多样化语料库的开发和应用,着重介绍了教材语料的词性和语法标注及包含文本、音频(和视频)语料和检索工具的多媒体语料库的构建和应用。关键词:语料库;自下而上;在线自主学习中图分类号:H319.3文献标识码:A文章编号:100125795(2005)062002920004 语料库驱动下的外语在线自主学习模式是指通过词汇或语法结构、语料库和语料库索引工具提供的语境共现、语料库的文本展现(部分有音频或同时有音、视频)、网络互动的有机结合为外语学习者提供自下而上(bottom2up)语言学习环境,从而促进学习者对外语的自主和互动学习。适合学习者多样化的语料库建立和其结合的网络互动技术的应用能改变单纯依靠教材进行外语教学的被动局面,解决了语言学习材料的真实性和多元化问题,适应立体化、网络化、个性化外语教学和学习的实际需要,使外语教学朝着个性化学习、不受时间和地点限制的学习、主动式学习方向发展。同时语料库和语料库索引工具提供的语境共现能提供语言项目(如一个单词、短语、语法结构)真实使用的多种语境;大量真实使用例子的提供可促进学习者对语言更好的理解;外语学习者通过不断增加的实例接触进行语境推测,自己发现语言使用的规则,解决语言直觉欠缺这一瓶颈问题。把语料库索引和多媒体课件的开发有机地结合起来,更能发挥语料库的强大优势,促进其在外语教学中的普及。本文将围绕以下几个方面展开探讨和研究:(1)该模式提出的现实背景及其理论基础;(2)适合大学英语学习者自主学习的多样化语料库构建的框架、分类原则及语料收录的原则、方法和途径,不同类型语料的标注原则和方法(特别是教材语料的词性和语法标注);(3)包含文本、音频(和视频)语料和检索工具的多媒体语料库的开发和应用;(4)实现语料库校园网的在线索引,学生通过多种类型的语料库及BBS进行英语语言独立或互动的自主学习。1 模式提出的现实背景和理论基础1.1 模式提出的现实背景近20年来,随着计算机和网络技术飞速发展,面向各种目的和用途的不同类型和种类的语料库应运而生,它们在开展语言学各个层面的理论和应用研究、词典和教材的编撰等方面发挥了越来越重要的作用。但因受建库目的和最终用户类型等因素的影响,目前除作者简介:梁红梅(19712)女,讲师,硕士。研究方向:应用语言学及语料库语言学。尹晓霞(19692)女,副教授。研究方向:应用语言学及二语习得。李宇庄(19702)女,讲师。研究方向:理论语言学。叶邵宁(19622)女,副教授。研究方向:应用语言学。收稿日期:200520621792第106期2005年12月外语电化教学CAFLENo.106Dec.2005少数几个公开发行的大型网上语料库(如Bank of Eng2lish、British National Corpus2BNC)或 光 盘 语 料 库(I CAME发行的LLC、COLT),大部分已建成的语料库也常常只是小群体的语料库研究者从事语言研究的工具。研究如何把这种先进且功能强大的工具有效地运用到外语教学是语料库语言学未来发展之所需。教育部新颁布的大学英语课程教学要求 明确提出要采用基于计算机和课堂的英语多媒体新教学模式来改进传统的以教师讲授为主的单一课堂教学模式;要求 强调课程的设置要体现以学生为中心的原则,新的模式“应以现代信息技术为支撑,特别是网络技术,使英语教学朝着个性化学习、不受时间和地点限制的学习、主动式学习方向发展”。要满足这些要求,须开发适合大学英语学习者的多样化的语料库。建立适合大学英语学习者自主学习的多样化语料库将成为大学英语教学改革及语料库语言学领域的重要课题。近年来,语料库索引工具的资源共享使得语料库作为一种先进的学习工具和产品资源在外语教学领域的推广和普及成为可能。1.2 理论基础语料库驱动下的外语在线自主学习模式的提出得益于近代语言学和外语教学领域多种理论的启发,如图式理论、数据驱动学习、外语自主学习(self2accesslanguage learning)理论、语言学习认知法、克拉申的可理解输入理论等。本文着重介绍图式理论和数据驱动学习理论。图式理论模式(the schema theory model)也可称为相互作用模式(the interactive model)。图式理论模式认为:人的头脑里有许多的图式;在语言的学习过程中,人们总是同时运用由下而上的图式启动方式(bottom2up)和由上而下的图式启动方式(top2down);一个人大脑的图式越多,越完善,在语言学习时被调用的可能性就越大,就越有可能保证对语言项目的牢固掌握。在课堂教学和自主学习中,大学学习者对外语的接触可能采取以下两种模式(见图1),但通常采用图1 学生接触语言的两种模式的是自上而下的模式。语料库和语料库索引工具提供的语境共现为学习者提供自下而上的学习模式。根据图式理论,孤立地使用任一模式都不能达到最佳效果,只有把两种模式有机地结合起来才能提高学生的语言能力。开发出MCO语料库索引工具的Johns(1991)提出基于语料库索引的数据驱动学习(DDL,data2drivenlearning;本 文 也用 语 料 库 驱 动 学 习,corpus2drivenlearning来表示)。Johns指出“每个学习者都是福尔摩斯”,学习者通过语料库索引提供的大量的语境共现自己发现和总结语言的使用规律,他们在学习中扮演着“研究者”的角色 提出自己的假设,并通过语料数据的分析检验和修正自己的假设。因此语言的学习不再被视为教师对学生进行单纯的知识讲解和传授,教师的主要任务就是为学习者创设使用语言的环境。2 适合大学英语学习者自主学习的多样化语料库的开发和应用2.1 语料库构建的框架、分类原则及语料收录的原则、方法和途径通过对学生进行问卷调查,根据学生的反馈意见及语料是否可以通过网络资源和发行的光盘直接获取决定语料库的构建框架;同时参照BNC,LLC等大型通用语料库的标准进行语体(口语和书面语)分类,然后再以“语域为主,来源兼顾”的原则进行细分。根据“适合大学英语自主学习的语料要体现知识性、趣味性、教育性;语料库应能不断扩展和更新,体现时效性”的原则决定语料的录入与否。通过参考先前相关文献、互联网关键词搜索及课题组成员和学生推荐等多种方式的利用获取语料的收集方法和途径。2.2 不同类型语料的标注原则和方法我们参照大型通用语料库的标注方式和方法以及学生的实际需求对语料进行标注。用COCOA标注系统HEADERS的格式对大部分语料进行文本基本信息的标注,对教材类(主要为大学英语精读或综合教程)语料我们利用UCREL提供的Claws4的free CLAWSWWW trial service进行了词性的标注,同时还用En2gCG Parser的在线试用服务(http:/www.lingsoft.fi/cgi2bin/engcg)进行了语法标注。2.3 多样化语料库的应用将语料收集的方法和途径及语料的标注规范授予学生,同时将制作多媒体语料库的工具交给他们,邀请他们参与语料的收集和语料库的构建。让学生在教师03梁红梅,等:语料库驱动下的外语在线自主学习模式的指导下一边创建语料库,一边进行有意义的语言实践活动。建立语料库在线索引互动网络平台,实现基于语料库索引的数据驱动学习(DDL)和外语自主学习(SALL)。如通过词语索引可以开发出实时词汇练习、同义词比较、搭配词组练习等;针对语篇中词汇的语境共现制作基于语料库索引的交互式练习,再结合动态超文本(DHT ML)格式转换为可在网上传递的课件,供远程课堂或局域网网络教室使用;通过前端语料库索引插件(TACT WEB)与放置在服务器上的语料库相连,实现网络用户对语料库的直接访问和索引;把四、六级的重点和难点词汇、短语、语法进行归类放上网站,网站同时设学生疑难点提出及解答板块。在定位索引工具的帮助下,学生通过多种类型的语料库及BBS进行英语语言独立或互动的自主学习(图2,3)。图2 多样化语料库构建的基本框架口语对话电影电视脚本访谈、论坛(CNN和Conversationswith history)Childes提供的儿童和成人口语库 独白演讲CNN的新闻、政论节目VOA特别节目书面大学英语系列教材配中文译文和多媒体光盘中外大学生优秀作文集、范文四、六级试题库 英文名著3000北京大学出版社和 英文世界名著1000复旦大学出版社Wordpilot提供的儿童文学库及各种实用文体库 图3 纯文本语料库的构建内容3 多媒体语料库的开发和应用把语料库索引与文本、音频、视频有机地结合起来(图5),建立多功能的多媒体语料库更能满足我国大学英语学习者的实际需求。目前我们运用ab project(一个由华南师范大学开发、运行于中文W I NDOWS95/98/2000/xp操作系统上的应用软件,能整合音频、图5 多媒体语料库的应用流程视频等多媒体等要素与中英文语料,并能把以文本国标码(GB码)形式存在的语料库文件中的词语或句子的出现频率、上下文语境,以列表的形式显示出来,显示出来的检索项最多可达到7000条,并有中文英文双语显示、文件批处理、多种样式的关键词查找、统计、分类、删除、存盘、打印、设置参数等功能),围绕目前正在使用的大学英语主教材,如 全新版大学英语 、新视野大学英语,开发和建立以主教程课文主题为线索的多媒体话语资源语料库,并以教育部推荐的教材分级标准、Longman的词频表、大学英语课程学习词表和Words mith Tools提供的数据(词长、句长、类符形符比等)作为参照,按难度将语料分级、分类;构建内容主要来源于电影、电视节目、网络上的如Conversations withhistory,CNN访谈和论坛节目以及如VOA、BBC等网络广播节目构建多媒体语料库。4 结语事物的发展总是相辅相成的。当今,多媒体计算机和网络技术的飞速发展和普及给中国的大学英语教学改革带来了契机;同时“中国的大学英语教学改革也为计算机辅助外语教学的发展提供了重要的契机和良好的环境”。在“大学英语教学改革”的号召下语料库作为一种先进的学习工具和产品资源在大学英语教学领域,特别是自主学习板块的普及将受到我国外语教学界和语料库语言学界的重视。参考文献1 Joint Policy Statements of CAL I CO,EUROCALL,AND13梁红梅,等:语料库驱动下的外语在线自主学习模式I ALLT Arising from a Research Seminar at theUniversity ofEssen,Ger many 30 April21 May 1999 Scholarly activitiesin computer2assisted language learning:development,ped2agogical innovations,and research EB/OL.http:/cali2co.org/CALL_document.html Accessed 28 May 2004.2Greaves,C.Resource2Assisted Learning:a vocabulary on2demand model for WWW online learning EB/OL.ht2tp:/.hk/studyguide/ralearn/fullPaper.htmAccessed 28 May 2004.3Greaves,C.Resource2Assisted Learning:using computersto study language EB/OL.http:/.hk/studyguide/Computers.htmAccessed 28 May 2004.4Johns,T.F.Should you be persuaded t wo samples ofdata2driven learning materialsA.In T.F.Johns&P.King(Eds.),Classroom concordancing J (English Lan2guage Research Journal 4;pp.1-13).Birmingham,UK:Bir mingham University,1991.5Johns,T.F.Data2driven learning:An update Z.TELL&CALL,1993,(2):4-10.6Johns,T.F.From printout to handout:Grammar and vo2cabulary teaching in the context of data2driven learning Z.In T.Odlin(Ed.),Approaches to pedagogic grammar.Cambridge,UK:Cambridge University Press,1994.293-313.7Johns,T.F.VirtualDDL Library EB/OL.http:/sun1.bham.ac.uk/johnstf/ddl_lib.htm.8 温志军,胡瑰玲.开发利用世界上最大的儿童语料库 CH I LDESJ.外语教学与研究,2001,9.9 谢家成.论个人教学语料库的构建J.外语电化教学,2003,6:27-30.Corpus2driven Self2access EFL Online LearningModelL IANG Hong2m ei,YIN Xiao2xia,L I Yu2zhuang,YE Shao2ning(College of Foreign Languages,South China AgriculturalUniversity,Guangzhou 510642,China)Abstract:Corpus2driven Self2access EFL Online Learning is a strategy and modelwhich involves the dynamic inte2gration of vocabulary/grammatical structure,concordancing provided by the use of corpora and corpus tools,view of text(some with audio streaming or video streaming),and cyber2interaction to provide a bottom2up learning environment inwhich learners are encouraged and expected to learn a foreign language independently and/or collaboratively.This paperdiscusses the practical background and theoretical basis for advancing such a model.The techniques and principles forthe development and application of diversified corpora for College EFL self2access learning are also discussed and withparticular reference to the tagging and parsing of the textbook corpus and the integration of text,audio(and video)andconcordance searches for language learning.Key words:Corpus;Bottom2up;Self2access EFL Online Learning欢迎订阅2006年 外语研究 本刊是中国外国语类核心期刊,以英语为主,兼顾俄语、日语,设有现代语言学研究、翻译研究、外语教学研究、外国文学研究、书评等栏目。本刊为双月刊,逢双月15日出版,每册定价6元,全年定价36元。全国各地邮局均可订阅。邮发代号:282279。23梁红梅,等:语料库驱动下的外语在线自主学习模式