语料库驱动的短语学研究探析,普通语言学论文.docx
语料库驱动的短语学研究探析,普通语言学论文摘 要: 语言哲学的一个主要议题是对意义的研究, 语料库语言学以为意义蕴含于语言使用之中, 在意义解读中必须考虑词语所出现的语境。在哲学研究中理性主义强调逻辑推理的作用, 而经历体验主义以为构建理论应建立在客观事实的基础上。语料库驱动的短语学研究关注对真实语料的考察, 探寻求索语言使用中的意义单位。意义单位一般由具有确定意义的短语来实现, 短语被视为词汇和语法的界面。在语料库语言学的研究框架中, 意义单位是词汇和语法共选关系的具体表现出, 形式和意义是密不可分的整体。 本文关键词语: 短语学; 语料库; 哲学; 意义单位; Abstract: The study of meaning is one of the central issues in the philosophy of language.Corpus linguistics maintains that meaning lies in the use of language, and context should be taken into account in the interpretation of meaning.In philosophical study rationalism stresses the role of logical reasoning, while empiricism maintains that the construction of theory should be based on authentic facts.The corpus-driven study of phraseology observes the authentic data to explore the unit of meaning in language use.The unit of meaning is realized by the phrase with unambiguous meaning, and phrase is regarded as the interface between lexis and grammar.Under the framework of corpus linguistics, the unit of meaning reflects the co-selection of lexis and grammar, integrating form and meaning. Keyword: phraseology; corpus; philosophy; unit of meaning; 语言哲学对语言意义的关注来历已久, 意义的解读方式和哲学流派的发展有着深入渊源。20世纪以来语言哲学研究主要有三个形式, 一是以逻辑经历体验主义为代表的句法语义分析形式, 二是以言语行为理论为代表的语用学分析形式, 三是以乔姆斯基为代表的理想语法构造形式。随着句法分析形式走向衰落, 研究者愈来愈重视语言在使用中的意义。弗斯以为意义具体表现出于它在语言中的使用, 词语的意义不是封闭自足的, 词语意义会影响出现于同一语境的其他伙伴, 语境论根据语境因素考察语句的意义, 而不将意义研究囿于语言的逻辑关系1。语境论思想为后来的学者带来了深入的启示, 语料库语言学和计算机技术的迅速发展, 从根本上影响了语言研究的方式方法和理念, 改变了传统的语言研究范畴, 为讨论语言交际中的意义单位提供了崭新的视角。语料库语言学研究者通过分析真实语言数据, 抽象归纳出语言研究的重要理论。共选理论关注形式和意义的互选关系, 以为词语之间的共选形式具体表现出相应的意义, 某些句法构造经常和特定的意义有关。辛克莱通过观察大量数据对意义单位进行了详尽的阐述, 以为它是词汇和词汇、词汇和语法共选关系的具体表现出2。语料库研究支持形式和意义的整体性, 以为意义单位往往由整体性短语来实现。我们在研究语言时, 不能孤立地研究语言的形式, 而不考虑其意义和功能, 语言的意义、构造和功能是不可分割的整体。语料库驱动的短语学研究以为, 短语单位表示出了较为完好的意义, 是语法与词汇、语义和语用的界面, 这一视角为语言研究提供了新的范畴。 一、经历体验主义和理性主义之争 经历体验主义和理性主义是哲学领域中的两大理论阵营, 二者的分歧对语言学研究产生了深入影响。在认识的起源上, 理性主义强调理性和推理的作用, 以为具有普遍性的知识是先天的, 能够经过严密的逻辑推理而得到。经历体验主义则以为经历体验是一切知识的来源, 强调经历体验的作用以及大脑进行概括抽象的能力, 贬低理性认识的作用3。经历体验主义与理性主义之争浸透到人类的各个知识领域, 对语言哲学研究产生了直接影响, 各个流派在对意义的研究中采用了不同方式方法。在理性主义对意义的研究中, 人工语言学派注重对语言进行逻辑分析, 以为哲学的任务在于对自然语言进行人工分析, 由于语言的意义经常是含混不清的, 有必要进行形式化构造, 通过逻辑组合运算消除语言中的模糊因素。日常语言学派则遵循经历体验主义, 以为哲学的任务就是研究日常语言的用法, 语言运用中的错误在于人们不了解词语确实切涵义。 经历体验主义和理性主义作为哲学的两大主要理论框架, 它们的斗争和妥协伴随着语言学的整个发展历程, 对语言研究和意义解读产生了深入的影响。英国着名语言学家罗宾斯指出, 经历体验主义和理性主义的对立, 以不同的形式贯穿整个语言学历史 4。20世纪中叶以后, 语言学理论呈现多元化的发展特点, 但理性主义和经历体验主义仍然呈现对立的局面。以乔姆斯基为首的转化生成语法学派坚持理性主义, 以为人脑天生具有语言习得机制, 语言学家能够依靠自个的直觉来构建语言理论, 他们以为普通人的言语千差万别, 不能成为理想的研究对象。但生成语法有很多问题无法解决, 仅仅依靠直觉或内省数据来归纳理论无异于闭门造车, 而经历体验主义以为构建理论应建立在客观事实的基础上, 在研究中要尊重从生活中获得的真实语料。随着人类认识的发展和科技的进步, 经历体验主义学派和理性主义学派的观点也在互相浸透, 两者表现出既对立又统一的一面, 不再是非此即彼的关系。两种学讲一方面各自发展, 另一方面不断融合, 在研究视角上既有分歧又互相补充。语料库语言学研究遵循经历体验主义, 注重能够观察的真实数据, 但并不排除研究者在解读数据时对理性的依靠, 在对意义进行阐述时强调语言的意义存在于使用之中。 在研究方式方法上, 人类用于语言研究的方式方法大体上能够概括为两类:一类是自上而下, 另一类是自下而上。一般来讲, 上 指抽象的语言学理论, 下 指真实的语料数据。传统语言学研究多采用自上而下的方式方法, 根据预设的理论框架来确定研究步骤并搜集证据。语料库语言学则主要依靠自下而上的方式方法, 通过观察和处理数据来探寻求索理论问题。关于语言学的研究数据, 根据研究者的观察视角能够将数据分为三种类型:内省数据、诱导数据和观察数据5。传统语言学研究主要依靠内省数据, 研究者通过考虑语言经历体验构建理论, 研究的焦点是语言中的聚合关系, 将语法范畴作为语言描绘叙述的起点和重中之重。在这一研究范式中研究者依靠于本身的语言直觉, 数据由研究者自个提供, 经常因其缺乏客观性而遭到质疑。诱导数据主要指研究者通过实地调查所获得的数据, 如实验、问卷调查等方式方法, 这种数据在实验心理语言学研究中被广泛采用。但是, 它的缺乏之处在于调查往往花费大量时间和人力物力, 而且诱导数据有时不够真实自然。要想对语言进行科学系统的研究, 必须依靠大量实际语言使用中的语料, 也就是较为客观的观察数据。 观察数据主要指语言研究者作为观察者所收集的真实语言材料, 数据具有较强的客观性和代表性, 当下语料库研究者所普遍采用的数据属于观察数据。随着计算机技术的发展, 语料库规模不断扩大, 各种先进的检索软件相继问世, 语料库数据在语言研究中的地位愈加重要。语料库语言学一般采用自下而上的研究方式方法, 通过对真实语言数据的观察来抽象出语言研究的范畴和理论。在语料库语言学领域, 研究者对使用何种数据的态度也不尽一样, 一种观点主张语料库只是诸多数据中的一种, 能够和其他数据相互补充, 属于温和的经历体验主义, 而激进的经历体验主义以为一切数据都应该从语料库中提取。以辛克莱为代表的语料库语言学家反对在研究中使用内省数据, 以为语言研究应该建立在可验证的语料基础上, 提出要尊重语料库数据, 由于它们是语言使用的原材料2。辛克莱强调数据的大数量性, 以为只要通过对海量数据的观察才能得出可靠的结论。大型语料库能够提供频数、概率等统计信息, 我们能够通过观察语言的分布特点考察其核心用法, 传统研究中的一些理念会逐步被新的研究范畴所替代。 计算机技术的发展使我们能够快速获取大量数据, 通过在线检索大型语料库, 我们能够获得词语的统计信息和出现的语境。在大数据时代语言研究不能依靠直觉, 使用脱离语境的句子, 对语言进行系统的研究必须基于真实自然的语言数据。比方美国现代英语语料库COCA (Corpus of Contemporary American English) , 是当今世界上最大的在线英语语料库 () , 研究者和学习者能够免费使用, 它所提供的信息使学者能够从多维视角进行语言意义的探究和解读。随着语言研究的深切进入, 语言分析的自动化程度不断提高, 对于语言直觉的使用和依靠也在逐步减少。在语料库语言学视角下的意义研究中, 我们应该在文本之内寻求证据, 脱离了文本进行意义解读只能是舍本逐末。在构建理论时学者们要分析语料库所提供的真实数据, 根据文本本身构成的参照体系进行意义的解读, 不能脱离语境考察语言的形式, 要综合考虑语言的意义及实现的功能。 二、共选理论下意义与形式的关系 当代化技术的发展和大型语料库为语言研究提供了海量数据, 语料库软件能够快速处理各种数据, 研究者不再需要依靠内省数据来考察语言使用的特点。语料库语言学遵循经历体验主义的实证研究方式方法, 以为只要通过观察大量数据才能得到可靠的结论。在语料库研究中, 研究者根据从语料库中提取的相关语言材料, 分析语言的形式、意义和功能。语料库检索软件能够快速计算数据信息, 进而揭示语言的核心用法。对意义的研究不仅仅是语言哲学研究的核心议题, 也是语料库语言学所关注的焦点。关于形式和意义、语法和词汇的关系, 自索绪尔区分聚合和组合的概念后, 语言学界对二者孰轻孰重一直有不同观点。聚合轴强调语法关系的作用, 组合轴则关注词语的横向组合以及这些组合怎样实现意义。传统语言学重视聚合关系, 将语法置于语言研究的核心位置, 以为语言由语法与词汇两部分构成, 语法是语言构造的规则而词汇是构建语言的材料, 语法的地位高于词汇。传统语言学将语法和词汇、形式和意义割裂开来, 这种观点遭到后来学者的质疑。 语料库语言学的迅速发展使研究者开场重视组合关系, 通过先进的索引工具和从语料库提取的真实数据, 我们能够观察词语出现的语境, 分析典型的词语搭配和形式特征, 提取语料库中高频出现的短语。语境成为考察意义的重要因素, 语言的意义应该根据语境不同进行相应的解读, 意义不是一成不变的静止状态。在语言交际中, 多数情况下意义并非由孤立的单词来实现, 由多个单词组成的词项是语言沟通的基本单位。词项反映了词汇和语法的共选关系, 具体表现出出意义单位的短语取向。在辛克莱的研究体系中, 语言在横向与纵向上具有同等的意义潜势, 华而不实组合关系是最基础的关系, 主要表现为词语之间的共选关系。他强调形式和意义的对应关系, 以为两者之间从根本上讲并没有区别, 意义和句法是互相联络的 2, 语法和词汇之间没有泾渭分明的界线, 比方, enjoy后面接动词-ing形式, 这一描绘叙述既能够视为词汇特点可以以归纳为语法特征。除此之外, 形式和意义在实际使用中有密不可分的联络, 语言的构造和功能经常具有对应关系, 某个构造一般实现特定的功能。无论是词语、搭配还是语篇, 意义都存在于一定的形式之中。韩礼德以为, 词汇是最精致细密的语法, 词汇和语法处于同一个连续统, 都是构建意义的源泉, 两者是不可分割的整体6。在词汇和语法的连续统之间存在很多兼有词汇和语法特征的固定或半固定构造, 如多词单位、词汇短语、预制复合构造、词串、公式化序列等。固然这些术语名称各异, 但指的都是高度惯例化的词语组合。它们兼具词汇和语法特征, 一般具有较为完好的意义。在语料库语言学的研究体系中, 语言的形式与意义、构造与功能是统一的整体, 语言的意义在语言使用中得以具体表现出。 语料库研究者提出共选理论, 关注词汇与词汇、词汇与语法的共选关系, 以为形式和意义相互选择, 特定的句法构造经常和某些词语有关, 词与词之间的共选形式与意义直接相关2。语料库研究支持形式和意义的一体性, 以为意义单位由整体性短语来实现。在分析大型语料库提供的海量语料基础上, 霍斯顿和弗朗西斯提出用型式语法描绘叙述英语词汇和语法, 以为词语经常出如今特定的型式之中, 型式和意义没有泾渭分明的界线。在型式语法的框架下, 型式指与词语有对应关系并且能够具体表现出意义的构造, 某一型式一般映射着相应的意义, 具有一样型式的词语分享特定的语义特征7。通过观察语料库中的大量实例, 型式语法提取了语料库中高频出现的型式及其意义, 这些研究成果在外语学习中具有较强的实用性。型式语法推动了短语学研究的发展, 短语单位是意义和构造的界面, 我们在使用语言时选择的单位经常是高频短语, 如:to sum up, broadly speaking等, 这些短语作为一个整体直接提取, 具有意义的完好性和无歧义性。这一观点遭到心理语言学研究的支持, 霍伊提出词汇触发理论, 以为词汇是复杂的、系统的, 语法是词汇构造的产物8。在这一理论中, 搭配被视为构成语言自然性的关键因素, 搭配的产生和词汇触发有密切的关系, 语法和词汇选择都由触发控制, 人们根据头脑中的网络形式运用词语。根据词汇触发理论, 词汇的意义和词汇网络、词语搭配密切相关, 这里的词汇网络和共选理论的主张在本质上异曲同工。 在共选理论的视域下, 词语的选择会影响在同一语境内其他词的选择, 不仅对词语产生意义上的传染, 而且执行重要的语用功能。语料库语言学在意义解析的经过中, 发现某些词语会吸引具有类似特点的搭配词, 沾染上搭配词的态度意义进而构成特定的语义韵。语义韵通常分为三类:消极语义韵、中性语义韵和积极语义韵9。语义韵具体表现出了意义表征中的分享机制, 在一定情景现的词语不仅共享相邻伙伴的意义, 而且共同实现某种交际目的, 反映了讲话者对讲话内容的情感态度。语义韵拓展了意义研究的范畴, 是语料库语言学对意义研究的重要奉献, 它既考虑了语义特征又关注语用功能, 具体表现出了语言使用者对讲话对象的评价意义, 这一发现对外语教学带来了有益的借鉴, 在学习经过中学习者不能局限于把握词语的语义特点, 而且要了解词语搭配所传染的气氛, 恰当地实现特定话语目的。词汇和典型搭配词共同出现结为伙伴, 传达特定的意义和功能, 我们在储存和提取语言时, 一般以语言中的预制块件为单位, 这些短语在语言交际中具有重要功能, 影响语言产出的流利性、地道性等关键因素。 三、短语学视野下的意义研究 对语言意义的研究要牵涉多个方面和维度。利奇以为, 一个词汇通常具有七个方面的意义, 包括理性意义、内涵意义、社会意义、情感意义、反映意义、搭配意义、主题意义10。对语言意义的解释是一个复杂的现象, 我们在研究意义时要考虑多种因素。在对意义的研究中, 语料库语言学与其他语言学不同, 它不去寻求语言使用之外的理想语言, 也摒弃形式化算法和逻辑公式, 以为语言的意义只能用语言来描绘叙述。语言运用是一种社会行为, 语言在交际中呈现意义并在使用中产生各种关系, 比方词语的搭配关系或词类的共选关系, 能够讲意义具体表现出于多个词及其语法构造共选构成的短语之中。语料库研究者重视对文本的解读, 以为所有意义和知识都存在于文本之中, 无论是词语搭配还是多词序列组成的意义单位, 其意义都要通过所出现的语境来解释, 根据关联文本来证实, 因而话语的意义存在于文本内部, 不能依靠外部标准来解释或验证意义。 制约语言使用的主要因素是语法规则和词汇选择。辛克莱提出英语词汇选择的两大规则:开放选择原则和习语原则2。开放选择原则以为语篇构成是大量复杂选择的结果, 语言使用者通过语法规则来构造语言。习语原则指语言使用者把握大量预制短语, 它表示清楚语言使用的短语倾向, 以为词语通过组合在详细的语境中获得确定的意义。词语意义确实立往往依靠于在使用中与其他词语的共现, 即词语只要处于一定的语境中才能消除歧义, 因而对意义的研究不能脱离语境。由词语搭配或多词序列构成的意义单位, 在解读中必须通过所出现的语境及关联文本。意义单位是文本中最小的、单义性的、无歧义的单位, 而单义性是意义单位的基本属性11。意义单位是具有构造形式的 词项 , 词项能够是单个词、复合词、短语甚至习语, 以词项为单位更有利于意义研究。在语料库语言学研究中, 文本是意义的唯一来源, 我们无法通过任何外部的标准来确定意义。语言学研究的主要对象是实际的文本或对文本的解释, 对作者意图的解读只能通过对文本的分析来进行。因而, 所有的语言事实和对意义的解释都存在于文本之中。 如上文所述, 对语言意义的研究应基于语言内部证据, 根据文本包含的语境信息进行释义, 我们无法在语言之外寻求意义的逻辑分析。在短语学对意义单位的研究中, 能够采用语料库语言学方式方法分析下面内容:词语搭配选择, 类连接选择, 语义趋向分析和语义韵分析。搭配选择指词语的共选关系, 类连接属于语法的共选关系, 语义趋向考察词语的语义特征, 语义韵则关注讲话者的态度、评价及功能的实现。这一研究方式方法兼顾横向的组合关系和纵向的聚合关系, 将语言的意义和功能结合起来。在传统的意义研究中, 研究者主要分析单个词语的意义, 而在语料库研究中意义单位经常由短语来实现。语言使用中很多短语倾向于在特定语境内高频出现, 反映了使用者的态度或评价意义。我们以idea为例, 观察下面例子来归纳它所构成的意义单位: 1) without the faintest idea 2) I didn t have the faintest idea 3) didn t seem to have the slightest idea4) I haven t got the slightest idea 通过分析这些例子, 能够发现节点词左边常出现faintest、slightest这样的形容词。进一步观察可知, the faintest idea常出如今not have the faintest idea这一短语中。假如我们将the faintest idea视为搭配内核, 其左边高频出现的动词是have, 在语义上常和not这样具有否认含义的词语共现, 换言之, 它经常出如今 not have+名词 这一构造中, 表示出否认含义。我们能够把 do not have the faintest/slightest idea 当作一个扩展意义单位, 它兼具语法特征和语义信息。扩展意义单位是一个集形式、意义、功能于一体的概念, 不仅涵盖详细的词汇与语法特点, 也包括讲话人的意图与态度。语料库驱动的短语学研究表示清楚, 语言的意义和形式不可分离, 无论是语言研究还是二语习得, 在对意义进行分析时都要考察词语的语境, 关注词语构成的高频短语。 语料库研究方式方法挑战了以前的语言理论和范式, 对传统的语法范畴提出质疑, 以为词汇和语法、构造和意义之间没有截然界线, 词汇和语法相互选择, 构造和意义互为映射。由于意义单位经常由半固定短语实现, 储存大量常用的短语是地道流畅表示出的关键。高频短语具有重要的语用功能, 比方组织语篇、维持社交关系, 它们具有较为完好的意义, 能够作为现成的构造整体提取, 有助于提高语言输出的自然性和流利性, 因而在外语教学中应将常用短语置于核心位置。老师和学生通过提取索引行, 观察词语的搭配、类连接以及语义特点, 结合语境归纳词语所在的意义单位, 这种以学习者为中心的探寻求索式学习形式能够提高学生的语言分析水平。短语学研究成果不仅能够应用于外语教学, 也为翻译研究提供了有益借鉴。意义单位模型的构建对翻译对等关系的探寻求索具有极高的参考价值, 研究者能够基于平行语料库的证据来考察翻译中的对等单位。在关于翻译对等的研究中, 我们不能只关注词语对等, 还要考虑搭配、语义趋向和语义韵方面的和谐关系12。语料库研究表示清楚, 节点词倾向于与具有特定语义特征的词语共现, 构成的常用短语反映了讲话者的情感态度, 对语言的交际效果产生很大影响。在翻译活动中选择对等单位时应考虑到词语的语义气氛, 考察词语的语境信息及构成的高频短语, 尽量避免原文和译文的语义韵冲突, 力图两种语言在意义的表示出和功能的实现上较为一致。 四、结束语 语料库语言学遵循哲学领域中经历体验主义的研究道路, 采用自下而上的研究方式方法, 在研究中以大量自然发生的数据为基础, 通过对真实语言数据的观察来抽象出语言研究的范畴和理论。语料库语言学研究表示清楚词汇和语法是不可分割的整体, 形式和意义相互映射, 在语言使用中人们一般以整体性短语为意义单位。语料库语言学重视对文本的解读, 以为对意义的研究不能脱离语境, 意义在详细使用中得到具体表现出, 语义和功能被视为表示出意义的连续体。在语料库驱动的短语学研究框架下, 我们能够从词语的搭配、类连接、语义趋向和语义韵方面分析语言使用中的意义单位, 意义单位反响了词汇和词汇、词汇和语法的共选关系, 经常由固定或半固定短语实现。在共选理论视域下, 短语单位具体表现出了意义和构造的映射关系, 是词汇和语法、语义和语用的界面。短语学研究表示清楚把握大量短语能够提高语言表示出的地道性和流畅性, 二语学习者储存丰富的短语有助于成功实现交际目的。语料库语言学以其可靠的研究方式方法和数据, 在对意义的解读中提出了新的研究范式, 推动了短语学的发展, 丰富和开拓了语言学研究的视野。 以下为参考文献: 1Firth, J.R.Papers in Linguistics:1934-1951M.London:Oxford University Press, 1957. 2Sinclair, J.Trust the TextM.London:Routledge, 2004. 3陈勇.论经历体验主义和理性主义之争 关于西方语言学研究中的认识论J.外语学刊, 2003 (3) :57-62. 4罗宾斯.简明语言学史M.许德宝, 等译.北京:中国社会科学出版社, 1997. 5Widdowson, H.The limitations of linguistics appliedJ.Applied Linguistics, 2000 (1) :3-25. 6Halliday, M.A.K.An Introduction to Functional GrammarM.London:Arnold, 1994:15. 7Hunston, S. Francis, G.Pattern Grammar:A Corpus-Driven Approach to the Lexical Grammar of EnglishM.Amsterdam:Benjamins, 2000:252-253. 8Hoey, M.Lexical PrimingM.London and New York:Routledge, 2005. 9Stubbs, M.Text and Corpus AnalysisM.Oxford:Blackwell Publishers, 1996. 10Leech, G.SemanticsM.Harmondsworth:The Penguin Group, 1974. 11Teubert, W.Writing, hermeneutics and corpus linguisticsM/W, Teubert R, Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics.London and New York:Routledge, 2007:134-159. 12陆军、卫乃兴.扩展意义单位模型下的英汉翻译对等型式构成研究J.外语教学与研究, 2020 (3) :424-436.