会议口译研究中的观察法和实验法6799.docx
Obseervaatioonall sttudiies andd exxperrimeentaal sstuddiess inn thhe iinveestiigattionn off coonfeerennce intterpprettinggTargget 10:1 (69-93), 119988Trannslaatedd byy HUUANGG Caan黄璨璨会议口译译研究中中的观察察性研究究和实验验性研究究 鸣谢:本文原文“Observational Studies and Experimental Studies in the Investigation of Conference Interpreting”发表在Target 10卷1期,6993页,1998年。此翻译的发表已经获得原文出版社John Benjamins 出版公司和作者本人的批准。(原著)Daniel GileESITT, UUnivverssitéé Paariss 3 Sorrbonnne-Nouuvellle, Paariss (uppdatted)摘要:会会议口译译研究中中,实证证研究可可以分为观观察性研究和和实验性性研究。观察性性研究可可用于探探索、分析析和假设设检验,它它可以是是互动式式,也可可以是非互互动式。实验性研究传传统用于于假设检检验,但但也可用用于探索索。上述述两种研研究在方方法论上上的困难难都与效效度、代代表性和和量化有有关。在在现阶段段,对口口译研究究贡献最最大的要要算观察察性研究究。简单单的描述述性统计计和数据据的定量量处理仍仍能发挥挥重要作作用。1 引言随着翻译译研究发发展为一一门(跨跨)学科科(Snnelll-Hoornbby,PPöchhhackker andd Kaainddl 119944, WWilsss 119966),翻翻译研究究的方式也从从主要为为哲学和规定定性的方方式转向向调查的的形式,这这些形式式更加遵遵守成熟熟学科的研研究规范范(见HHolmmes, Laambeert 和 vvan denn Brroecck 119788, TTourry 119955)。 同时时,有了了更多的的实证研研究,与与论文形形式的探探讨相对对。例如TTirkkkonnen-Connditt 一直直在这方面努力力(Tiirkkkoneen-CConddit 和 CConddit 19889, Tirrkkoonenn-Coondiit 119911, TTirkkkonnen-Connditt 和 Lafffliing119933),又又如德国国研究者者带头研研究了有有声思维维法(见见Kriingss 19986, Löörsccherr 19986, Kööniggs 119877, KKiraaly 19995, Willss 19996) 也也可见收收集在MMetaa 411:1 (19996)中和Séguiinott19889的论论文。虽虽然这一一学科渐渐趋成熟熟,但在在方法论论上仍相相当薄弱弱,Toouryy19991,119955 对此此有所讨讨论。会会议口译译研究(以下简简称IRR)尚不成熟,并并且在其其定位和和发展上上面临着着更多根根本的问题(GGilee 19995aa, GGambbierr 等 19997)。研究者在在做实证证性研究项项目前首首先要在在实验范范式和观观察范式式之间进行行选择。在IR中,现现在比较较倾向于于实验研研究,但但实验范范式可能能得不到到很多有有用的数据,甚甚至可能能导致很多多实证研研究项目目不能开开展,因因为那些些本来能能够也愿愿意做观观察性研究的的起步者者或学生生,可能能不愿意意做实验验性研究,或或者他们们会把实实验性研究做做砸了。本文即即探讨与与这一选选择有关关的方法法论问题题。2 定义理论研究究和实证证研究在在文献中有明显的区分。笼统统讲,前前者集中中在对观观点的思思考和分分析上;后者者集中在在对数据据的收集集和处理理上。这一区区分原则则上指的的是两个个相对范范式的不不同权重重,而不不是指存存在两个个不相关关的范式式,一个个范式忽忽视理论论,而另另一个忽忽视数据据。实证研究究可再细细分为两两大类:观察性性研究,也也叫自然性性研究,它指的的是在自自然发生生的环境境和现象象下进行行研究;另一类类是实验验性研究究,在这这一类研研究中,为为了研究究一些条条件和现现象,将特意制造造出这些条条件和现现象。本文把为为了其它目目的而创创造条件件和现象象的研究究定义为为观察性性研究。根据这这一定义义,课堂实实验如果果是以研研究为目目的而设设计则是是实验性性研究,而而如果是是以教诲为目的,并且事后后才以科科学的方方式去处理,则是观观察性研研究。与与其它分分类一样样,类属属的分界界有时比比较模糊糊。例如如,让笔译译员在一一个装有有摄像机机的房间间里工作,他他们的活活动被较较为精确确地记录录下来,这这样的研研究可以以看作是是观察性性研究,尽管他们的工作空间受到了控制。但如果限制他们翻译时能查阅的字典和文件,那这样的研究已足以被看成是实验性研究。然而,分类问题不会影响本文的讨论。要补充的的是在文学、历史研研究中,包括括以翻译为重点的的研究中,上述述分类是是不太有有价值的的,因为为这些研研究建立立在已有有数据上上,所以以几乎都都要求观观察性研研究(尽尽管文学学研究可可以设计计出实验验性设置置)。3 观察性研研究中的的基本方方式近几年来来,研究究方法变变得越来来越复杂杂。在社社会学、人种学学、人类类文化语语言学,政政治学等等中,观观察性研研究仍然然是主要要方式,但但是在其其它学科科特别是是在心理理学及其其相关学学科中,研研究方式式转向了了实验性性。结果果观察性性研究遭遭到打击击,现在在已倾向向于将观察察性研究究看成是是实验性性前的,甚甚至是前前科学性性的研究究:“探索活动动如果不不是实验验性的常常被剥夺夺被纳入入学科的的权利”(Meedawwar 19881:669)。在IRR中,经经过长期期的轶事事型、个个人经验验型、推推测型写写作,相相关研究究人员渴渴望IRR有一个个稳固的的科学地地位(AArjoona-Tseeng 19889, Mosser-Merrcerr 19991, Koondoo和 MMizuuno 19995)并并且他们们似乎对对科学声声望特别别敏感。这可能能增加实实验性研研究范式式的魅力力,况且且在认识识到实验验性研究究在认知知心理学学中的价值值后,它已经经变得尤尤为突出出(认知知心理学学几乎只只用实验验性范式式解释)。实验性方方式的垄垄断也许许会带来来危害效果果。多数科学学学科需要要一个描描述性的的基础(参 Beeauggrannd 119888:333, MMcBuurneey 119900:277)。 口译研研究中还还没有足足够的观观察数据据,Sttenzzl号召召应有更更多的描描述性研研究(119833:477),这这依然是热热门话题题。所以以对这些些即使不不包含假假设检验验的研究究,回顾顾它们作作为科学学探索的的合理性性十分重重要(参 Foouraastiié 19966:1344, MMiallareet 119844:255, GGrawwitzz 19986:4300)。3.1三三种模式式观察性研研究大致致有三种种模式:3.1.1探索索模式。探索在本文文中指的的是尝试试分析实实地的状状况与事事件,事先并不不打算得得出一个个具体的的观点,也也没有提提出明确确的问题题或是要要检验一一个明确确的假设设。实验验性研究究在这里里以其假设设检验的的多样性性而流行行也给探索索模式带来了了危害,因因为总是是听闻围围绕清晰晰假设的的研究是是科学工工作的必要要条件。这个观观点并不不适用于于所有社社会科学学(参Babbbiee 19992:91)。数学、医学和心理学的实例显示,理想的研究结果可以从探索模式中得来,但必须强调:a. 没没有清晰晰、明确确拟定的的假设并并不意味味着探索索是任意意进行的的,一些些预测总总会引导导研究者者;b.探索索项目可可以,而而且多数数情况下下确实引引出精确确假设及及其之后后的检验验。IR中的的一个探探索模式式的例子子是Frranzz Pöchhhackker(1995a, 1995b)对二十世纪八、九十年代口译研究成果所做的研究。Pöchhacker 收集已公布的资料,然后依照著者、学派、不同时期的演化进行分析,得出了一系列结论。他在进行研究前就没有明确的假设需要检验。3.1.2. 集中分析析模式。这个模模式指通通过分析析观察数数据,集中对对某个特别现现象的研研究。IIR中最最常用的的观察性性研究就就是这种种模式。例如,Thiéry(1975)向国际会议译员协会的48位被认定是真正的双语者的会员发出一份问卷,目的是要找出他们自身的、职业的和语言的癖好。稍近的一个例子是调查口译如何在一个军事法庭上影响参与者的角色(Morris 1989)。具体做法是分析从审判中得到的数据,然后看口译员的介入能否或是怎样改变法庭状况、参与者角色以及他们之间的互动。另一个最近的分析研究实例是Gile对他自己为一个医学会议翻译所做的专有名词的准备及其效果的个案研究(1989:Ch.14)3.1.3. 假设检检验模式式。这个个模式与与实验性性研究中中常用的的假设检检验相似似,也是是研究者者收集数数据,这这些数据据有可能能加强或或削弱对对一个特特别现象象的具体体假设。不同的的是,这这里的数数据从实实地观察察中而不不是实验验中得来来。明显显的局限限在于环境境因素是是已定的的,不能能控制,所所以风险险在于不不能控制制的各种种因素。口译研究究很少用用观察性性假设检检验。但但也有一一个例子子,是Shhlessingger的的硕士论论文,其其中她用用实地观察察数据来来检验如如下假设设:口译译把非常常文雅的的原语译译成更口语化化的目标标语,或或是把口口语化的的原语译译成非常常书面化化的目标标语。观察性研研究的方方法可以以很简单单。一般般来说,当当研究在在某领域域取得突突破时,观观察和分分析将变变得更加加精确,需需要更为为复杂的的工具和和方法。IR中,由由于此阶阶段实证证研究的的缺乏,方方法的复复杂性并并不能表表明其贡贡献的大大小:用用简单方方法仍能能发现口口译的许许多重要方面。但是,给给起步者者一个这这样的简简单项目目时,他他们常会会不情愿愿去做,并并野心勃勃勃地找寻更更大的项项目,而而一般他他们都难难以胜任任。3.2.互动式式观察研研究和非非互动式式观察研研究从方法论论上还可可做另一一个重要划分分:互动动式观察察研究与与非互动动式观察察研究。后者是是观察正正在发生生的状况况和现象象,被观观察者不不需要在在收集、分析和和评估数数据中发挥主主动作用用(这跟跟访谈、问卷方方式的研研究恰恰恰相反),而而观察者者在收集集数据时时也会尽尽量减少少干扰。(实际际上,总总可以说说有某种种程度的的互动:术语互动式式和非互动动式是简化化语,更更准确的的应是多一点点的互动动式和少一点点的互动动式,但这这说法又又不顺口口)。非互动动式或少一点点的互动动式研究的的一个实实例是SStroolz的的博士论论文(119922),依依据两个个口译员员对同一一演讲的的翻译记记录,她她对一些些假设进进行了检检验。两两个口译译员没有有参与数数据的收收集,他他们仅仅仅在职业业需要下下做自己己的工作作,提供供了语料料。类似似地,WWillliamms19995年年做的关关于口译译的畸形形压力研研究是分析一场场真实会议中的的原语文文本和译译入语文文本记录录。笔译和口口译中的的互动式观察察性研究究一般指指研究者者参与到到研究过过程中,或是是问卷、访谈中中,这必必将带来来一些风风险,包包括研究究者干涉涉研究,或或是研究究进程大大大影响响所研究究的现象象,或受受试者对对事实的的个人看看法、解解释和报报告对研研究形成成干涉。例如,TThieery的的问卷(见见上述)发发给了他他真正的的双语者者同事,同同时,这这些同事事又是TThieery的的竞争对手手。因为为在会议议口译圈圈中,语语言的分分类,特特别是真正的的双语者者的问题题是一个个敏感问问题,具具有具体体的职业业暗指,所以问卷问题会影响受访者的真实看法和回答,也会影响研究者分析解释这些回答,而这种影响又很难消除。对于Gile对会议准备的个案研究(1989),因为他清楚自己的译前准备有研究目的,所以这种意识很可能对他的译前准备产生影响。在观察自自己为会会议所作作的译前前准备的的例子中(前提提是这样样的译前前准备至至少如真实状状况下的的准备一一样被认真对待待),如如果已知知有偏见见或是强强烈地怀怀疑有偏偏见,那那么在讨讨论结果果时,可可以有效效地讨论论这些互互动可能能产生的的影响。但在其其它情况况下,很很难评估估可能产产生的影影响。另一个与与互动有有关的例例子是最最近一个个相当有有规模的的研究。这是关关于终端端用户对对口译员员期盼的的研究。此研究究建立在在口译员员对其用用户的访访谈上。尽管访访谈依据据了一份份仔细设设计的问问卷,但但其中一一些调查查结果的的效度和和代表性性仍旧受到置置疑,理理由如下下(更不不要谈访访谈采取取自愿原原则,受受访者接接到一份份书面的的指示,但但并未接接受训练练参见见Shiipmaan 119888:855):口译员员很可能能选择对对其友好好,或是是对他本本人或其其口译持持肯定态态度的用用户,而而不选那那些漠不不关心甚甚至持敌敌对态度度的用户户作为受受访者。访谈中中,受访访人知道道采访者者为口译译员,这这可能影影响回答答。因为口口译员在在此问题题上的主主观性,不不能排除除他在解解释这些些回答时时所持有有的偏见见。社会人类类学中,研研究者的的介入可可能影响响被观察察者的行行为,这这一风险险早已得得到承认认。过去去几年,众众多对笔译译员的TTAP(有有声思维维)研究究也必有有一种可可能,那那便是研研究中的的研究进进程和翻翻译进程程存在相相互作用用(见如如Touury 19991, Kirralyy 19995, Kuussmmaull 19995)。4. 实实验性研研究:统统计假设设检验对对比开放实实验式社会科学学中的实实验式研研究用得得最多的的模式是是统计假假设检验验。过程程是从受试试者中取取样,受受试者要要完成一一项任务务,或者者受试者者被置于于一定的的控制环环境中,然后后用统计计测试方方法检验验假设,(统计方方法包括括卡方检检验,t检验验,F 检验验,变量量分析等等等),测测试结果果显示被被测量和和计算的的值的显著和无显著著。于是是,假设设要么被被拒绝,要要么被接接受。口口译中的的实验性性研究大大多数都都是这种种类型(见见Graan 和和 Taayloor 119900, LLambbertt 和 Mosser-Merrcerr 19994, Toommoola 19995)。对许多行行为科学学家来说说,实验性性研究已经变变成了统统计假设设检验的的同义词词。研究究者常常常忘记实实验还可可用于其其它目的的,它们特特别可以以用于探探索,回回答“如果 会发发生”这类的问题(FFraiissee, PPiagget 和 RReucchliin 119899:922)。这种种实验在在此被称称为“开放实实验”。当今今,社会会规范使使假设检检验更具具吸引力力,而认认为开放放实验式式研究是天真的的。但是是,在产产业研究究这个决决不天真的研究中中,在物物理、化化学和生生物这些些不需要要担心它它们学科科地位的的研究中中,研究究者都大大胆地运运用。同同样,开开放实验验式研究究也用于于医学、农学和和教育学学。值得得说明的的是,对对开放实实验式的的一个批批评是说说它效率低低,即没没有一个个确切的的假设将将导致时时间、物物力和人人力的浪浪费,这这个批评在在计算机机模拟成成为可能能时失去去了效力力。最后后,支持持假设检检验为最最优范式式的人几几次三番番指出“你只是是找到你你在找的的东西”,意思思是研究究者需要要一个确确切的假假设或研研究问题题,这样样就不用用担心会会在众多多的数据据中遗失失显著的的现象。这一原则大大致正确确,但研研究者研研究焦点点以外也也曾有重大大发现。另外,一一时间专专注于一一件事物物可能会会阻碍发发现另一一事物的的存在,而而这另一一事物也也许同等等重要(RReucchliin 119699:299-300)。翻译研究究中的一一个开放放实验式式研究的的例子是是,将一一个观点点以图表表的形式式展示给受试者者,之后后受试者者要用母语将那那观点表表达出来来(Giile 19995b: Chh.3)。此研究究最初的的目的是是找到一一些现象象,这些些现象能能证明目目的语文文本的产产出有一一定自由由度是合合理的。实验的的发现不不仅肯定定了个人人自身和和个人之之间在产产出上的的差异,而且也找到了受试者会添加的信息类型,部分信息是不同语言所特有的现象。受试者会添加这些信息然后传递给接收者,但受试者并没有控制,甚至没发觉自己在添加信息。开放的实实验式研研究提供供了一个个观察平平台,这这一平台台可以引引出更多多确切假假设以及及它们的的统计检检验。在在实验设设计方面面,它也也比假设设检验简简单,因因为它不不需要那那么严格格的控制制(Frraissse, Piiageet 和和Reuuchllin 19889),但整体体上它确确实提供供了实验验式进程程的基本本优势,特特别是能能在相同同的条件件下,由由多人完完成同样样的任务务,但这这在口译译中很罕罕见。5. IR中实实验性和和观察性性研究中中的重要要方法论论问题原则上,观观察性研研究的主主要优点点是它所所调查的的现象可可以自然然发生,不受研究的干扰。但前面已经指出,事实并不完全如此,许多观察性研究进程确实会对自然现象产生干扰(同样,见Shipman 1988)。口译中也是如此:由于输入、产出的瞬间性,常需要现场实地观察,但当口译员知道由于研究的目的自己被严密观察时,他们可能会改变行为。另一方面,如果不告知他们,又会有道德问题。解决问题的明显方式是用自然记录和公开的资料,如电视口译,但这样得来的样本不能代表所有的执业者和职业环境(见Kurz 1997)。 另另一个问问题与工工作环境境的差异异有关(见见6.22部分),工作环境的差异导致难以找出单个变量对观察现象的影响大小。理想的状况是,实验性研究能提供解决办法:创造一个环境,控制所有相关因素,这样就可以分隔和检测研究变量所发挥的效果(实验变量或自变量)。但可惜,这种原则的实施却绝非简单。以下障碍最为显著,并引起口译员对实验性研究的反对与批评:a. 实验条件件本身非自然然(原因还不不仅仅是是受试者者所处状状态不同同:一个个是被研研究者观观察,一一个是被被顾客听听口译产产出),这可能造造成过程程与自然然条件下下发生的的不一致致(见66.1部部分)。依据环环境(自自然环境境或实验验环境)的的不同,所所得到有有关口译译表现差差异的数数据虽无法有有力证明明实验严严重歪曲曲了进程程,但必必须考虑虑这种可可能。b. 得不到足足够的可可靠依据据时(如见见Morravccsikk 19980:46),选择要要控制的的相关变变量将会会从主观观出发,而而不是从从科学角角度出发发。前面面已经指指出,在在IR中中就是这这种情况况。控制制一些相相关性较较小的变变量,而而忽略相相关性较较大的变变量,将将失去实实验性范范式所能能带来的的益处。这在由由非口译译员进行行的研究究中更具具风险,非非口译员员或许不不知道口口译员认认定的相相关的因因素,而而未对其其进行控控制。c. 为解决多多变性问问题,一一般都用用样本进进行实验验。但在在口译中中,获得得数据和和受试者者却是难事事(见如如Gille 119955a),因为只只能得到少少量且不不是随机机抽样的的样本,而且在取样时可能带有非控制变量的干扰。6文献献中的方方法论问问题口译和笔笔译研究究者研究究中的方方法论常常常站不不住脚,在在对比观观察性和和实验性性研究中中,三种种类型的的问题尤尤为突出出:6.1 与数据据效度相相关的弱弱点IR中,最最常碰见见的问题题是数据据作为真真实口译译数据的的效度问问题。非非互动式式观察性性研究中中的数据据可以看作是是真实的的,但互互动式中中的数据据存在效效度问题题,因为为由人为引出的的回答常常受到影影响。影响来来自问题题提出的的方式,采访者者和受访者的的互动,以以及受访者的回回答所留留下的本本人的形形象(见见如Frrankkforrt-NNachhmiaas 和和 Naachmmiass 19922)。在更更基本的的层面,受受访者对对真实的主观观看法也也是一种种误导。例如,在在Déjeaan LLe FFéal 19778研究究中,研研究结果果是口译译员认为为给照着讲稿念的演讲讲者做口口译时,演演讲者的的速度是是最大的的困难,但但实际上上演讲者者速度并并不快演讲讲中的其其它特点点可能使使速度显显得较快。同同样,CCollladoos AAis(19996) 和 GGilee (119855 和119955c)显显示受访访者对口口译员的的语言产产出或其其对原语语忠实程度度的评价价有时非非常不可可靠。所所以尽管管科学方方法有其其缺陷,尽管个人理论做出了很多贡献,个人看法容易造成误导的特性是在口译中支持科学方法的主要原因之一 (Gile 1990)。如上所述述,值得得特别注注意的是是自我观观察的效效度问题题.很明明显,通通过自省省对大脑脑活动的的分析很很容易受受个人偏偏见的影影响;事事实上,即使是是对自己己的口译成成品这种种较为客客观的观观察研究究,也很很可能不不及对他他人口译译成品的的研究可可靠.这这并不是说要要禁止自自我观察察研究,自我观观察研究究的动力大,容易获获得语料料,但有必要要关注其潜藏的的方法论论问题。实验性研研究,特特别是假假设检验验和由非非口译员员所做的研研究,效度问问题尤为为严重.执业者者质疑从从口译学学习者和和未经专专业训练练的业余余口译者者那里所所获数据据的效度度(如在在 Trreissmann 19965, Gooldmman-Eisslerr 19972, Laawsoon 119677, CCherrnovv 19969, Baarikk 19971, Koopczzynsski 19880).他们也也质疑 “真实实”的口译与实验中中让受试者者做的口口译的可可比性:实验中中会口译译书面的的文本,(Gerver 1974),有一些是为得到一定的语言特征而设计的文本(Dillinger 1989),或是口译任意一系列词(Treisman 1965).最后,前面也提到,他们也质疑在实验室的环境下所得到数据的信度.在这种环境中,看不见发言人,口译员也不会有真实的会议口译感觉.有关这方面的参考数不胜数:Politi 1989, Shlesinger 1989 (她原来怀疑实验程序的效度,但后来转变了观念,自己做起了实验研究),Dillinger 1990, Lambert 1994, Jorg 1995 (他报告自己一个受试者抱怨实验的 人为性)。6.2 数据的的代表性性当数据被被看成是是有效的的口译数数据时,还有另另一个主主要的方方法论问问题,即即数据的的代表性性问题。- 我们已经经知道,口译研研究中的的样本一般般数量较较少,只在观观察性研研究中有有少数特特例,如如Thiieryy的论文文(19975),日本本的一个个对1889个受受试者的的研究(Yosshittomii和 AAraii19991),以及Mooserr的终端端用户期期望调查查(19995)等.少量样本本中,统统计过程程只是部部分抵消消了可能能存在的的个别间间差异。- 样本不是是随机的的这一事事实又破破坏了其其统计检检验的效效度(HHanssen 等,119533, SSneddecoor和CCochhrann 19967, Chharbbonnneauu 19988, Baabbiie 119922;4448), 因为为非随机机抽样不不能排除除偏见,而偏见见就意味味着样本本的平均均数可能能不是总体体平均数数的近似似值.同同样的问问题也存存在于其其它许多多领域,特别是是医学和和心理学学。心理学学研究一一直遭到到批评,批评它它是对一一年级心心理学学学生总体体的研究究,而不不是对人人类总体体的研究究(在CCharrbonnneaau 119888:3333中,引用了了Mc Nemmar 19446, Smaart 19666 和和 Seearss 19986有有关这一一点的论论述)。在严格控控制的便便利取样的框框架中,样本平平均数有有时可看看成是总总体平均均数。便便利取样中中,先选选取容易易获得的的受试,然然后研究究者依据据对本领领域和(理理想地)对对从观察察和实验验中来的的实证数数据的了了解,对对受试者再进行行选择。口译中中,声称称便利取样具具有可接接受性更更具风险险,因为为虽然口口译员对对该领域域有直接接的了解解,但他他们同时时也高度度地介入入,所以以当研究究他们有有极端观观点的事事项时,客客观性方方面会有有所欠缺缺。- 口译条件件的许多多重要参参数各不不相同,比比如演讲讲主题,口口译员对对主题事事前的了了解、演演讲的句句法与词词汇组成成、演讲讲风格、口译员员疲劳、口译员员动机和和工作环环境等等等。特别别是极少少会考虑虑到原语语和目标标语变量量,大多多实验和和观察研研究只涉涉及两种种语言,几乎不涉及异域语言,如中文、日语、阿拉伯语和波利尼西亚语,等等。每个实验只能代表一两个参数的可能组合,或顶多代表其中的一个小部分。因此,推而广之是危险的。- 另一问题题是个人人口译表表现随着着时间的不不同可能能有所不不同(口口译员的的起和伏),这一一现象口口译员能能觉察出出,这种种现象也也是限制制任何单单个实验验的代表表性问题题。这一一变化的的幅度和和确切原原因尚不不清楚,但但执业者者认为这这一现象象已尤为为显著,必必须引起起注意。6.3量化口译是一一项复杂杂的活动动,口译译员认为为口译难难以测量量(见如如Pocchhaackeer 119944)。虽虽然他们们接受用用一个字字或一个个音节测测量语言处理理量的效度度(仍有有保留意意见,在在Pocchhaackeer 119944中有解解释),但但信息处处理量的的测量仍然然不存在在一个尺尺度。同同样,也也没找到到满意的的方法来来测量忠实度度或信息的的接受率率。同时时,忠实实度的指指标如误误差,因因被指定定义不充充分而受受到质疑疑(见如如Broos-BBrannn 119766, SStennzl 19883)。这样,观观察性研研究比实实验性研研究较少少出现误误差。这这从数据据效度上上可明显显看出,在在数据代代表性和和量化的的问题中中也很容容易解释释。观察察性研究究一般不不及实验性性研究对对量化的的依赖大大,而且且只是粗粗略的数数量级指指标,假假设检验验型的实实验性研研究以数数学比较较为基础础,相关关值测量量的不确确定性和和变化将将导致更更为严重的的后果。此外,这这种研究究设计是是从样本本推断总体体(从而而推出正正确的统统计过程程,包括括取样方方法的重重要性),以以一推百百并不是是观察性性研究的的性质。当作者者确实进进行推广广时,他他们的推推断更多多的是直直觉性的的,而非非数学性性的,因此比起起实验性性研究来来,读者也也较为容容易评判判,因为为数据是是真实的的,而不不是从人为的实验验环境中中得来。7处理理问题:应对策策略7.1 数据的的效度如上所述述互动式式观察性性口译研研究中的的效度问问题也存存在于以以问卷和和访谈为为基础的的其它学学科的研究中中。因此此它的应应对策略略也能借用别的领域域(如社社会学、心理学学)处理理这些研研究所用用的策略略与手段段。实验性口口译研究究中的效效度问题题更难解解决:视视译和口口译数据据的可比性性、口译译学习者者表现和和专业口口译员表表现的可比性性、真实实口译中中译入常常规主动动语言以以及实验验口译中中译入被被动语言言的可比比性,等等的有关关方面,可可靠数据据太少,难难下论断断。鉴于此,我我相信有有关口译译的研究究(有别别于语言言学、心心理语言言学和神神经语言言学对口口译员所所做的研研究,这这些研究究目的在在于调查认认知程序序而不是是口译过过程本身身),应更更着重于对实地发发生的现现象的研究,即即观察性性研究。实验设设置从定义上上来说创创造了人为环境。有一些些能当作作是研究究的现象象(连最最积极的的反实验验者Seelesskovvitcch的论论文也以以实验研研究为基基础,参参Selleskkoviitchh 19975),而另一一些却被被认定无无效而遭遭拒绝。这两者者之间的不不确定区区域也许许很广,所所以尽可可能地去去设计实验验,使实实验中被被执业者者直觉认定定相关的的因素不不受忽视视,这样样的实验验也显得合情情合理(见见Dilllinngerr 19990对对有关口口译员疑疑惑的置置疑和GGilee 19991 的答复复)。解决这一一问题的的一个建建设性方方法是比比较实验验结果和和实地表表现,研研究差异异的幅度度和方向向:实验验中可用用真实演讲讲的录音,然然后比较较真实口译和和实验室室口译结结果。随随着这种种比较的的积累,认认为实验验结果和和真实翻译译有可比比性的可可靠基础础也就逐逐渐形成成了。给给专业口口译员、口译学学习者、业余口口译者和和其他受受试者以以同样的的任务让让其翻译译(见如如Dilllinngerr 19989和和Vieezzii 19989),这样的研究到目前为止还算有用,因为这些研究在各种不同受试者表现上提供了可比性(或不具可比性)的数据,并且也许能拓展实际样本的规模。7.2 数据的的代表性性因为样本本规模小小,工作作环境和和条件差差异大,口口译员个个人也有有差别,所所以代表表性问题题没有简简单的解解决方案案。我认认为解决决这一问问题的最最好办法法是结合合实验性性和观察察性步骤骤进行重重复试验验。即使使是片面面的(考考虑到不不同的步步骤和/或条件件),在在某种程程度上,重重复试验验产生的的数据与与最初数数据具有可比比性,这这样就能能增加样本规规模,但但也承认认这并非非严格意意义上的的增加,严严格意义义上的增增加能保保证数据据的严格格选择,就就好像它它们来自自单一样样本一样样(见GGay 19990:1115)。可惜的是,目前进行实验性或观察性研究的研究者数量太少(见Pochhacker 1995a,1995b),而且他们中几乎所有人都是为拿到学位而努力,获得学位之后便停止研究。这样的研究者都对原创性研究感兴趣,而重复试验则鲜有人问津。这种状况在口译学校建立研究中心或研究项目后也许能有所改善(见Gile 1995a).另一个对对数据代代表性评评估的有有用渠道道是已公公布的研研究语料料库,虽然二二者之间可能能目标与与条件不不同,但但无论如如何语料料库能提提供相关关数据。例如,虽然得到数据的方式不同则推断不同,但是包含原始讲稿及其翻译的资料可用来研究错误的类型和分布。7.3 量化必须承认认,如口口译这样样人类行行为的复复杂方面面很难用用精确、彻底、统一的的方法加加以直接接测量。但但口译中中也存在在可以较较为简单单量化的的方面。如译员员翻译时时停顿的的数量与与间隔,被被正确称称呼的专专有名词词所占比比例,原原文本和和目的文文本中词词单位数数量,特殊词词单位的的相对频频率等等等。其它它方面则则比较难难以量化化。在一一个关于于口译学学习者语语言产出出质量的的研究中中(Giile 19887),发现受受试者对对偏离可可接受用用法的灵灵敏度和和标准大大相径庭庭(Giile 19885)。同样,口口译的质质量也难难以精确确评估,Pöchhacker (1994)特别强调了这一点,Collados Ais (1996)也论证过。由于缺乏准确的定义(在计算误差和质量评估中等),或由于观察不精确甚至观察误差(个人偏见或注意转移造成 见Gile 1995c),或者由于研究现象本身的多变性,都可能导致测量不精确。研究中的这种不精确确实存在时,下结论时就必须对其加以考虑。例如,一项口译研究中,两组的错误率分别是27.22和23.45(见Politi 1989,对Balzani的一个研究的报道)统计中的差异为15。考虑到多变性和非随机的误差可能存在于这类小型样本实验中,包括误差确定的差异性,有人也许会质疑统计中显著差异是否有用(Stenzl硕士论文中报告,当她将Barik的错误标准用在他自己的语料中,并重复他的步骤,Stenzl得到了不同的结果;见Barik 1971)。Jorg (1995)在他的六个口译员组成的数据中已经指出,小型样本中的一个极端值会有很大的影响。不管新的统计方法多强大,改进了多少,都不能克服小型非随机样本所固有的易变性这个根本局限。但是,这这样的误误差及其其必然的的局限性性不一定定就是研研究中的的主要问问题。很很多情况况下,借借用已实实践于社社会科学学中相似似问题的的工具,较较粗糙的的量化已已足够提提供所需需的答案案。例如如,在一一个关于于口译练练习中语语言产出出质量下下降的研研究里(GGilee 19987),尽尽管受试试者信度不不高,但但也能依依据三种种练习类类型 同声声传译,连连续传译译或即兴兴演讲建建立起语语言偏差差的三种不不同的频频率等级级,而且且将这三三种频率率等级用用于灵敏敏度分析析时,也也显示了了可行性。(灵敏度度分析检检测的是是相关参参数在具具体范围围内变化化而导致致结果变变化的程程度,这这种变化化是可能能的,因因为人类类的评估估具有可可变性。)同样样,要判断专专有名词词在口译译中是否否构成真正的难题题,不管管实验时时测到是是80,990,还还是1000的的专业名名词都翻翻译错了了,观点点总会形形成(GGilee 19984)。如果问题是口译员在给定的条件下进行同传时,是否会遗失一些信息,那么不管每半个小时测到是10个,20个或30个错误,结果都将是有意义的(Gile 1989;也可见Babbie 1992:127)。与别处一一样,在在这里常常识是首首要的,比比统计方方式更加加重要(见见Meddawaar 119811:277,933, MMcBuurneey 119900:5)。这也引引出了统统计上的的显著差差异或许许并无实际际意义:口译时时,每半半个小时时平均110个和和12个个误差之之间存在在的200的差差异并不不能向客客户证明其中中一个口口译就绝绝对地好好些;准准备一场场科技会会议口译译,要记记住1550个新新词和2200个个新词之之间存在在30的差异异,但这这种差异不不能显著著地影响响这场翻译需要要付出的的努力,也也不能改改变翻译译策略的的选择。口译研究究中大多多数争论论不是集集中在微微小差别别上,而而在基本本的信条原则上上:译入入非母语语的口译比比译入