语言测试的分类(共11页).doc
《语言测试的分类(共11页).doc》由会员分享,可在线阅读,更多相关《语言测试的分类(共11页).doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第二章 语言测试的分类语言测试的分类决定着测试的形式,题目的类型。语言测试大体上可以从用途、构建、考察重点、评分方式、对测试分数的解释等方面进行分类。正如Henning(2001)指出的,语言测试有多少个目的,就会有多少种测试类别。语言测试的分类能够帮我们弄清“为什么测试?” 、“测试什么?”、“怎样测试?”等问题。对于语言测试类型的了解能够帮助教师更有效地组织测试,更好地实现英语语言测试的信度和效度,更科学地根据测试的目的权衡信度、效度之间的关系。第一节 以测试用途为标准的分类从测试用途角度进行分类,大致可以将语言测试分为五种测试形式,即水平测试 (proficie
2、ncy tests)、成绩测试 (achievement tests)、分级测试 (placement tests)、潜能测试 (apititude tests)和诊断性测试 (diagnostic tests)。1. 水平测试 (proficiency tests)水平测试是用来测量人们的某一语言能力,往往与被测试者先前所受的语言训练无关。水平测试多针对于来自不同学校,不同国家,不同语言背景的受试者,因此水平测试与他们过去的学习内容、课程目标、课程大纲等没有直接联系。这里的水平更强调以某一特定目标为基础的,对于语言的充分驾驭。水平测试的目的之一是用来选拔。这种选拔可以是为某一工作岗位进行的招
3、聘,此时的测试目标着重于受试者能否胜任某一工作,测试内容往往与这一工作中的实际场景相关,如联合国译员考试。这种选拔也可以是升学选拔,此时的测试内容是向前看的,如测量学生是否具有足够的语言能力来跟上大学中的课程和学业,如美国的托福考试,英国的剑桥英语水平证书测试(University of Cambridge Certificate of Proficiency in English)等。大多数试题内容来自国外大学本科生教材。升学选拔水平测试在范围上有所区分,有的只是针对于大学中某一具体专业,如艺术专业;而有的则是针对于所有专业,如牛津EFL考试。现以雅思考试为例对水平测试做一具体说明。雅思即国
4、际英语水平测试(International English Language Testing System),简称IELTS。IELTS的考试中心遍布全球105个国家。考试可分为两种类型,学术类和培训类。学术类IELTS(Academic IELTS)适合于计划申请报读国外高校本科或研究生课程的考生,专门测试考生是否具备一定的英语语言能力完成本科或研究生课程。因此如果计划出国留学深造或接受高等教育,应选择学术类IELTS考试。普通培训类IELTS(General Training)是针对去英语国家完成中学教育,学习非学位培训课程,以及赴加拿大、澳大利亚、新西兰等国移民定居的人员,主要测试在一般
5、的社会和教育情景下的基本生存技能(basic survival skills)。因此如果计划完成初级教育,接受非学术类培训,工作或移民到英语国家,应选择培训类IELTS考试。IELTS考生需要参加听力、阅读、写作和口语四项测试。每项测试不同的技能。听力要求考生理解日常生活中的口语和非正式场合的口语,比如在讲座,研讨时使用的口语,雅思的听力部分就是测试考生在这方面做得如何;阅读部分主要考察考生从许多信息来源中快速、准确地收集找到主要信息的能力,此部分主要针对日后学习中常面对的问题,即在学习中没有时间阅读书单上所有的书。写作部分测试考生在收集和组织信息后,以文章或报告的形式表述想法的能力;口语部分
6、测试考生谈论自己的情况,表达对各种问题看法的能力。总之,雅思的所有考试都面对今后学习中常出现的情况,即在时间紧迫的情况下寻找信息,快速思维,并恰当地做出反应。我国的水平测试主要是全国公共英语等级考试,教育部和许多单位派遣出国留学人员的标准之一就是通过全国公共英语等级考试的第五级。水平测试往往事关重大,因此在水平测试试卷的设计上一定要有信度和效度。很多水平测试都往往委托于专业的考试机构。同时水平测试的出题机构应广泛吸收应试者的见意,使水平测试具有正面的“回波效应”(backwash effect)。2. 成绩测试 (achievement tests)成绩测试用来测量学生对于所学知识的掌握,与所
7、学课程直接相关,目的在于评价学生个体、小组或班级在学习目标实现方面的成功度。成绩测试一般包括:终结性成绩测试(final achievement tests)和进程性成绩测试(progress achievement tests)。终结性成绩测试在学科结束时进行。试卷命题一般由年级组、学校教务部门、教育部官方命题机构等负责。考试内容与教学内容相关。就考试内容而言可分为基于教学大纲的内容模式和基于教学目标的内容模式。前者的考试内容多数是学生所熟悉的,但问题在于如果大纲设计不合理或教材选取不当,考试结果将会误导师生。例如,某一课程目标是发展学生的口语能力,但是课程本身和测试内容是要求学生在充分的准
8、备下发表对家乡、对天气的看法,那么测试结果就不能反映出学生是否达到了课程目标所要求的程度。基于教学目标的内容模式使测试内容与课程目标直接相关,其优势在于首先使课程设计者更精细地描述目标;其次使测试结果更好地反映学生是否达到了课程目标所要求的程度;同时对于大纲的制作和教材选择有更好地规范作用。Hughes认为:“它能为个人和群体的成绩提供更精确的信息,并为教学提供更有益的回波效应(backwash effect)”(Hughes 2000:11)。终结性成绩测试的试题一般是主观性和客观性试题相结合,试卷制作较为规范。每学年的期末考试、我国的中考及高考,严格来说都应属于终结性成绩测试,因为这些测试
9、都是以教学大纲为内容的测试,并且试题多是检验学生对已学知识的掌握。进程性成绩测试,顾名思义,是测量学生在学习过程中的进步。对于进程的衡量可以通过建立短期目标来实现。教师多采用突击测验的形式来检查学生的学习进程,并使学生时刻保持警觉。因此进程性成绩测试的试卷制作相对不太严格,每一份试卷都具有其独特性,并且多根据具体任课教师对班级成员的了解及其自身制定的阶段性目标为命题依据。进程性成绩测试作为一种有效的测试方法,能够对教学和学习动机产生有益的回波效应。好的进程性成绩测试能够鼓励学生学习目标语言并获得自信,还能推动学习并巩固已学知识。成绩测试方法应当与教学中所使用的方法相一致。例如,教学中使用的是交
10、际能力教学法,那么成绩测试的方法也应为交际能力测试方法而不是结构主义测试方法,否则就会导致考试不公平的问题。近年来对于标准化试题的争议多源自于测试方法与教学方法的分歧。目前,自我评估(self-assessment)测试方法逐渐融入到成绩测试中。所谓的“自我评估测试方法”就是鼓励学生参与到评估中,能对自己在不同情景中所表现出的语言能力给予评价。3. 分级测试 (placement tests)分级测试是根据学生的不同能力将学生分为不同的等级或不同的班级。分级考试的试卷设计应当量体裁衣,即在分级测试前要弄清不同级别的主要教学特点,然后根据这些教学特点设计具体的测试内容。分级测试的试题难度应包括不
11、同难度水平的题目,即遍布从最简单到最难题目的两极之间。对于百分制的测试而言,最好以10分为一个段,每个分数段都有学生,以便于分班。分级测试符合现代教育理论所强调的因材施教,即针对不同水平的学生采取不同的教学方法和教学内容。但是分级测试也应考虑学生的心理承受能力,避免挫伤学习者的学习积极性。分班分级所导致的压力不仅影响到学习能力较弱的学生,也会影响到尖子班里的优秀生。心理学研究表明,压力大造成的过强学习动机反而会使学习者心情过分紧张、焦虑、影响记忆理解能力。因此如何恰当地使用这一测试方法,还有待于进一步的探讨。4. 潜能测试 (apititude tests)语言潜能测试也叫做预测性测试(pro
12、gnostic tests),是通过衡量学生在一门陌生语言中的语言表现,以预测其是否有学好这门语言的潜力。语言学习潜力受到多方面因素的影响,如智商、年龄、动机、记忆力、语言敏感度和语法结构敏感度等。语言潜能测试与之前所学的知识无关,很多情况下是学生以前从未接触过的语言。一些专家认为在实际操作中不太可能对应试者的语言潜能进行全面的测试,因此多数测试只是衡量考生某一部分的潜能如听、译领域的潜能。词汇测试常被认为是有效的潜能测试方法,因其与智商紧密相连并且能反应出应试者对这一领域的兴趣。测试语言多采用人工语言,多关注音位区分能力和系统运用语言结构的能力,潜能测试题目数量较多,如The Modern
13、Language Aptitude Test。5. 诊断性测试 (diagnostic tests)诊断性测试用来识别学生在学习方面的优势和劣势,从而确定未来的教学走向。诊断性测试较关注于学生在哪些方面犯了错误,并借此找出补救的办法。从广义上说,诊断性测试可以帮助改进教学,调整教学计划,进行个别指导。现行课堂中采用的诊断性测试多是教师根据教学重点、难点及本班实际情况自行进行的小测验,从而及时发现学生的问题,尤其是普遍性问题,以此给教师提供依据,对前一阶段的教学进行反思,对今后的教学给予指导。这种诊断性测试得分应在平均80%以上,以鼓励学生的学习。“诊断性测试可以作为形成性评价的组成部分,将一个
14、学期的试卷存入学习档案就会使学生清楚地看到自己的学习进展情况”(武尊民2008:32)。这种课堂上的诊断性测试,从本质上来说,与成绩测试尤其是进程性成绩测试相吻合。正如Heaton所说:“尽管诊断性测试的术语被广泛使用,但几乎没有什么测试是只被做为诊断性测试而构建的”(Heaton 2000:173)。成绩测试和水平测试经常被用于诊断性测试之中。原因在于,从大的方面,例如从语言技巧的角度而言,一套综合性试卷就可以帮助我们判断某一学生在听说读写译五个方面哪个方面最强,哪个方面最弱。在写作和口语方面,在现有的成绩测试和水平测试中,我们也可以根据测量标准,很容易地判断出学生在写作或口语中较弱的方面,
15、例如词汇匮乏,或是不能较好地使用连接手段等。但是对于非常具体的内容,现有的测试手段和模式很难构建出真正具有诊断性特征的测试内容。例如,对于语法方面的考察,就缺少真正意义上的诊断性测试。假设我们想诊断学生是否具有对某两种相似语法结构或时态进行区分的能力,那么数量太少的题目尤其是选择题则不能实现诊断的信度和效度,因为样本过少则不能排除运气及猜题之嫌。此时的样本应尽可能的丰富,并应包含每一种它们能够实际应用的情景。但是,大量的样本之需常常使试题出题人和使用者避而远之。那么,是不是因此就要遗弃单纯的诊断性测试呢?显而易见,诊断性测试本身的意义就已否认了这种观点。尤其是在现代社会,人们大力提倡终生学习,
16、自主学习。诊断性测试对于自主学习的意义是巨大而又明显的。对于这种矛盾的解决方法就要向计算机系统寻求帮助了。第二节 以测试构建为标准的分类从测试构建的角度进行分类,英语语言测试可以分为直接测试(direct tests)和间接测试(indirect tests)。换句话说,这种分类形式取决于测试者是想直接地测量语言实际运用能力,还是想间接地反映出某种语言能力。1. 直接测试 (direct tests)当某一测试使应试者精确并直接地表现出我们想要测量的能力时,那么该测试就被视为直接测试。直接测试的结果能够直接反映应试者在某一方面的语言能力。如我们想考察学生的写作能力,就可以让他写一篇作文。再比如
17、我们想考察学生的语音语调,就可以让他读一小段文章。直接测试较适用于产出性的语言技能,如阅读和写作。直接测试的优势在于:首先,如果我们很清楚想要测量的语言能力有哪些,那么就可以相对直接地创造出相应的情景,使考生产出的行为在该能力所要求的行为范围之内;其次,对于产出性技能,很容易直接地给予评估和阐释;此外,对于直接测试的准备则会督促考生多次训练相应的技能,对教学和学习有很好的回波效应。直接测试的选材要求尽可能真实,最理想的考试环境应当是现实中的实际环境而非人为策划出来的交际环境。因此这也是直接测试的瓶颈所在。因为任何的现行的直接测试从本质上来说都不可能是完全真实的。McNamara(2003)曾举
18、过这样的例子来说明这个问题,在为移民健康从业人员进行的英语口语测试中,所设置的对话、角色扮演都发生在医生和患者之间,场景相对真实,但是显而易见这种行为本身并不存在,医生并不是真正地在向患者提供服务。McNamara进一步引用一位著名作家的话来解释这一点,即“每个人都意识到评估口语能力的对话只是一种测试而不是真的发生在茶话会上(tea party)”(McNamara 2003:9)。Henning也曾指出:“许多语言测试都应被视为自然场景(natural-situational)到非自然策划场景(unnatural-contrived)所构成的连续体(continuum)当中的一点”(Henn
19、ing 2001:5)。因此,测试的直接性只是相对而言,例如口语中的采访形式要比完形填空直接;语境化的词汇测试要比同义词匹配自然直接。就信度和效度而言,直接测试效度好而信度差。直接测试能更为直观地反映出考生的语言能力,接近真实生活中的语言表现,因此效度好。但是由于直接测试的题目往往是主观性测试题目,因此评分所具有的主观性相对较高,导致其信度较差。直接性测试要避免场景构建失真,同时要注意简化的评分方式也会影响有价值的直接语言能力数据。2. 间接测试 (indirect tests)间接地观察言语行为的测试称为间接测试。间接测试的结果不能直接反映语言能力,但是可以提供判断语言能力的信息。Lado在
20、1961年提出了间接测试语言能力的一种方法,即让学生判断所给出的词汇中哪些词汇可以构成同音词汇对。这种题型在我国初、高中英语测试中广泛应用,即给出一个词,然后让学生从四个选项中选出一个与所给出词汇发音相同的词。间接性测试的优势在于适用范围较广,并且其结果也更具概况性。但问题在于如何判断某一能力的构成成分,这些构成成分的测试分数是否能够真正反映出考生对该能力的掌握程度。在实际操作中,如语法知识的考察中,间接性测试只能从语法单项中进行取样测试,考试结果只能反映所取样的内容,而不能说明所有语法知识的掌握程度。间接性测试与直接性测试相比较效度差,但信度高,这主要是由于间接性测试多采用客观性试题。对于直
21、接性测试和间接性测试的选择受成本效益、信度和效度等因素的影响。第三节 以考察重点为标准的分类John. B. Carroll(1961)首先提出了分立式测试(discrete point tests)和综合性测试(integrative tests)之分。这两种测试的差别在于考察重点的不同。1. 分立式测试 (discrete point tests)分立式测试是将知识和能力分成若干小的单元,然后一项一项地进行测量。因此分立式测试具有诊断性的意义。分立式测试受到结构主义理论的影响,即语言有许多成分组成,掌握一种语言就是要掌握这些组成成分。分立式测试的每个题目一般只考查一个语言点,而且多采用单项
22、选择的形式。例如:Before the first non-stop flight was made in 1949, it _ necessary for all planes to land for refuelling.A. would be B. has been C. had been D. would have been (1996年1月CET-4:25题)这道题主要考察如果before引导的时间状语从句是一般过去时,那么主句的时态应为过去完成时态。分立式测试试题应避免在单项选择中设置两个以上的考点。例如: Research findings show we spend about
23、 two hours _ every night, no matter what we _ during the day.A. dream, must have done B. dreaming, should have doneC. dream, would have done D. dreaming, may have done对于这道题,学生如果答对,则可以判断出学生掌握了spend sth doing sth的用法,同时又掌握了虚拟语气中may have done的用法。但是如果答错,则很难判断学生知道什么不知道什么。2. 综合性测试(integrative tests)综合性测试用来
24、同时测量学生的多种语言能力,需要考生综合多种语言能力来完成某一语言任务。因此综合性测试不具有诊断性的意义。综合性测试是一种较为流行的测试形式,包括无选项完形填空、听写、口语面试、写作、记笔记、翻译等例如:PETS5级第二部分中的英语知识应用部分就属于综合性测试。这部分采用无选项完形填空的形式,在一篇250-300词的文章中留出20个空白,要求考生根据短文内容填空,使补全后的文章意思通顺、前后连贯、结构完整。其中约有12题考查语法和语段结构,8题考查词汇。考试大纲中明确了这部分的考查目的,即该部分不仅考查学生对诸如连贯性和一致性等语段特征的辨识能力,还考查学生对用于一定语境中规范的语言成分的掌握
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 测试 分类 11
限制150内