简明英语测试教程.pptx
《简明英语测试教程.pptx》由会员分享,可在线阅读,更多相关《简明英语测试教程.pptx(357页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、英语测试概述:过去、现在与未来语言测试是一门古老而又年轻的学科,尽管现代语言测试的历史不到100年,语言测试的历史渊源却可以追溯到很久以前(Spolsky1995)。语言测试是应用语言学的一个重要分支,它涉及教学法、二语习得理论、语用学、心理语言学、认知心理学、教育测量学、计算机科学等多种学科。语言测试是伴随着语言教学出现,并随着语言教学的发展而发展,不同的时期,人们的语言观不同,采用的语言测试方法也不同。世界语言测试理论经历了四个发展阶段,反映了三个语言测试的理论模式。随着语言测试理论的发展,语言测试在实际应用和理论研究方面也出现了许多新的变化,已引起越来越多学者们的注意。第1页/共35
2、7页语言测试主要用于语言教学、语言研究和教学研究、选拔人才三个方面,其中最为普遍的是用于语言教学。语言测试与语言教学之间存在着一种相互依赖的关系。语言测试是衡量语言教学成效和提高语言教学质量的重要手段,是语言教学过程中的重要组成部分。语言测试的目的是提供一种科学的衡量工具,一方面对学生的语言能力进行客观、准确、公正的评价,另一方面检测教学效果,反映教学中的长处与短处,为提高教学质量服务。由此可见,语言测试是语言教学过程中不可欠缺的重要环节,语言教学离不开语言测试。第2页/共357页语言测试与语言教学是同时存在,息息相关,紧密联系而且相互作用的。然而,语言教学与语言测试的发展并非总是同步的。一个
3、语言测试体系一经确定,在一定时期以内就具有相对稳定性,会对语言教学产生积极或消极的反拨作用。第3页/共357页语言教学与测试的关系 语言测试是伴随着语言教学出现的,语言教学与语言测试密切相关,这是毋庸质疑的。但对于语言教学与测试之间的关系或从属地位人们却有各自不同的看法,基本上可以归纳为两种:主仆关系与伙伴关系。持有主仆关系观点的人认为持有这种观点的人认为语言测试是语言教学的一部分,并服务于语言教学。代表人物为英国语言测试专家AlanDavies。持另一种主仆关系观点的人没有代表人物,却在实际中广为应用,即“考试是教学的指挥棒”。持伙伴关系观点的代表人物是世界著名语言测试专家ArthurHug
4、hes,他认为教学与测试是“伙伴关系”(partnership)测试与教学既互相促进又彼此制约。第4页/共357页1.主仆关系语言教学是第一性的,语言测试为语言教学服务考试是左右教学的指挥棒2.伙伴关系持这一种看法的人认为,测试与教学既互相促进又彼此制约,教学从目标、内容、方法与手段等方面制约着测试,而测试又在目标、内容和方法上对教学起着重要的反拨作用。第5页/共357页世界著名语言测试专家ArthurHughes认为,教学与测试是“伙伴关系”(partnership)(Hughes1989)。他说,“Theproperrelationshipbetweenteachingandtesting
5、issurelythatofpartnership.Wecannotexpecttestingonlytofollowteaching.Whatweshoulddemandofit,however,isthatitshouldbesupportiveofgoodteachingand,wherenecessary,exertacorrectiveinfluenceonbadteaching.”(ArthurHughes2000)下面的图示反映了教学与测试的相互关系。第6页/共357页第7页/共357页考试是外语教学过程中的一个重要的组成部分,外语考试与外语教学之间存在着相辅相成,互为影响的关系
6、。在教学中教学目标起着决定性的作用,它决定了教什么(教学内容)和怎么教(教学方法);教学目标是否达到需要考试作为它的评估手段,因此考试的测试目标必须以教学目标为依据,这样才能起到评估教学目标的作用。在教学考试中,教学内容决定了考试的内容(考什么),而教学方法决定了考核方法(怎么考),因此从理论上说,考试只是教学的一个组成部分,它的考核内容与方法由教学目标、教学内容和教学方法所决定。考试应在教学目标的指导下进行,并不是说考试可有可无。在教学实践中,我们发现考试占有很重要的地位。有时甚至影响到整个教学过程,使教学围绕考试进行,其典型例子就是应试教育。第8页/共357页这是因为考试除了有受教学其他环
7、节和因素影响的一面外,它反过来对教学其他环节又有反作用的一面,亦即所谓的反拨作用(backwash)。因为外语测试的结果不但能判断外语教学目标设置的正确性、可行性及实现的程度,而且也能反馈、控制外语教学活动。过分强调考试的反拨作用,特别是强调考试的评定和选拔功能,必然导致考试在教学过程中的错位。教师、学生、家长、教育部门对考试作用的过度强化所形成的合力就会导致应试教育,使考试成为教学的核心和教学的目的,这应该加以避免。第9页/共357页邹申(2005)则认为,语教学与语言测试之间存在一种相互依赖的关系,教学(或课程设置)的有效性可以通过测试加以检验,而我们从测试中得到的信息反馈也有助于改进和提
8、高教学质量,或完善课程设置。第10页/共357页四种英语语言测试法1.写作-翻译法(theessay-translationapproach).这种方法主要有以下特征:1.对测试的技能或专长没有特殊要求,主要是依据教师的主观判断力;2.试卷通常包括翻译、写作和语法分析等项目;3.试卷的内容带有浓厚的文学或文化色彩;4.试卷一般采用书面回答形式,试卷需要人工评阅。由于写作-翻译法不强调测试的科学性或理论基础,故有时被一些学者称为语言测试的前学科阶段。(科举考试,博士,硕士研究生考试)第11页/共357页2.结构主义/心理测量法(thestructuralist-psychometricappro
9、ach).这种测试法以结构主义语言学为其理论基础,强调不同的语言成分可以分别测试,比如语音、语法和词汇都可以脱离上下文进行单独测试。此外,听、说、读、写等项语言技能也可以分开测试,因为这个测试法的重要特征是一道题可以单独测试一个语言成分或技能。这种方法的另一大特点是采纳了心理测量学的一些方法,强调语言测量的可靠性和客观性。结构主义/心理测量法在语言测试中的典型表现形式是多项选择题,一种既能达到一题测试一成分的要求,同时又适合于进行考后统计分析的题型。第12页/共357页3.综合法(theintegrativeapproach).综合法有如下特点:1.语言测试要在一定上下文(context)中进
10、行;2.不在测试中刻意追求区分各单项语言成分、技能或能力,而是强调两项或两项以上的综合评估。较能体现综合法的考试题型有完形填空、听写、翻译、写作等。以完形填空为例,这类形式可以同时测试学生的语法、词汇知识以及阅读理解能力。此外,语法、词汇知识以及阅读理解能力的测试在一个特定的上下文(即所给的完形填空材料)环境中进行。但,上下文环境在综合法中不是真正意义上的语用环境,只是起到辅助测试语言知识的作用。第13页/共357页4.交际法(thecommunicativeapproach)。有学者认为交际法与综合法在某种程度上有相似之处,即两者都强调语言的意义而不是语言的形式和结构;但同时两者之间又存在根
11、本区别:交际法更注重语言在交际过程中的使用。这里牵扯到两个概念:usage和use。Usage主要指语言形式和结构,而use则是有关语言的交际功能以及使用。语言运用是语言学习的最终目标,语言形式的掌握是实现这一目标的方法。因此,衡量一个人语言熟练程度的最终标准是看此人能否在语言使用环境中有效的进行交际。交际法包括usage的成分,但更多的是评价学生在特定语言使用环境中交际能力(use)。第14页/共357页随着交际教学法在语言教学领域日渐盛行,从20世纪80年代起语言测试界也逐步受到其影响,并出现了一系列旨在测试交际能力的探索性考试,这类考试大概有以下几个特点:1.考试内设计“信息沟”(inf
12、ormationgap),要求学生通过各种已馈入的信息来获取未知信息。2.考试任务或项目之间存在关联性(taskdependency),即一个项目要基于前一个项目完成的基础上,比如学生先听一个电话交谈,然后根据交谈的内容写一封信。3.考试强调针对性,根据学生的具体需求设计考试内容,比如在专门用途英语(EnglishforSpecificpurpose)考试中,要根据学生的具体语言要求,确定测试内容、所需语言交际模式及其相关语言技能。4.侧重更广泛地测试语言能力,包括语言知识、语言功能,语言使用的合适性等。第15页/共357页5.考试采用定性评估方式(qualitativemodesofasse
13、ssment),以取代纯粹的定量评估方式(quantitativemodesofassessment)或作为其补充。前者属于标准参照性质(criterion-referenced),后者属于常模参照性质(norm-referenced).第16页/共357页1.3当代国内外大规模考试一览全国英语等级考试(PublicEnglishTestSystem,简称PETS)大学英语四六级考试英语专业四八级考试美国托福考试英国雅思考试商务英语考试人事部翻译资格证书考试教育部翻译资格证书考试上海市口译资格证书考试第17页/共357页纵观上述考试的设计宗旨和测试目的,我们可以归纳出以下几个特点:1.所有考试
14、都旨在全面测量考生的语言水平,故无一遗漏地测试各主要单项语言能力(听说读写)。2.考试日趋注重对口语能力的测试,并且口试与笔试分开的时间间隔也越来越短;托福考试在实施了18年后于1981年推出托福口试;CET考试在开考12年后于1999年增加CET-SET考试,而在1999年开始正式实施的PETS考试,在推出时已包含了口语测试项目。第18页/共357页3.考试在测试考生接受性语言技能(receptive)的同时,更加注重评价他们的产出性语言技能(productiveskills),所以在题型选择上绝大多数采用多样化的形式,既有多项选择题,又有其他形式,如简答题、填空题、匹配题、翻译题、写作题等
15、。4.考试不仅考虑到信度(如分数的可靠性),而且更加注重其效度(是否达到预期测试目标等)。增加口语/写作考试和多种题型有机组合都是为了能够考核学生综合运用英语进行交流的能力,以提高考试效度。第19页/共357页考试今后的发展趋势首先,随着计算机的普及,考试计算机化或无纸化的进程将加快,国外的托福考试已在推行考试计算机化(CBT,CAT)。我们国内的有关人士也已完成了这方面的理论研究;有的地方性考试已开始实行外语考试网络化,如上海市高考英语口试已连续几年实施网上口试和网上评分。我们可以预测在不久的将来CBT和CAT将成为考试的常见形式。第20页/共357页第二,在考试方式的作用、考试分析手段、考
16、生特征以及语言能力性质等方面的研究将会继续深入下去。第三,对常规考试以外其他评估方法的可行性探讨也会成为研究的热点,比如小组测试方式(grouptesting),以学习者为中心的测试方式(learner-centeredtesting),自我评估(self-assessment)等。第四,考试的后效作用(washbackeffects),即考试对社会、教育机构以及学生个人的影响等,也将成为研究的焦点之一。以上方面的研究成果无疑将会给考试注入活力,使考试成为一种更完善的评估手段。第五,考试开发设计将更加注重以考生为本的理念;考生群体的特殊要求将引导考试开发;考试的社会服务功能将进一步凸现。第21
17、页/共357页比如,英国剑桥大学地方考试委员会(UCLES)开发的剑桥商务英语证书(BusinessEnglishCertificate,简称BEC)考试专门针对商务从业人员群体。该考试从听说、说、读、写4个方面,综合考查考生在商务及一般生活环境下使用英语的能力。又如,美国教育考试服务中心(ETS)推出的国际交流英语考试托业考试(TestofEnglishforInternationalCommunication,简称TOEIC),其考试设计对象为到国外出差或国际交往频繁的非英语母语人士,如跨国公司的雇员等。第22页/共357页第二章考试功能及其类别2.1测量、考试与评估1测量。什么是测量?S
18、tevens(195)认为,“广义而言,测量(measurement)就是根据法则赋予事物数量。”也就是说,按照一定的规则给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲,要测量一下桌子的高度,我们可以拿尺子来量一量,看看它有多高。尺子是人们根据一定的法则制定的量具,利用它就可以把事物的属性,即桌子的高度用数字表示出来,如,0.75米。这种测量属于客观测量,因为它基本上不受观察者的主观判断的影响。第23页/共357页测量这一定义包含三个要素:1)事物及其属性。这是测量的对象或目标。上面提到的对桌子的高度进行测量,属于对物体进行测量,其属性高度,是可以观察到的,可以
19、进行客观测量的。在外语教学领域,我们感兴趣的是学生的语言能力,而学生的语言能力属于人的心理特征,是无法直接测量的,但是人的心理活动会在人的具体活动和行为中体现出来,所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低。第24页/共357页2)指派数字或符号。所谓指派数字或符号,就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87分,李四得了92分,我们说李四比张三多考了5分。数字本身没有意义,只是一种符号。我们用它来代表考生的阅读成绩,这时它就变成了量化的数,可以对其进行解释和分析。在一定的条件下,还可以对数据进行运算从而对事物的属性进行推测。第2
20、5页/共357页3)法则。法则是指测量所依据的规则和方法,是测量的关键。法则不好或不可靠,得到的测量结果就会出偏差,失去测量的意义。简单来说,尺子不准,测量的结果就无法使人信服。对客观世界的物体进行测量时,由于有公认的测量法则或尺度,如测量物体的高度、重量等;一般不会出现大的偏差。而对人的某些特性(心理特征)进行测量时,则往往会出现较大的偏差。举例来讲,有几个评委对某学生的英语口语进行评定。评委A认为一个人的口语要好,必须发音准确,而该学生的发音好,所以他给打了个5分。评委B认为流利性最能体现一个人的口语水平,该同学尽管发音不错,但流利性差一些,所以她给他3分。同一名学生,让不同的评委去打分,
21、成绩出现了偏差。这也很自然,原因是他们没有按照一个评定口语成绩的统一法则(rules)去给这名学生打分,结果造成了偏差。这个例子提醒我们,在对人的某些心理特征,如口语表达能力、阅读理解能力等等进行测量时,首先要制定一个便于操作的,稳定的法则或标准。这样得到的测量结果才可靠,才具有可比性。第26页/共357页2测试测试(test)又称测验。不同的心理学家对此下的定义不同。Anastasi(1982)认为,“测试实质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公认的最权威的定义,它包含以下三个基本要素:1)行为样本语言测试的目的是要测量受试者的语言能力。上面提到,语言能力是无形的,如何
22、测量?只能测量它的有形表现,这里所说的有形表现,是指语言表现,如说出来的话,写出来的句子,对测试题目所做的各种反应等等、这些行为,都是无形的语言能力的有形表现,用心理学术语叫“表征”(manifestation)。第27页/共357页所谓行为样本,是指对语言能力表现行为的有效的抽样。我们知道,一个人的语言能力的表现行为会有各种各样的形式,测试时不可能也没有必要把它的全部表现行为都测到,只能选取一部分有代表性的抽样进行测量,然后据此对受试者的语言能力作出推测。2)客观的测量。所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价:测试题目的难易度和区分度如何;
23、测试结果的可靠性程度如何?测试结果的有效性如何?这几项指标是衡量一项测试质量的重要指标。3)标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样,测试才有统一的标准,对不同人的测量结果才有可比性。凡是不标准化的测量,都没有可比性。第28页/共357页3评价Weiss(1972)认为,“评价(evaluation)是指为作出某种决策而收集资料,并对资料进行分析,作出解释的系统过程。”与测量、测试相比,评价的含义更广、综合性更强。Bachman(1990)指出,决策的正确与否,一方面取决与决策者本身的能力,另一方面则取决于收集到的信息
24、的质量。在其它条件等同的情况下,如果收集到的信息越可靠,相关性越强,那么,作出正确决策的可能性就越大。所以说,评价的一个很重要的方面就是要获得可靠的、相关的信息。在谈到评价与测量及测试的关系时,Bachman指出,在对个体(学生)作出评价时,我们可以从质量和数量两个方面进行描述,或只描述其中一个方面。所谓质量方面的描述是指对学生的行为作出定性的描述,如某某学生的口头表达能力优秀,书面表达能力优等;数量方面的描述则是指某次测验的分数等。第29页/共357页测试、测量及评价三者之间的关系,使用下面的图来表示。第30页/共357页从图中可以看出,我们在对某教育目标(或学生的行为)作出评价时不一定用到
25、测试或测量(如面积1所示),这种评价属于质量评价,或叫定性评价,如指出学生在学习方面存在的问题。有时在作出评价时只需测量,而无需测试(如面积2所示),对学生的口头表达能力定出级别就属于这种性质的评价。如果要检查学生学习的进步情况,通常就要对学生实施测试,这又是另一种性质的评价,即只通过测试对学生的成绩作出评价(如面积3所示)。许多情况下,测试只是作为一种科研的工具或手段,而不是用来作出评价(如面积4所示),在外语教学、第二语言习得研究领域,我们经常拿水平测试作为研究的工具。不用测试便可进行测量的情况(如面积5所示)在外语教学研究领域也经常碰到,在研究学生的第二语言习得时,如果研究对象为来自不同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简明 英语 测试 教程
限制150内