英语测试学论文.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《英语测试学论文.doc》由会员分享,可在线阅读,更多相关《英语测试学论文.doc(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、论语言测试的信度与效度【摘要】语言测试是评价语言教学效果的一个至关重要的环节,其科学性与否直接关系到语言教学效果反映的真实程度。而语言测试科学性的决定因素是信度和效度,因此掌握语言测试的信度与效度的相关知识并在测试实践中有意识的加以运用,不仅能够帮助广大语言类教师及时掌握学生的学习情况,而且也能够帮助其对自身教学进行反思与改进。本文将从基本概念、衡量标准、测量方法、影响因素、相互关系、取向变化等方面对语言测试的信效度进行一个比较全面的阐述,以期能够给语言教师一定的借鉴与思考。【关键词】语言测试 信度 效度一 关于信度(一)信度的概念语言测试的信度是指语言测试成绩的稳定性和一致性,或者更具体地说
2、是指语言测试结果不受考试施考时间、监考人员、场地等因素的影响。当被测试对象发生变化,用同样的“尺子”去重复测量时,总是获得类似的结果。语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。如果同一个学生做同一套试卷,做的几次的结果都是一致的,那么我们说这次考试是有信度的;反之,如果分数忽高忽低就说明信度不高,那么表明考试的信度不高。(二)信度的评估信度的评估一般用考试结果的相关系数来表示。相关系数的范围在0和1之间。等于1表示该测试完全可靠,等于0则说明完全不可靠。一般客观题的信度系数定在0.99以上,而如果一套既有客观题又有主观题的测试,信度系数最好不低于0.80。信
3、度的评估方法主要有三种:再测信度、平行试卷信度和内部一致信度。(1)再测信度(Test-Retest)。这种方法是指用同一份试卷在相同的条件下对同一批考生在不同的时间内进行两次测试。两次考试结果的相关系数则是再测信度。(2)平行试卷信度(Parallel Forms)。也称复本信度。当用两份或几份在格式、内容、难度和题目数量等方面都平行、一致或等值的试卷,在不同的时间内对同一批考生进行测试,两次测试结果的相关系数便是平行试卷信度。(3)内部一致信度(Internal Consistency Reliability)。它是指应用每个题目的方差来评估整份试卷的信度。(三)影响信度的因素与提高信度的
4、措施影响信度的因素主要有:(1)考生水平的差异。考生水平越接近,试卷信度越低;考生水平差异越大(标准差也往往很大),信度越高。(2)题目数量。试题数量越少,信度越低;数量越多,信度越高。(3)题目的区分度和数量。通常,命题人员用提高试题题目的区分度和增加试题题目数量提高信度。当然,试题题目数量也不能无限的增加,因考试时间是有限的。(4)评分。主观测试的评分常常因评卷人而异,难以达到较高的信度;客观试卷的评分不受评卷人的影响因此信度较高。(5)样品数量太小。取样大,样本具有广泛性,测试的信度就高,反之信度就低。(6)考试环境与条件。除此之外,考场纪律、题目的难易程度、试题的管理、测试要求等也会影
5、响测试信度。因此,为了提高信度,我们可以采取以下措施,如,提供统一规范的考试环境规范监考、题目必须做到明了易懂等等。适当增加题量。题量较大,试题内容覆盖面较广,减少了测试的偶然性和误差。从理论上讲,题目越多,信度越高,但一次考试的题目太多,考试时间过长,考生也承受不了。保证题项的同质性。以保证题目的同一性与质量的稳定性。控制好题项的难易度,确保题目有较高的区分度。二 关于效度 (一)效度的概念所谓效度,是指测试结果的准确性和有效性的程度,也就是看测试是否达到了预期的目的,简言之,测试是否考了它所要考的。效度高体现在需要测量的东西应该全部包含在测试的内容里。一个测试如果考了它所要考的就是有效度的
6、否则就是没有效度的。(二)效度的检验一次测试效度的检验可以从以下几个方面进行:(1)表面效度。指的是测试的“表面可信度或公众的可接受度”。一个测试看上去测试了预定的技能或能力范畴,那么它就具有表面效度。一般如果测试学生语音语调的考试通过笔头答题的形式完成的话,就不能说这个测试具有表面效度,原因是这种测试方式与语言运用实际方式之间的差距较大。也就是说,直接测试具有表面效度,而间接测试缺乏表面效度。(2)内容效度。内容效度指的是“一测量工具内容上(包括材料、题材、题目)”的代表性或所选内容样本的充分性”。被测试的技能应明确并具有代表性,所测试的内容都应在大纲规定的范围内。(3)尺度关联效度。尺度关
7、联效度指的是测试与某一个“独立并且相当可靠的学生能力测量工具”之间的关联程度,这里的尺度实际上就是后者。如果两者之间的关联程度高,那就表明前者具有尺度关联效度。(4)结构效度。如果一个测试表明能够测量某个理论能力结构,它就具有结构效度。结构效度论证的目的是确定考分的含义是否与期望一致,也就是说结构效度与考分的解释功能有关。以上提到了四种效度,这并不等于说语言测试四种效度都必须高。在实际测试中,不同的测试目的、类型等会各有所侧重,同时也兼顾其他三种效度。(三).影响效度的因素与提高效度的方法影响效度的因素主要有:(1)题目和试卷的指令不清楚。这样考生会因为考试要求不明确而降低成绩。(2)题目的难
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 英语 测试 论文
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内