课程终结性评估结果正态分布调查与研究.pdf
《课程终结性评估结果正态分布调查与研究.pdf》由会员分享,可在线阅读,更多相关《课程终结性评估结果正态分布调查与研究.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2011年第 2 期总第 126 期外语研究Foreign Languages Research2011,?2Serial?126课程终结性评估结果正态分布调查与研究刘宝权(上海财经大学外语系,上海,200433)摘?要:目前大多数高校教务处要求任课教师对于学生的课程终结性评估结果即学期末总评成绩进行正态分布处理。该做法已经持续了很多年。但是该做法是否科学和合理地反映了学生的成绩分布,是否应该继续持续下去,这是本文研究的重点。本文通过调查美国著名语言测试专家的看法和全国高校英语专业四级阅卷老师、高校英语专业八级阅卷老师的现行做法,探讨课程终结性评估结果是否应该呈正态分布的问题,从而为修正目前通
2、行多年的教务处成绩管理提供具有建设性的建议。关键词:课程终结性评估;期末总评成绩;成绩测试;正态分布中图分类号:H319?文献标识码:A?文章编号:1005-7242(2011)02-0063-04?1.引言终结性评估是对一个学段、一个学科教学的教育质量的评价,其目的是对学生阶段性学习的质量做出结论性评价,评价的目的是给学生下结论或者分等级(Davies et.al.2002:192)。期末考试作为终结性评估中的重要方式,已经为教学实践所用多年。授课教师每学期末考试后交试卷成绩单时,总会听到教务处的老师说:学生成绩太高了,没有按正态分布处理。难道我们害怕学生获得好成绩吗?大多数学生获得 90
3、分以上,是否可以表明学生掌握了大部分学习过的内容,教学效果良好?学期期末考试常称成绩测试(achievement test),主要是测量学生整个学期掌握所学内容的状况。成绩测试属于尺度参照型考试(criterion-referenced test),尺度参照型考试结果与标准有关,也就是说所有掌握课程内容的学生都可以得到?A?,不管获得?A?的人数的多寡(Bachman 1990:74)。期末考试是世界范围内几乎所有老师检验学生学习结果和自己教学效果的有效途径。期末考试成绩对于学生有不可忽略的影响,能够关系到学生的升学、就业、是否获得学位、是否被推荐面试攻读硕士生等,也就是说该成绩的解读有很高的
4、后效作用,这就是语言测试领域通常所说的?backwash?。本文的调查显示,很多高校教务处都要求授课教师对于学生的期末总评成绩进行正态分布处理。通常情况下,尤其是在大规模的测试当中,考生的差异程度比较大,如果试卷质量有保证,考生的分数会呈钟状曲线(bel-l shaped curve)正态分布,在正态分布中,数据集中在中间部分,两边呈对称型递减(Brown 2006:13)。有极少数考生得分很高或很低,而大部分考生的得分介于两者之间,也就是通常所说的考生的分数是中间多两头少的情形(修旭东 2002:8)。教务处的要求是否科学而且合理,是否充分代表了学生的能力?本研究旨在通过问卷调查了解目前高校
5、英语专业学期期末成绩正态分布的状况,并采访美国加利福尼亚大学洛杉矶分校的语言测试专家对于学期期末总评成绩的看法作为参考,以修正目前中国国内普遍采用的学期期末总评成绩应该呈正态分布的观念。2.文献综述Bachman&Palmer(1999:212)对于尺度参照型考试的定义是:对学习者依照能力水平的尺度进行评分,而非与其他考生或本族语者的表现相比较来评分。这种方法最大的好处就是使得我们能够根据考生语言能力的大小做出推断,而不仅仅是他同其他考生(包括本族语者)相比表现如何。Alderson(2000:287)的阐述为若一项测试是尺度测试,学生就不是彼此之间相比,而是与成绩水平或者评分描述中的一套标准
6、相比。邹申,杨任明(2000:28-30)提出在标准参照考试里,一个学生所得成绩的含义是通过与事先制订的标准对照后而得出的,而成绩考试属于标准参照考试。邹申(2005:34)后来又提及:在标准参照考试里,一个学生所得成绩的含义是通过与事先制订的标准对照后而得出的;尽管不同的标准参照考试使用不同的标准,但标准的制定都必须依循科学规律,以语言学理论为设计基础;标准内等级的区分也必须有科学的依据。尺度测试能直接告诉我们考生能运用语言做些什么,尺度测试的目的在于根据考生是否?63?能圆满完成一些任务而将他们分类,就是说任务确定后,能圆满完成的?通过?,不能完成的?不通过?(Hughes 2000:18
7、)。尺度测试是一项检测受试者在所应掌握的目标行为(即尺度)的具体领域的知识或表现水平,这个测试范围通常是一门具体课程的教学;尺度测试被教师用于阐明教学目标和检测目标的实现程度,测试分数反映了受试者相对于尺度的能力,也就是他能做什么和不能做什么,而不是把他/她的表现同其他受试者相比;测试结果常常使用描述性量表而不是数字分数。(Davies et.al.2002:38)常模测试使得测试使用者可以对测试结果做出常模的解释。也就是说,测试结果要参照某一组人的表现或基准来解释。这个?基准组?一般是同受试对象相似的一群个体。在设计常模测试的时候,先给?基准组?测试,然后他们表现的一些特点(即基准)就被作为
8、参照分来解释另一群受试学生的表现。如果常模测试设计得当,分数就会呈现一个?钟形?的正态曲线。在另一些情况下,常模测试结果仅仅按照受试组本身来解释,而没有一个另外的?基准组?(Bachman 1990:72-73)。常模测试的目的是把考生按某种顺序层次分类,这样他们就能够彼此间进行比较(Alderson 2000:292)。在常模参照考试中,某一学生成绩的高低要通过与同一考试内其他学生成绩(或一个常模组)的比较才能得知。在这种情况下,我们经常说学生 A 的成绩使他位于最好的 1%的学生中;学生 B 的成绩在全体学生最差的 5%中。也就是说,对一个学生考试成绩的解释是相对于其他学生的成绩而言。水平
9、考试往往是常模参照考试。(邹申,杨任明2000:28-30)常模测试将一个考生的表现同其他考生的表现联系起来。我们不是直接了解学生能够运用语言做些什么。(Hughes 2000:17)在常模测试中,考生的分数是参照其他考生的表现来解释的。因此,每人的表现不是依据自身来衡量,也没有一个外部的尺度,而是依据整个组的表现来作为标准。换句话说,常模测试更加关注的是将学生沿一个能力连续体分散开来(即:正态曲线)(Davies et.al.2002:130)。Brown(2006:5)详细解释了尺度参照性考试与常模参照性考试的区别:在尺度参照性期末考试中,已经学过该门课程的考生应该有能力得 100 分。C
10、TS 理论和 G 理论都认为大规模测试对水平不同的考生所测试的观察分数和误差是呈正态分布的(修旭东 2002:34)。3.对学期末考试和总评计分方式现状的调查3.1 调查目的为了了解当今高校成绩测试呈正态分布的状况,本次研究先后两次调查了参加 2008 年 5 月英语专业四级阅卷的 135名教师和 2009 年 4 月英语专业八级阅卷的 52 名教师,以期回答以下三个具体问题:(1)课程期中和期末考试的考试内容是否与所学课本相关,不考查课外的内容?(2)所教授的课程期末考试的成绩是否呈正态分布?(3)如果期末考试的成绩不呈正态分布,贵校是否要求用学生的平时成绩将学生的总评成绩调整成为呈正态分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课程 终结 评估 结果 正态分布 调查 研究
限制150内