课程终结性评估结果正态分布调查与研究.pdf

上传人：qwe****56

文档编号：74673376

上传时间：2023-02-27

格式：PDF

页数：4

大小：319.56KB

( 4.5 )

《课程终结性评估结果正态分布调查与研究.pdf》由会员分享，可在线阅读，更多相关《课程终结性评估结果正态分布调查与研究.pdf（4页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、2011年第 2 期总第 126 期外语研究Foreign Languages Research2011,?2Serial?126课程终结性评估结果正态分布调查与研究刘宝权(上海财经大学外语系,上海,200433)摘?要:目前大多数高校教务处要求任课教师对于学生的课程终结性评估结果即学期末总评成绩进行正态分布处理。该做法已经持续了很多年。但是该做法是否科学和合理地反映了学生的成绩分布,是否应该继续持续下去,这是本文研究的重点。本文通过调查美国著名语言测试专家的看法和全国高校英语专业四级阅卷老师、高校英语专业八级阅卷老师的现行做法,探讨课程终结性评估结果是否应该呈正态分布的问题,从而为修正目前通

2、行多年的教务处成绩管理提供具有建设性的建议。关键词:课程终结性评估;期末总评成绩;成绩测试;正态分布中图分类号:H319?文献标识码:A?文章编号:1005-7242(2011)02-0063-04?1.引言终结性评估是对一个学段、一个学科教学的教育质量的评价,其目的是对学生阶段性学习的质量做出结论性评价,评价的目的是给学生下结论或者分等级(Davies et.al.2002:192)。期末考试作为终结性评估中的重要方式,已经为教学实践所用多年。授课教师每学期末考试后交试卷成绩单时,总会听到教务处的老师说:学生成绩太高了,没有按正态分布处理。难道我们害怕学生获得好成绩吗?大多数学生获得 90

3、分以上,是否可以表明学生掌握了大部分学习过的内容,教学效果良好?学期期末考试常称成绩测试(achievement test),主要是测量学生整个学期掌握所学内容的状况。成绩测试属于尺度参照型考试(criterion-referenced test),尺度参照型考试结果与标准有关,也就是说所有掌握课程内容的学生都可以得到?A?,不管获得?A?的人数的多寡(Bachman 1990:74)。期末考试是世界范围内几乎所有老师检验学生学习结果和自己教学效果的有效途径。期末考试成绩对于学生有不可忽略的影响,能够关系到学生的升学、就业、是否获得学位、是否被推荐面试攻读硕士生等,也就是说该成绩的解读有很高的

4、后效作用,这就是语言测试领域通常所说的?backwash?。本文的调查显示,很多高校教务处都要求授课教师对于学生的期末总评成绩进行正态分布处理。通常情况下,尤其是在大规模的测试当中,考生的差异程度比较大,如果试卷质量有保证,考生的分数会呈钟状曲线(bel-l shaped curve)正态分布,在正态分布中,数据集中在中间部分,两边呈对称型递减(Brown 2006:13)。有极少数考生得分很高或很低,而大部分考生的得分介于两者之间,也就是通常所说的考生的分数是中间多两头少的情形(修旭东 2002:8)。教务处的要求是否科学而且合理,是否充分代表了学生的能力?本研究旨在通过问卷调查了解目前高校

5、英语专业学期期末成绩正态分布的状况,并采访美国加利福尼亚大学洛杉矶分校的语言测试专家对于学期期末总评成绩的看法作为参考,以修正目前中国国内普遍采用的学期期末总评成绩应该呈正态分布的观念。2.文献综述Bachman&Palmer(1999:212)对于尺度参照型考试的定义是:对学习者依照能力水平的尺度进行评分,而非与其他考生或本族语者的表现相比较来评分。这种方法最大的好处就是使得我们能够根据考生语言能力的大小做出推断,而不仅仅是他同其他考生(包括本族语者)相比表现如何。Alderson(2000:287)的阐述为若一项测试是尺度测试,学生就不是彼此之间相比,而是与成绩水平或者评分描述中的一套标准

6、相比。邹申,杨任明(2000:28-30)提出在标准参照考试里,一个学生所得成绩的含义是通过与事先制订的标准对照后而得出的,而成绩考试属于标准参照考试。邹申(2005:34)后来又提及:在标准参照考试里,一个学生所得成绩的含义是通过与事先制订的标准对照后而得出的;尽管不同的标准参照考试使用不同的标准,但标准的制定都必须依循科学规律,以语言学理论为设计基础;标准内等级的区分也必须有科学的依据。尺度测试能直接告诉我们考生能运用语言做些什么,尺度测试的目的在于根据考生是否?63?能圆满完成一些任务而将他们分类,就是说任务确定后,能圆满完成的?通过?,不能完成的?不通过?(Hughes 2000:18

7、)。尺度测试是一项检测受试者在所应掌握的目标行为(即尺度)的具体领域的知识或表现水平,这个测试范围通常是一门具体课程的教学;尺度测试被教师用于阐明教学目标和检测目标的实现程度,测试分数反映了受试者相对于尺度的能力,也就是他能做什么和不能做什么,而不是把他/她的表现同其他受试者相比;测试结果常常使用描述性量表而不是数字分数。(Davies et.al.2002:38)常模测试使得测试使用者可以对测试结果做出常模的解释。也就是说,测试结果要参照某一组人的表现或基准来解释。这个?基准组?一般是同受试对象相似的一群个体。在设计常模测试的时候,先给?基准组?测试,然后他们表现的一些特点(即基准)就被作为

8、参照分来解释另一群受试学生的表现。如果常模测试设计得当,分数就会呈现一个?钟形?的正态曲线。在另一些情况下,常模测试结果仅仅按照受试组本身来解释,而没有一个另外的?基准组?(Bachman 1990:72-73)。常模测试的目的是把考生按某种顺序层次分类,这样他们就能够彼此间进行比较(Alderson 2000:292)。在常模参照考试中,某一学生成绩的高低要通过与同一考试内其他学生成绩(或一个常模组)的比较才能得知。在这种情况下,我们经常说学生 A 的成绩使他位于最好的 1%的学生中;学生 B 的成绩在全体学生最差的 5%中。也就是说,对一个学生考试成绩的解释是相对于其他学生的成绩而言。水平

9、考试往往是常模参照考试。(邹申,杨任明2000:28-30)常模测试将一个考生的表现同其他考生的表现联系起来。我们不是直接了解学生能够运用语言做些什么。(Hughes 2000:17)在常模测试中,考生的分数是参照其他考生的表现来解释的。因此,每人的表现不是依据自身来衡量,也没有一个外部的尺度,而是依据整个组的表现来作为标准。换句话说,常模测试更加关注的是将学生沿一个能力连续体分散开来(即:正态曲线)(Davies et.al.2002:130)。Brown(2006:5)详细解释了尺度参照性考试与常模参照性考试的区别:在尺度参照性期末考试中,已经学过该门课程的考生应该有能力得 100 分。C

10、TS 理论和 G 理论都认为大规模测试对水平不同的考生所测试的观察分数和误差是呈正态分布的(修旭东 2002:34)。3.对学期末考试和总评计分方式现状的调查3.1 调查目的为了了解当今高校成绩测试呈正态分布的状况,本次研究先后两次调查了参加 2008 年 5 月英语专业四级阅卷的 135名教师和 2009 年 4 月英语专业八级阅卷的 52 名教师,以期回答以下三个具体问题:(1)课程期中和期末考试的考试内容是否与所学课本相关,不考查课外的内容?(2)所教授的课程期末考试的成绩是否呈正态分布?(3)如果期末考试的成绩不呈正态分布,贵校是否要求用学生的平时成绩将学生的总评成绩调整成为呈正态分布

11、?3.2 调查设计本次研究设计了包含 5 个问题的调查问卷,分四、八级两次进行。英语专业四、八级阅卷的老师来自全国各个高校,包含了综合性大学、外语类院校、理工类院校、师范类院校和其他类院校。样本比较有代表性,能够反映目前大部分高校的具体做法。3.3 调查结果第一次样本采集情况:调查对象是参加国内英语专业四级考试阅卷的老师,共 135 人,于2008 年 5 月21 日完成该项调查。调查结果如下:1)期末考试成绩占总评成绩百分比。共计 130 份有效问卷,5 份无效问卷。期末考试成绩占总评成绩百分比40%45%50%60%70%80%90%问卷数161133054142?表 1:期末考试成绩占总

12、评成绩百分比2)考试内容是否与学生课本内容相关。共计 134 份有效问卷,1 份无效问卷。?64?是否与课本内容相关是否问卷数4094?表 2:课程期中和期末考试的内容是否与所学课本相关3)考试分数是否要求呈正态分布。共计 131 份有效问卷,4 份无效问卷。课程期末考试分数是否要求呈正态分布是否问卷数10625?表 3:课程期末考试成绩是否要求呈正态分布4)是否要求用平时成绩将学生总评成绩进行正态分布处理。有效问卷 123 份,12 份无效问卷。是否要求用平时成绩将学生总评成绩进行正态分布处理是否问卷数4083?表 4:是否要求用平时成绩将学生总评成绩进行正态分布处理第二次样本采集情况:调查

13、对象是参加国内英语专业八级考试阅卷的老师,共 52 人,于 2009 年 4 月1日完成该项调查。调查结果如下:1)期末考试成绩占总评成绩百分比。共计 52 份有效问卷,0份无效问卷。期末考试成绩占总评成绩百分比40%45%50%60%70%80%90%问卷数3111718102?表 5:期末考试成绩占总评成绩百分比2)考试内容是否与学生课本内容相关。共计 52份有效问卷,0 份无效问卷。是否与课本内容相关是否问卷数1438?表 6:课程期中和期末考试的内容是否与所学课本相关3)考试分数是否要求呈正态分布。共计 51份有效问卷,1 份无效问卷。课程期末考试分数是否要求呈正态分布是否问卷数474

14、?表 7:课程期末考试成绩是否要求呈正态分布4)是否要求用平时成绩将学生总评成绩进行正态分布处理。有效问卷 52 份,0 份无效问卷。是否要求用平时成绩将学生总评成绩进行正态分布处理是否问卷数2527?表 8:是否要求用平时成绩将学生总评成绩进行正态分布处理在互联网几个搜索网页上输入?期末总评成绩正态分布?字样,可以获得许多大学对于期末总评成绩是否应呈正态分布的官方文件,这些学校的教务处均要求授课教师对于学生期末总评成绩进行正态处理。4.讨论笔者在加州大学洛杉矶分校(UCLA)访学期间就期末总评成绩是否应该进行正态分布处理的问题与著名语言测试专家 Lyle F.Bachman 和 Anton

15、y Kunnan 等在 2008年 5 月 19 日至 20 日的第 11 届南加利福尼亚大学语言测试研讨会上交换了看法,同时向 UCLA 专攻语言测试方向的博士生做了调查,他们的?65?意见可以归纳如下:1)期末考试属于成绩测试,不需要进行正态分布处理;2)期末考试在期末总评成绩中的比重为 60%左右为宜;3)期末成绩不呈正态分布是可以理解的,这样的成绩恰恰表明老师教得好,学生学得好;4)期末考试的内容应全部基于课本学过的内容。通过以上调查,我们可以得出以下结论:1)期末考试成绩占期末总评成绩的 60 70%较为合理。2)课程考试的内容要基于学过的内容,考查学生是否掌握了该课程的主要内容。即

16、使涉及到课外内容,课外内容也要与课程内容相关。课程考试不同于选拔性考试,不必用一些难度高的题目将学生的水平区分开来。3)大部分高校要求教师对于期末总评分数进行正态分布处理,这一做法不妥。笔者 2009 年 9 月在上海两所大学就学业成绩的后效作用做了调研,样本来自英语专业共 120 名学生。调查采用课堂问答的形式进行,学生认为,学业成绩主要影响到以下几个方面:1)是否能够顺利毕业;2)是否能够获得奖学金;3)是否有资格被推荐攻读硕士学位;4)是否能够找到好工作;5)申请出国时是否能够拿到外国大学的全额奖学金;6)是否有资格选择第二辅修专业;7)是否能够参加交换生项目;8)是否能够调剂专业。由此

17、看来,成绩测试关系到学生的未来。各个学校教务处要求老师对成绩测试进行正态分布处理的做法是有害的,对学生是不公平的,违背了科学的测试理论。5.结语学习成绩测试一般都属于标准参照测试;相比较而言,一般的选拔性考试(例如高考)都属于常模参照考试。常模参照考试看重的是?区分度?,将考生排定名次,将其区分开来,而标准参照考试的目的是看考生是否达到特定的标准。成绩测试的成绩不需要进行正态分布处理。一般情况下,成绩测试不具备区分学生的功能。成绩测试可以全部考核课本上已经学过的内容,如果授课教师认为需要增加课外知识,那么该课外知识考察的构念效度应与课本相关,学生没有接触过的语言点不应成为考试的内容。期末考试中

18、如果很多学生得了 90 分以上,那么期末总评成绩不应该人为地根据正态分布曲线调整学生的分数。学生成绩优秀都获得 90 分以上也是可以接受的。鉴于成绩测试的高低对于学生各个方面都有很大的影响,各高校需要充分考虑到测试的反拨作用,携起手来共同修正现行的考试评价制度。参考文献:1 Alderson J.Charles.2000.Language T est Construction and Evaluation M.Beijing:Foreign Language T eaching andResearch Press.2 Bachman,L.F.1990.Fundamental Considera

19、tions in Language T esting M.Oxford:Oxford University Press.3 Bachman,L.F.&A.S.Palmer.1999.Language Testing in Practice M.Shanghai:Shanghai Foreign LanguageEducation Press.4 Brown,J.D.2006.Testing in Language Programs:A Comprehensive Guide to English Language Assessment M.Beijing:Higher Education Pr

20、ess.5 Davies,A.,A.Brown,C.Elder,K.Hill,T.Lumley&T.McNamara.2002.Dictionary of Language Testing M .Beijing:Foreign Language T eaching and Research Press.6 Hughes,Arthur.2000.T esting f or Language Teachers M.Beijing:Foreign Language T eaching and Research Press.7 修旭东.2002.中外语言测试基本理论与实践M.青岛:中国海洋大学出版社.8 邹申.2005.语言测试 M.上海:上海外语教育出版社.9 邹申,杨任明.2000.简明英语测试教程 M.北京:高等教育出版社.收稿日期:2010-08-10作者简介:刘宝权,博士,副教授。研究方向:英语测试理论与实践,跨文化交际能力测试。(责任编辑:张?辉)?66?

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 课程终结评估结果正态分布调查研究

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：课程终结性评估结果正态分布调查与研究.pdf
链接地址：https://www.taowenge.com/p-74673376.html