教育评价常用的工具与方法.ppt
《教育评价常用的工具与方法.ppt》由会员分享,可在线阅读,更多相关《教育评价常用的工具与方法.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教育评价常用的工具与方法现在学习的是第1页,共25页教育评价工具是指对评价对象进行评价时所采用的方式和手段。教育评价方法是指评价的程序和角度;现在学习的是第2页,共25页巴登(BUVTON,W.H.)在活动指南(THE GUIDANCE OF ACTIVICE)一书中,把教育评价工具列出了以下12种:1.传统的论文式考试2.改良的论文式考试3.标准测验(智能测验、学习能力测验、人格测验、性向测验)4.教师自制的客观测验(填空法、完成法、真伪法、选择法)5.问题情景测验(直接方法、间接方法)现在学习的是第3页,共25页6.行动观察记录(自然观察、时间样本观察、情景样本观察、真相观察)7.自我诊断
2、测验(自陈法)8.问卷法9.接谈法10.创作,作品分析11.实验报告、研究报告,作品,实演及其他业绩之分析12.个案研究以上这些工具,在我国基本上以采用,只是名称不同,有的常用面不广现在学习的是第4页,共25页第一节第一节 测验法测验法一、标准测验(正式测验)一、标准测验(正式测验)标准测验标准测验,又称标准化考试,是根据现代考试理论,运用现代统计手段,严格按照科学程序设计与实施,并且有统一标准的考试。它一般是由专家在对优秀测验的诸种条件进行研究的基础上,亲自编制而成的,除了测验试题外,还应经过科学手续制定一定的评价标准即常模。当使用这种测验试题进行考试时,只要把测验后的结果同这一常模作对比分
3、析,便可判断被试者的程度。由于这种考试的试题和常模是经过科学程序制作而成的,故测验分数比较稳定,可靠性强,测验分数不会因考试地点、时间及工作人员的不同而发生变化。而且这种考试的代表性很高,适用范围很广,小到一个地区,大到全国,甚至全世界。如美国专为外国留学生设计的英语水平考试(TOEFL),就是一种适用于全世界范围所有国家和地区考生的标准化考试。为了保证考试的有效性,同时也为了保证考试的稳定性和代表性,这种考试的题置一般都很大,且以客观性试题为主。现在学习的是第5页,共25页编制和实施标准化测验的要求:编制和实施标准化测验的要求:1.要有测验大纲和测验指导书,规定测验的范围、内要有测验大纲和测
4、验指导书,规定测验的范围、内容、要求、方式、题型和评分计分方法。容、要求、方式、题型和评分计分方法。2。要按照测验大纲制定出。要按照测验大纲制定出“命题细目表命题细目表”,具体规,具体规定每一考察目标和教学内容在整份试卷中占的比重定每一考察目标和教学内容在整份试卷中占的比重。3.进行预测,计算各题的难度、区分度和整份试卷的信进行预测,计算各题的难度、区分度和整份试卷的信度及效度,调整试卷的整体难度,使学生的测验成绩度及效度,调整试卷的整体难度,使学生的测验成绩呈正态分布。呈正态分布。4.实施过程中要统一规范、统一时间、统一环境,测实施过程中要统一规范、统一时间、统一环境,测验后要统一阅卷步骤和
5、要求,严格规定评分标准验后要统一阅卷步骤和要求,严格规定评分标准5.建立参照量表,提供解释分数的常模,以便把测建立参照量表,提供解释分数的常模,以便把测验的原始分数转换成标准分数,使测验结果有明验的原始分数转换成标准分数,使测验结果有明确的统计学意义确的统计学意义现在学习的是第6页,共25页总之,标准化测验具有命题标准化、题型标准化、总之,标准化测验具有命题标准化、题型标准化、评分标准化、计分标准化等特点,因此;评分标准化、计分标准化等特点,因此;n标准化测验不会因测验实施者的不同而不同标准化测验不会因测验实施者的不同而不同n受测者的成绩可以相互比较受测者的成绩可以相互比较n可以客观地了解个人
6、在集体中的相对位置。可以客观地了解个人在集体中的相对位置。常用的标准化测验有常用的标准化测验有标准化考试、智力测验、学力测标准化考试、智力测验、学力测验、人格测验和性向测验验、人格测验和性向测验等。等。现在学习的是第7页,共25页然而,然而,n建立参照量表通常需要以有代表性的总体为基础建立参照量表通常需要以有代表性的总体为基础,因此,标准化样本容量必须足够大,通常是,因此,标准化样本容量必须足够大,通常是2000以上,对于应用很广的测验样本通常要上万。因以上,对于应用很广的测验样本通常要上万。因此,标准化测验的设计与实施不是教师个人能完成的此,标准化测验的设计与实施不是教师个人能完成的。现在学
7、习的是第8页,共25页二、标准测验的质量要素(P127)1、信度。是指测验的一致性、稳定性或可靠性。可从以下几方面来提高测验的信度:(1)适当延长测验的长度:测验的长度主要指量表所包含的题目多少。对一个测验来说,测验的题目越少,得分越容易受偶然因素的影响,故测验的信度越低。反之如果测验题目较多,即测验长度延长,扩大了被试得分范围,可在一定程度上排除偶然因素的影响,从而提高测验信度。但是测验信度的增加并不是等比例提高信度系数。当信度系数较小时,延长测验长度信度系数增加较大;当信度系数已经较大时,延长测验长度对信度系数的影响就较小了。而且,在延长测验长度时,还需考虑其他因素的影响,如被试在回答问题
8、时是否疲倦或产生厌烦情绪,是否节省时间、物力和财力,测题是否附合测验目的等。现在学习的是第9页,共25页(2)测验的难度要适中:难度即测验的难易程度,当测验难度太大时,被试得分普遍太低,呈负偏态分布;当测验难度太小时,被试得分普遍较高,呈正偏态分布。太难太易的测验都使被试得分差异减小,使实得分数方差减小,从而降低测验信度。(3)测验的内容尽量同质:性质相同的测验内容,对被试也要求相同的能力、知识和技能;而内容不同质的测验,则要求被试不同的能力、知识和技能。因而为了提高测验信度,测验内容应尽量同质。现在学习的是第10页,共25页(4)测验的时间要充分:对某一测验而言,应保证绝大多数被试在规定时间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 评价 常用 工具 方法
限制150内