教育测量与评价(共6页).doc
《教育测量与评价(共6页).doc》由会员分享,可在线阅读,更多相关《教育测量与评价(共6页).doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上教育测量与评价期末复习重点一、名词解释1.教育测量:指针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。2.教育评价:教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。3.常模参照:常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。4.标准参照(标准参照测验):在一定的行为领域上按照具体的行为标准水平对被试的测验结果作出直接解释的测验。标准参照测量与评价是将被试
2、的表现与既定的教育目标或行为标准相比较,以评价被试在多在大程度上达到该标准。5.典型行为:典型行为测量与评价要求被试按通常的习惯方式做出反应(即典型行为),其目的不在于测量与评价被试能力的高低,而是测量与评价是否具备某种典型行为。6.最佳行为:最佳行为测量与评价是以测量被试的最佳行为表现为目的。如以成就或能力的高低作为评价基础。7.重测信度:指用同一个量表对同一组被试施测两次所得结果的一致性程度。8.复本信度:指两个平行测验测量同一批被试所得结果的一致性程度。9.同质性信度:指测验内部所有题目间的一致性程度。10.内容效度:指一个测验实际测到的内容与所要测量的内容之间的吻合程度。包括欲测的知识
3、范围,以及该范围内各知识点所要求掌握的程度两个方面。11.结构效度:指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。12.实证(效标关联)效度:指一个测验对处于特定情境中的个体的行为进行估计的有效性。13.区分度:指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”。常记为D。14.评价指标:指根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据。15.指标权重:就是表示每项评价指标在指标体系中所占的重要性程
4、度,并赋予相应的值,这个数值就叫做对应指标的权数(权重)。16.评价标准:是针对每个评价指标的分类作出具体规定,提出具体要求和说明。17.常模:指一个有代表性的样组在某种测验上的表现情况,或者说是一个与被试同类的团体在相同测验上得分的分布状况与结构模式。18.常模团体:是由具体某种共同特征的人所组成的一个群体或是该群体的一个样本。19.百分等级:指在一个群体的测验分数中,得分低于这个分数的人数的百分比。20.百分等级常模:就是基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。21.智力:智力是抽象思维能力:智力是正确进行理解、判断和推理的能力。(Binet &
5、Simon,1905)智力是适应的能力或智力是学习的能力:智力是总括性的术语,指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。(Piaget,1972)智力是多种能力的综合,是一种全面能力:智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。(Wechsler,1939)总结:智力是各种认识能力的综合,它包括观察力、注意力、记忆力、想象力、思维能力等,其中以抽象思维能力为核心。22.晶体智力:是获得的知识与技能的有效结合之能力。适用于完成某种固定的任务。23.流体智力:是洞察复杂关系的能力,是在不同环境和条件下都要显示出来的一般的普遍的能力。适用于适应新环境的情形下。二、
6、填空题1.测量的基本要素是参照点和单位。2.结构效度的验证方法:测验内部寻找证据法(内容效度、作答过程分析、测验的同质性、因素分析法)。P61-623.效标关联效度可分为同时效度和预测效度。4.效标关联效度的估计方法:相关法(二列相关、积矩相关)、区分法、命中率。P63-645.客观性试题包括选择题、匹配题、是非题、填空题、简答题等。优点:答案客观,作答简便,在限定的时间内,测验可以包含足够数量的试才所测知识内容的覆盖面。客观题一般适用于测量知识、理解等几个层次的教学目标,在教育测验中用得较多。缺点:不能测量与评价高层次的教学目标,并且编制也较为复杂。6.主观性试题包括论述题、作文题、操作题等
7、。优点:适合于测量较高层次的教学目标,特别是测量综合、评价等目标层次。主观性试题鼓励被试积极地组织资料,表达点,有利于培养被试解决实际问题的能力。缺点:作答耗费的时间过长,在规定的时间内,试题数量不能太多,因而知识的覆盖面较小。由试题没有非常统一明确的标准答案,所以评分易受主观因素的误差较大。7.常见题目编排方式有并列直进式、混合螺旋式。8.测验的常模可分为两类:发展常模(年龄常模、年级常模)、组内常模。发展常模仅适用于高中以前。年龄当量、年级当量具有顺序性,不具有等距性。9.课业考评存在的主要问题:课业考评思想与学校教育理念、目标不相适应;课业考评方法单一;课业考评抽象化和表征化。10.课业
8、考评改革的主要目标:要实现考试向发展性评价观转变;要努力实现从重视“掌握性结果”的评价转变到既重视“掌握性结果”又重视“发展性结果”的评价;内容从认知领域转变到憨盖学习结果的更广泛的教育目标领域上来;要努力实现从表征性分数机制到实质性内容机制的转变。11.学生课业发展的主要内容:学生的个体一般性发展、学科理论知识和学科能力或技能的发展、思维技能与品质的发展、研究与学习技能的发展、创新精神与实践能力的发展、态度、观念及兴趣的发展、欣赏与审美的发展、适应与习惯的发展、学生体育技能与素质的发展、个体独特性的发展。12.评价学生课业发展进步的个人发展参照法有:个人发展横向参照法、个人发展纵向参照法及个
9、人发展潜力参照法。P18213.评价学生课业发展进步的主要方法:客观题评价法与主观题评价法、表现性测验评价法(口头测验:口试、课堂提问、论辩或辩论;论文题测验:短文题考试、写作测验、实验技能教学考试评价)。14.斯皮尔曼G因素说:G因素(一般因素)是智力的核心,而S因素(特殊因素)只有在某些情况下才会表现出来。15.桑代克的特殊因素说、塞斯顿群因素说、弗农智力层次结构模型、吉尔福特的智力三维结构模型、卡特尔的流体智力和晶体智力理论、加德纳的智力结构理论、斯腾伯格的成功智力理论。P221-22616.自陈量表包括艾森克人格问卷(EPQ)、WAIS、爱德华个人兴趣量表。17.投射测验包括罗夏克墨迹
10、测验、默瑞的主题统觉测验(TAT)、罗桑兹威格的逆境对话测验。18.卡特尔16种人格因素量表(16PF)是唯一一个没有说谎量表的。附:1.要衡量教育测量的质量,可以采用四个指标:信度、效度、难度和区分度 。2.测验的难度适中,能使测验的信度达到最大,也能使测验的区分度达到最大。3.教育科学研究中绝大部分数据都属于等级变量,这些数据的单位不等值、没有绝对零点,可以比较大小,不能加减更不能乘除。4.最常用的双向细目表是反映测验内容与测验目标关系的双向细目表。5.教育评价表在结构上是由评价指标、指标权重及评价标准三部分组成的。6.广义的教育评价是按照一定的价值标准和_,利用测量和非测量的种种方法系统
11、地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。7.教育测量与评价按测量对象可分为_和_;按测量材料可分为文字测验和非文字测验。8.信度的估计方法有重测信度,_和_。9.内容效度就是测验题目样本对于_与_的代表性程度。15、区分度的值域范围为_。10.年级常模通常用_位数表示,其中,第一位是年。11.教育测量的特点中,测量对象具有_,误差是_避免的。12.标准分数Z本身是关于原始分数X的一种_,要合理使用标准分数。_是基于百分等级形成的另一较常见的评分量表。13.测验题目的恰当难度,应该使P值尽量接近_。14.表述得当的教育目标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 评价
限制150内