自学考试复习专题:现代教育测量与评价串讲.doc
《自学考试复习专题:现代教育测量与评价串讲.doc》由会员分享,可在线阅读,更多相关《自学考试复习专题:现代教育测量与评价串讲.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现代教育测量与评价第一章:教育测评概述第一节:教育测量概述 1、从广义上来讲,测量是根据法则给事物分派数字。此定义包含了三个方面的特性:法则、事物、数字。2、法则是测量的标准,也就是测量的依据和准则,即我们根据什么来进行测量。事物是测量的对象,也就是对什么进行测量。数字是测量结果的表现形式。3、测量的三个要素:单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝对零点和相零点);量表(测量工具)。4、将量表从低级到高级排列主要有四种量表水平:类别量表水平、顺序量表水平、等距量表水平、比率量表水平。5、教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。
2、它主要包括对学生的内在精神属性的测量,教育测量主要是一种间接的测量。6、教育测量的特点有测量结果的间接性,度量单位的相对性,测量对象的复杂性,测量目的的针对性。7、教育测量过对象的复杂性:首先,他是内在的,不能直接测量;其次它是多变的;另外,有些主客观因素也会影响测量 的结果。第二节:教育评价概述1、评价是根据某种价值观对事物及其属性进行判断、衡量。2.、哲学史上三种价值观:客观主义价值观;主观主义价值观;辩证唯物主义价值观。3、教育评价是指根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地收集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。4、
3、国外学者关于教育评价的观点:泰勒:确定教育目标在实际上被理解到何种程度的过程;克龙巴赫:评价是为决策提供信息的过程;斯克里文和豪斯:评价是一种对优缺点和价值的评估,是一种既有描述又有判断的活动;大桥正飞夫:教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断。4、教育评价与教育测量的关系:教育测量不是教育评价,但是两者有密切的联系。教育测量是教育评价获得数据资料的重要手段。测量是评价的依据,评价是测量的具体体现。两者又是有区别的,测量关心的是数量的多少,评价关心的是价值的高低,测量是一种纯客观的过程,评价带有主观性,是主观估计和客观测量的统一,测量是一种单一的活动,评价是一种综合的活
4、动。5、教育评价具有导向功能、监督检查功能、激励功能 、筛选择优功能、诊断改进功能。6、教育评价的种类:根据评价的对象和范围的不同,可以分为宏观、中观、微观教育评价;根据评价的时间和作用不同,可以分为诊断性、形成性和总结性评价;根据评价的基准不同,可以分为相对评价和绝对评价;根据评价的性质不同,可以分为需要性、可行性和配置性评价;根据评价的主客体不同,可以分为自我评价和他人评价。7、在教育、教学活动开始之前,为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。8、形成性评价指在教育、教学活动计划实施的过程中,对计划、方案执行情况进行的评价。9、总结性评价指某一教育、教学活动项目,是告一
5、段落或完成以后进行的评价。第三节:教育测评的发展阶段1、 教育测量的历史知识: 学记记载中国在西周实行了教育考评; 1702年英国剑桥大学首先用笔试代替口试; 1845年美国在初等教育中以笔试代替口试; 1864年英国费舍收集学生成绩样本汇成量表集开启了标准化测量的萌芽; 1897年莱斯的拼字测验推动教育测验的发展; 冯特的测量方法和高尔顿的统计方法对教育测量产生重大影响; 1905年法国比纳-西蒙智力量表具有经典型; 1904年美国的桑代克为教育测量之父,其名言:“凡是存在的东西都有数量,凡是有数量的东西都可以测量”。 美国的教育测验运动分三个时期:1904-1915开拓期,1915-193
6、0为兴盛期,1930-1940为批判期。1931年塞蒙兹主张人格测量应用评定发、问卷法、交谈法、轶事记录法等。2、1904年桑代克发表了精神与社会测验学导论,标志着教育测验运动的开始。3、泰勒主持了课程设置和成绩测试的“八年研究”(1933-1940年),首次提出了“教育评价”的概念,并发表了史密斯泰勒报告,此报告誉为“划时代的教育评价宣言”,泰勒被称为“教育评价之父”。4、1963年,克龙巴赫发表了通过评价改革课程。5、1967年,斯克里芬发表了评价方法论第一次对形成性和终结性评价等不同类型的评价之间做了区分。第二章:教育测量的质量指标 第一节:信度1、信度是测量结果的稳定性或可靠的程度,即
7、测量的结果是否真实、客观地反映了考生的实际水平。可以从三个方面来理解信度:实测值与真值相差程度;统计量与参数之间接近程度;两次重复测量或等值测量之间的关联程度。2、计算信度的几种常用的方法:稳定性系数:又称为重测信度,它是指用同一测验试卷,在先后两个不同时间内同一组被试进行测验,两次测验实得分数的相关系数。这是估量信度最简单的方法。等值性系数:先实施第一次测验,然后在最短的时间内实施第二份等值的测验,再求他们得分的相关系数,这个相关系数就是信度的等值性系数。内部一致性系数:把一次测验人为地分成两部分,比较两个部分的一致程度,从而估计信度系数。估计方法有两种:分半信度和库德尔-理查森公式法。论文
8、式测验信度系数;评分者信度。3、信度系数以多大为宜:对于学科测验,信度系数要求达到0.9以上,智力测验要求达到0.8以上,品德测验能达到0.6以上。4、测量误差的来源基本可分为三类:第一类误差产生于测验的本身;第二类误差与特定的实施条件有关;第三类误差包括被试本身的变化。5、提高测验信度的方法:适当增加测验题目的数量;测验的难度要适中;测验的内容应尽量同质;测验的程序要统一;测验的时间要充分;评分要尽量做到客观化、减少评分误差。第二节:效度1、效度是测量结果的准确性和有效性程度,也是指测量是否达到了预期的目的。2、效度分为三大类:内容效度、效标关联效度、结构效度。3、内容效度是指测验目的代表所
9、欲测量的内容和引起预期反应所达到的程度。估计内容效度的方法有:逻辑分析的方法和用测验题目与教材内容比较的方法。4、效标关联效度又称为经验效度和统计效度,是以测验分数和效标之间的相关系数来表示测验的效度的高低的。5、结构效度是指一个测量能实际测量出理论上的狗年或者心理特性的程度。6、影响效度的因素:测验的组成;测验的实施;被试主观状态方面;估计效度所依据的效标;样本方面。7、提高效度的方法:控制系统误差;精心编制量表;妥善组织测验;扩充样本的容量和代表性;合理处理效度和信度的关系;适当增加测验的长度。第三节:难度1、难度是测验试题的难易程度,是试题对学生知识和能力水平的适合程度的指标。公式:P=
10、R/N;P表示难度指标;N代表参加考试的总人数;R表示答对某道客观题的人数。2、难度对测验的影响:影响测验分数的分布形态;影响测验分数的离散程度;影响测验的鉴别能力。3、影响题目难度的因素:考查知识点的多少;考查能力的复杂程度或层次的高低;考生对题目的熟悉程度;命题的技巧性。4、在常模参照性测验中要求试题难度适中,即大多数题目的难度在0.3- 0.7之间,整个试卷平均难度在0.5左右。第四节:区分度1、 区分度是指测验对考生实际水平的区分程度。公式:D=PH-PL;D代表区分度;PH表示高分组的难度;PL表示低分组的难度。D0为正区分,D0为负区别,D=0为零区。 2、要想达到理想的测验信度,
11、提高区分度是一个好方法。难度适中可以使区分度达到最大值。3、提高区分度的方法:使题目的难度适中,使整个考试的难度适中;着重考察复杂的学习结果。第三章:教育测验的编制与实施第一节:测验目标的确定1、 测验目标:测验所要达到的某种具体目的,它明确规定测验所要达到的预期结果或标准。是编制测验的出发点和依据。2、布卢姆把教育目标分为认知领域、情感领域和动作技能领域的目标。他把认知领域的教育目标分为知识、应用、理解、分析、综合和评价六类。3、1964年,布卢姆等人发表了教育目标分类学:第二分册:情感学习领域。4、1977年,加涅在学习的条件的第三版中将认知领域分为言语信息、智力技能、认知策略三种。智力技
12、能分辨别、概念、规则、高级规则四类;学习的结果分智力技能、认知策略、言语信息、运动技能和态度五种。5、日本的梶田叡一在他的教育评价分为三大目标:基础目标、提高目标、体验目标.6、确定教育测验目标应注意的问题:深入分析课程教学目标;正确选择目标领域及其类目;正确理解各类目标之间的关系。 第二节:测验题型的确立1、测验题型可以分为两大类,一类是封闭式,另一类是开放式。2、教育测验编制中通用的七种题型:是非题;配对题;选择题;填空题;改错题;名词解释题;简答题;计算题;论述题。3、一套试题的题型一般不应少于四种。第三节 命题设计1、测验编制中,设计试卷的蓝图是命题双向细目表。2、认知领域命题设计方法
13、,主要包括内容类测验目标模型之构建,内容点测验目标表之确定,命题方案表之设计。第四节:试题的编制1、试卷编制的质量要求:明确测验的目标;题量尽可能大,试题的覆盖面尽量宽;掌握好试题的区分度和难度;注意改进题型;每道试题的编写要讲究科学性;制定好标准答案,评分标准和评卷的具体要求;拼卷和检核。2、进行教育测验的编制时,一套试题中的客观题约60%,主观题约占40% ;测验试题难度的掌握一般情况下,较容易的试题占20%左右。第五节:测验实施1、测验实施要做好以下几个工作:指定专人做好考务工作;确定测验形式和审查学生测验资格;考场的组织;测验评卷与测验质量检查;补考。第四章:教育评价方案的编制与实施第
14、一节:教育评价的基本原则1、教育评价的基本原则:方向性原则;公平性原则;客观性原则;科学性原则;可行性原则;指导性原则。2、注重调查研究,整理资料不随意夸大或缩小事实,鉴定要准确,评议要恰如其分,这是教育评价客观性原则的基本要求。3、评价方案的确定要考虑人力、物力、时间等各种因素,指标体系不要过于繁琐,便于计算,这是教育评价 可行性原则的基本要求。第二节 教育评价方案的制定1、教育评价指标体系的结构包括:框架;模型;指标;标准;量化符号。2、教育评价指标体系可以分为一般模型和分类模型。一般模型适应于该范围内所有被评价者的评价与比较;分类模型适应于某一种被评者的评价与比较。3、量化符号是教育评价
15、指标体系结构中不可忽视的部分,它一般有权数和分数两类。权数常用小数形式,一般把同一级指群视为一个整体,整体权数总值为1。4、教育评价指标从达标水平去考察,可以分为必达指标和期望指标。教育评价指标从精确度去考察,可以分为硬指标和软指标两种。硬指标是指“硬件”,是固定的精确的指标。软指标是指“软件”,是伸缩性较大,不精确的指标。5、教育评价指标从内涵性质去考察,可以分为稳定性指标和变动性指标两种。6、评价教育实际达到指标程度的具体要求就是评价标准。从评价的内容上分,可以将评价标准分为素质标准、职责标准、效能标准。按照评价的参照点角度去分类,可以将评价标准分为社会标准和科学标准。7、社会标准:以社会
16、对教育的现象要求为依据,要求达标过程社会化规范化。科学标准:根据客观规定和原则为依据,要求达标符教育的客观规律。 8、构建教育评价指标体系首先要考虑的问题是信度与效度问题,因为信度和效度是教育评价指标体系实施的前提条件,是衡量教育评价指标体系构建质量的重要尺度。9、教育评价指标体系的信度有三个方面:重评信度、评价者信度、事实信度。10、构建教育评价指标体系的主要依据有:教育方针、政策、法规;教育理论和知识;教育规律;教育工作实际。11、评价标准的确定,主要解决两个问题,包括标准类别的选择各等级评价标准的规定。12、评价标准的编制方法:期望评语式编写法;积分评语式编写法:包括等分积分评语式编写法
17、和累计积分评语式编写法;隶属度式编写法:包括隶属度分段式编写法和隶属度全域式编写法;行为目标式编写法;量表式编写法;量尺式编写法。13、通过观察分析,选择一例关键行为作评价的一种标准,这是行为目标式编写法。 第三节:教育评价的实施1、教育评价的准备工作主要有思想准备、材料和工具的准备、组织准备。2、教育评价实施可以分为自评和他评两步。自评是指学校、班级或者个人的自我评价。他评是指由别人对被评者进行评价。3、评价结果的处理是教育评价活动的最后阶段,教育评价结果处理中应该做好的工作:评价结果的分析判断;做出综合评价的结论;评价结果的信息反馈;评价工作的总结。第五章:教育评价的方法第一节:教育评价方
18、法概观1、相对评价法指在评价对象的集合中选取一个或若干个作为基准,然后把各个对象与基准进行比较。绝对评价法指在评价对象的集合之外确定一个标准,评价时候把评价对象与客观标准进行比较。个体内差异评价法指吧被评价者的过去和现在比较,或将评价对象的不同方面进行比较。2、定性分析评价法指预先根据评价的观点,把评价内容分解为几个项目,分别进行评价。定性综合判断法指对评价对象的整体进行综合性的评价。3、行为目标评价法指采用可观测的行为目标作为评价的依据的一种评价方法。行为目标的表达要注意两点:应设立可能观察行动的场合;应容易表示出行动的程度或阶段。4、临床督导评价法:就是对评价者的实际行动进行直接的现场观察
19、和记录,然后把观察结果和评估意见反馈给被评者,并和被评者一起商讨改进措施的一种评价方法。5、加权平均法是通过自评、专家组评、社会群众评等不同方面的评价,或者学生、教师、领导等不同阶层的评价者的评价来综合评定被评者的分数。第二节 :收集教育评价信息的方法1、评价信息收集的标准主要有准确性、可靠性和时限性。准确性是指收集到的信息与评价目标的一致性,指采集到的材料是评价目标真正需要的资料。可靠性是指收集到的资料的真实可靠,是信得过的资料,这些资料所反映的情况完全符合客观实际。时限性是指严格按照评价工作所规定的时限去采集评价信息。2、评价信息收集的方法:观察;听汇报;调查访问;座谈会;收集文字资料;)
20、发问卷;测试。3、观察的途径有:实地参观考察;听课;参与有关活动。观察记录的方法有:连续行为记录法;时间取样记录法;事件取样记录法。观察的辅助工具:记录装置;记录表格。记录表格有四种形式:等级式,是非式,次数式,文字式。4、运用调查访问法的基本要求:制定好访问计划和提纲,依此开展访问工作;选择好访谈对象;围绕着调查提纲去问话;注意访谈态度;做好记录工作。5、召开座谈会的基本要求:根据评价内容的要求和实际情况去选择座谈会的种类;做好准备工作;座谈会上,以自由发言的形式为宜;制定专人做记录工作。6、测试是指通过书面测验和考核、实践操作、口头询问、活动考验等形式去收集评价信息的方法,它包括各种各样的
21、测验和考试。第三节:处理教育评价信息的方法1、处理评价信息的方法:定性分析描述法:包括等级评定法、评语鉴定法、写实分析法。定量分析评判法:包括统计分析评判法和模糊综合评判法。 2、写实分析法是根据一定的评价目标和要求,对评价对象的情况进行较为详细的描述,并在此基础上作出恰当的评价。 3、写实分析法的做法是:搜集事实材料;对收集到的材料进行整理和描述;分析和评价。 4、教育评价中应用较多的统计分析是平均数、标准差、标准分数、T分数、参数估计和统计检验。加权平均数的计算,参见p136例题 5、教育评价结果合成可分为三种:第一种是单纯普通数据的合成方法;第二种是单纯模糊数据的合成方法;第三种是混合数
22、据的合成方法。第六章:教育测量结果的整理、转换与组合第一节:教育测量数据的特点与种类1、数据的特点一般包括:数据的波动性;数据的规律性。波动性一是指一组数据多数取值是不相同的,二是指即便同一事物的数量表现,在不同时间、场地,由不同的量表测试,其结果肯定有差别;规律性是指大量数据的变化是有一定规律的。2、数据的种类有:按照数据的来源可以分为点计数据和度量数据;按照数据的连续与否,可以分为间断性数据和连续性数据;按照数据的精确性程度,可以分为类别数量、等级变量、等距变量、比率变量。3、教育测量数据的特点包括:绝大部分属于等级变量,可以比较大小不能加减更不能乘除。大多数数据从本质上说是主观的。教育测
23、量的数据具有随机性。教育测量的数据具有模糊性。第二节:教育测量分数的初步整理1、数据的初步整理分为列统计表和画统计图。统计表一般由表序、表题、标目、线条、数字、表注等构成。第三节:教育测量分数的转换1、教育测量所直接得到的分数叫做原始分数。1、将教育测量得出的原始分数转换后得出的分数是导出分数,包括:标准分数、T分数、百分等级分数。标准分数的计算,参见p155例题2、标准分数是将原始分数与其平均数之差除以标准差所得的商数。标准分数又叫Z分数。3、百分等级分数是一种相对地位量数,他把参加测量的全体人数作为一百份来计算,从而以某一原始分数换算出其在全体中所占的地位。4、百分等级分数的缺点:首先,它
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自学考试 复习 专题 现代教育 测量 评价 串讲
限制150内