书签分享收藏举报版权申诉 / 16

立即下载

当前位置：首页 > 教育专区 > 成人自考 > 自学考试复习专题：现代教育测量与评价串讲.doc

自学考试复习专题：现代教育测量与评价串讲.doc

上传人：小****库

文档编号：4585641

上传时间：2021-10-05

格式：DOC

页数：16

大小：74KB

( 4.5 )

《自学考试复习专题：现代教育测量与评价串讲.doc》由会员分享，可在线阅读，更多相关《自学考试复习专题：现代教育测量与评价串讲.doc（16页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、现代教育测量与评价第一章：教育测评概述第一节：教育测量概述 1、从广义上来讲，测量是根据法则给事物分派数字。此定义包含了三个方面的特性：法则、事物、数字。2、法则是测量的标准，也就是测量的依据和准则，即我们根据什么来进行测量。事物是测量的对象，也就是对什么进行测量。数字是测量结果的表现形式。3、测量的三个要素：单位（如米、克，教育测量的单位不能直接加减乘除）；参照点（计算的起点，有绝对零点和相零点）；量表（测量工具）。4、将量表从低级到高级排列主要有四种量表水平：类别量表水平、顺序量表水平、等距量表水平、比率量表水平。5、教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。

2、它主要包括对学生的内在精神属性的测量，教育测量主要是一种间接的测量。6、教育测量的特点有测量结果的间接性，度量单位的相对性，测量对象的复杂性，测量目的的针对性。7、教育测量过对象的复杂性：首先，他是内在的，不能直接测量；其次它是多变的；另外，有些主客观因素也会影响测量的结果。第二节：教育评价概述1、评价是根据某种价值观对事物及其属性进行判断、衡量。2.、哲学史上三种价值观：客观主义价值观；主观主义价值观；辩证唯物主义价值观。3、教育评价是指根据一定的教育价值观或教育目标，运用可行的科学手段，通过系统地收集信息、分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。4、

3、国外学者关于教育评价的观点:泰勒：确定教育目标在实际上被理解到何种程度的过程；克龙巴赫：评价是为决策提供信息的过程；斯克里文和豪斯：评价是一种对优缺点和价值的评估，是一种既有描述又有判断的活动；大桥正飞夫：教育评价就是对照教育目标，对教育行为产生的变化进行价值上的判断。4、教育评价与教育测量的关系：教育测量不是教育评价，但是两者有密切的联系。教育测量是教育评价获得数据资料的重要手段。测量是评价的依据，评价是测量的具体体现。两者又是有区别的，测量关心的是数量的多少，评价关心的是价值的高低，测量是一种纯客观的过程，评价带有主观性，是主观估计和客观测量的统一，测量是一种单一的活动，评价是一种综合的活

4、动。5、教育评价具有导向功能、监督检查功能、激励功能、筛选择优功能、诊断改进功能。6、教育评价的种类：根据评价的对象和范围的不同，可以分为宏观、中观、微观教育评价；根据评价的时间和作用不同，可以分为诊断性、形成性和总结性评价；根据评价的基准不同，可以分为相对评价和绝对评价；根据评价的性质不同，可以分为需要性、可行性和配置性评价；根据评价的主客体不同，可以分为自我评价和他人评价。7、在教育、教学活动开始之前，为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。8、形成性评价指在教育、教学活动计划实施的过程中，对计划、方案执行情况进行的评价。9、总结性评价指某一教育、教学活动项目，是告一

5、段落或完成以后进行的评价。第三节：教育测评的发展阶段1、教育测量的历史知识：学记记载中国在西周实行了教育考评； 1702年英国剑桥大学首先用笔试代替口试； 1845年美国在初等教育中以笔试代替口试； 1864年英国费舍收集学生成绩样本汇成量表集开启了标准化测量的萌芽； 1897年莱斯的拼字测验推动教育测验的发展；冯特的测量方法和高尔顿的统计方法对教育测量产生重大影响； 1905年法国比纳-西蒙智力量表具有经典型； 1904年美国的桑代克为教育测量之父，其名言：“凡是存在的东西都有数量，凡是有数量的东西都可以测量”。美国的教育测验运动分三个时期：1904-1915开拓期，1915-193

6、0为兴盛期，1930-1940为批判期。1931年塞蒙兹主张人格测量应用评定发、问卷法、交谈法、轶事记录法等。2、1904年桑代克发表了精神与社会测验学导论，标志着教育测验运动的开始。3、泰勒主持了课程设置和成绩测试的“八年研究”（1933-1940年），首次提出了“教育评价”的概念，并发表了史密斯泰勒报告，此报告誉为“划时代的教育评价宣言”，泰勒被称为“教育评价之父”。4、1963年，克龙巴赫发表了通过评价改革课程。5、1967年，斯克里芬发表了评价方法论第一次对形成性和终结性评价等不同类型的评价之间做了区分。第二章：教育测量的质量指标第一节：信度1、信度是测量结果的稳定性或可靠的程度，即

7、测量的结果是否真实、客观地反映了考生的实际水平。可以从三个方面来理解信度：实测值与真值相差程度；统计量与参数之间接近程度；两次重复测量或等值测量之间的关联程度。2、计算信度的几种常用的方法：稳定性系数：又称为重测信度，它是指用同一测验试卷，在先后两个不同时间内同一组被试进行测验，两次测验实得分数的相关系数。这是估量信度最简单的方法。等值性系数：先实施第一次测验，然后在最短的时间内实施第二份等值的测验，再求他们得分的相关系数，这个相关系数就是信度的等值性系数。内部一致性系数：把一次测验人为地分成两部分，比较两个部分的一致程度，从而估计信度系数。估计方法有两种：分半信度和库德尔-理查森公式法。论文

8、式测验信度系数；评分者信度。3、信度系数以多大为宜：对于学科测验，信度系数要求达到0.9以上，智力测验要求达到0.8以上，品德测验能达到0.6以上。4、测量误差的来源基本可分为三类：第一类误差产生于测验的本身；第二类误差与特定的实施条件有关；第三类误差包括被试本身的变化。5、提高测验信度的方法：适当增加测验题目的数量；测验的难度要适中；测验的内容应尽量同质；测验的程序要统一；测验的时间要充分；评分要尽量做到客观化、减少评分误差。第二节：效度1、效度是测量结果的准确性和有效性程度，也是指测量是否达到了预期的目的。2、效度分为三大类：内容效度、效标关联效度、结构效度。3、内容效度是指测验目的代表所

9、欲测量的内容和引起预期反应所达到的程度。估计内容效度的方法有：逻辑分析的方法和用测验题目与教材内容比较的方法。4、效标关联效度又称为经验效度和统计效度，是以测验分数和效标之间的相关系数来表示测验的效度的高低的。5、结构效度是指一个测量能实际测量出理论上的狗年或者心理特性的程度。6、影响效度的因素：测验的组成；测验的实施；被试主观状态方面；估计效度所依据的效标；样本方面。7、提高效度的方法：控制系统误差；精心编制量表；妥善组织测验；扩充样本的容量和代表性；合理处理效度和信度的关系；适当增加测验的长度。第三节：难度1、难度是测验试题的难易程度，是试题对学生知识和能力水平的适合程度的指标。公式：P=

10、R/N；P表示难度指标；N代表参加考试的总人数；R表示答对某道客观题的人数。2、难度对测验的影响：影响测验分数的分布形态；影响测验分数的离散程度；影响测验的鉴别能力。3、影响题目难度的因素：考查知识点的多少；考查能力的复杂程度或层次的高低；考生对题目的熟悉程度；命题的技巧性。4、在常模参照性测验中要求试题难度适中，即大多数题目的难度在0.3- 0.7之间，整个试卷平均难度在0.5左右。第四节：区分度1、区分度是指测验对考生实际水平的区分程度。公式：D=PH-PL；D代表区分度；PH表示高分组的难度；PL表示低分组的难度。D0为正区分，D0为负区别，D=0为零区。 2、要想达到理想的测验信度，

11、提高区分度是一个好方法。难度适中可以使区分度达到最大值。3、提高区分度的方法：使题目的难度适中，使整个考试的难度适中；着重考察复杂的学习结果。第三章：教育测验的编制与实施第一节：测验目标的确定1、测验目标：测验所要达到的某种具体目的，它明确规定测验所要达到的预期结果或标准。是编制测验的出发点和依据。2、布卢姆把教育目标分为认知领域、情感领域和动作技能领域的目标。他把认知领域的教育目标分为知识、应用、理解、分析、综合和评价六类。3、1964年，布卢姆等人发表了教育目标分类学：第二分册：情感学习领域。4、1977年，加涅在学习的条件的第三版中将认知领域分为言语信息、智力技能、认知策略三种。智力技

12、能分辨别、概念、规则、高级规则四类；学习的结果分智力技能、认知策略、言语信息、运动技能和态度五种。5、日本的梶田叡一在他的教育评价分为三大目标：基础目标、提高目标、体验目标.6、确定教育测验目标应注意的问题：深入分析课程教学目标；正确选择目标领域及其类目；正确理解各类目标之间的关系。第二节：测验题型的确立1、测验题型可以分为两大类，一类是封闭式，另一类是开放式。2、教育测验编制中通用的七种题型：是非题；配对题；选择题；填空题；改错题；名词解释题；简答题；计算题；论述题。3、一套试题的题型一般不应少于四种。第三节命题设计1、测验编制中，设计试卷的蓝图是命题双向细目表。2、认知领域命题设计方法

13、，主要包括内容类测验目标模型之构建，内容点测验目标表之确定，命题方案表之设计。第四节：试题的编制1、试卷编制的质量要求：明确测验的目标；题量尽可能大，试题的覆盖面尽量宽；掌握好试题的区分度和难度；注意改进题型；每道试题的编写要讲究科学性；制定好标准答案，评分标准和评卷的具体要求；拼卷和检核。2、进行教育测验的编制时，一套试题中的客观题约60%，主观题约占40% ；测验试题难度的掌握一般情况下，较容易的试题占20%左右。第五节：测验实施1、测验实施要做好以下几个工作：指定专人做好考务工作；确定测验形式和审查学生测验资格；考场的组织；测验评卷与测验质量检查；补考。第四章：教育评价方案的编制与实施第

14、一节：教育评价的基本原则1、教育评价的基本原则：方向性原则；公平性原则；客观性原则；科学性原则；可行性原则；指导性原则。2、注重调查研究，整理资料不随意夸大或缩小事实，鉴定要准确，评议要恰如其分，这是教育评价客观性原则的基本要求。3、评价方案的确定要考虑人力、物力、时间等各种因素，指标体系不要过于繁琐，便于计算，这是教育评价可行性原则的基本要求。第二节教育评价方案的制定1、教育评价指标体系的结构包括：框架；模型；指标；标准；量化符号。2、教育评价指标体系可以分为一般模型和分类模型。一般模型适应于该范围内所有被评价者的评价与比较；分类模型适应于某一种被评者的评价与比较。3、量化符号是教育评价

15、指标体系结构中不可忽视的部分，它一般有权数和分数两类。权数常用小数形式，一般把同一级指群视为一个整体，整体权数总值为1。4、教育评价指标从达标水平去考察，可以分为必达指标和期望指标。教育评价指标从精确度去考察，可以分为硬指标和软指标两种。硬指标是指“硬件”，是固定的精确的指标。软指标是指“软件”，是伸缩性较大，不精确的指标。5、教育评价指标从内涵性质去考察，可以分为稳定性指标和变动性指标两种。6、评价教育实际达到指标程度的具体要求就是评价标准。从评价的内容上分，可以将评价标准分为素质标准、职责标准、效能标准。按照评价的参照点角度去分类，可以将评价标准分为社会标准和科学标准。7、社会标准：以社会

16、对教育的现象要求为依据，要求达标过程社会化规范化。科学标准:根据客观规定和原则为依据，要求达标符教育的客观规律。 8、构建教育评价指标体系首先要考虑的问题是信度与效度问题，因为信度和效度是教育评价指标体系实施的前提条件，是衡量教育评价指标体系构建质量的重要尺度。9、教育评价指标体系的信度有三个方面：重评信度、评价者信度、事实信度。10、构建教育评价指标体系的主要依据有：教育方针、政策、法规；教育理论和知识；教育规律；教育工作实际。11、评价标准的确定，主要解决两个问题，包括标准类别的选择各等级评价标准的规定。12、评价标准的编制方法：期望评语式编写法；积分评语式编写法：包括等分积分评语式编写法

17、和累计积分评语式编写法；隶属度式编写法：包括隶属度分段式编写法和隶属度全域式编写法；行为目标式编写法；量表式编写法；量尺式编写法。13、通过观察分析，选择一例关键行为作评价的一种标准，这是行为目标式编写法。第三节：教育评价的实施1、教育评价的准备工作主要有思想准备、材料和工具的准备、组织准备。2、教育评价实施可以分为自评和他评两步。自评是指学校、班级或者个人的自我评价。他评是指由别人对被评者进行评价。3、评价结果的处理是教育评价活动的最后阶段，教育评价结果处理中应该做好的工作：评价结果的分析判断；做出综合评价的结论；评价结果的信息反馈；评价工作的总结。第五章：教育评价的方法第一节：教育评价方

18、法概观1、相对评价法指在评价对象的集合中选取一个或若干个作为基准，然后把各个对象与基准进行比较。绝对评价法指在评价对象的集合之外确定一个标准，评价时候把评价对象与客观标准进行比较。个体内差异评价法指吧被评价者的过去和现在比较，或将评价对象的不同方面进行比较。2、定性分析评价法指预先根据评价的观点，把评价内容分解为几个项目，分别进行评价。定性综合判断法指对评价对象的整体进行综合性的评价。3、行为目标评价法指采用可观测的行为目标作为评价的依据的一种评价方法。行为目标的表达要注意两点：应设立可能观察行动的场合；应容易表示出行动的程度或阶段。4、临床督导评价法：就是对评价者的实际行动进行直接的现场观察

19、和记录，然后把观察结果和评估意见反馈给被评者，并和被评者一起商讨改进措施的一种评价方法。5、加权平均法是通过自评、专家组评、社会群众评等不同方面的评价，或者学生、教师、领导等不同阶层的评价者的评价来综合评定被评者的分数。第二节：收集教育评价信息的方法1、评价信息收集的标准主要有准确性、可靠性和时限性。准确性是指收集到的信息与评价目标的一致性，指采集到的材料是评价目标真正需要的资料。可靠性是指收集到的资料的真实可靠，是信得过的资料，这些资料所反映的情况完全符合客观实际。时限性是指严格按照评价工作所规定的时限去采集评价信息。2、评价信息收集的方法：观察；听汇报；调查访问；座谈会；收集文字资料；）

20、发问卷；测试。3、观察的途径有：实地参观考察；听课；参与有关活动。观察记录的方法有：连续行为记录法；时间取样记录法；事件取样记录法。观察的辅助工具：记录装置；记录表格。记录表格有四种形式：等级式，是非式，次数式，文字式。4、运用调查访问法的基本要求：制定好访问计划和提纲，依此开展访问工作；选择好访谈对象；围绕着调查提纲去问话；注意访谈态度；做好记录工作。5、召开座谈会的基本要求：根据评价内容的要求和实际情况去选择座谈会的种类；做好准备工作；座谈会上，以自由发言的形式为宜；制定专人做记录工作。6、测试是指通过书面测验和考核、实践操作、口头询问、活动考验等形式去收集评价信息的方法，它包括各种各样的

21、测验和考试。第三节：处理教育评价信息的方法1、处理评价信息的方法：定性分析描述法：包括等级评定法、评语鉴定法、写实分析法。定量分析评判法：包括统计分析评判法和模糊综合评判法。 2、写实分析法是根据一定的评价目标和要求，对评价对象的情况进行较为详细的描述，并在此基础上作出恰当的评价。 3、写实分析法的做法是：搜集事实材料；对收集到的材料进行整理和描述；分析和评价。 4、教育评价中应用较多的统计分析是平均数、标准差、标准分数、T分数、参数估计和统计检验。加权平均数的计算，参见p136例题 5、教育评价结果合成可分为三种：第一种是单纯普通数据的合成方法；第二种是单纯模糊数据的合成方法；第三种是混合数

22、据的合成方法。第六章：教育测量结果的整理、转换与组合第一节：教育测量数据的特点与种类1、数据的特点一般包括：数据的波动性；数据的规律性。波动性一是指一组数据多数取值是不相同的，二是指即便同一事物的数量表现，在不同时间、场地，由不同的量表测试，其结果肯定有差别；规律性是指大量数据的变化是有一定规律的。2、数据的种类有：按照数据的来源可以分为点计数据和度量数据；按照数据的连续与否，可以分为间断性数据和连续性数据；按照数据的精确性程度，可以分为类别数量、等级变量、等距变量、比率变量。3、教育测量数据的特点包括：绝大部分属于等级变量，可以比较大小不能加减更不能乘除。大多数数据从本质上说是主观的。教育测

23、量的数据具有随机性。教育测量的数据具有模糊性。第二节：教育测量分数的初步整理1、数据的初步整理分为列统计表和画统计图。统计表一般由表序、表题、标目、线条、数字、表注等构成。第三节：教育测量分数的转换1、教育测量所直接得到的分数叫做原始分数。1、将教育测量得出的原始分数转换后得出的分数是导出分数，包括：标准分数、T分数、百分等级分数。标准分数的计算，参见p155例题2、标准分数是将原始分数与其平均数之差除以标准差所得的商数。标准分数又叫Z分数。3、百分等级分数是一种相对地位量数，他把参加测量的全体人数作为一百份来计算，从而以某一原始分数换算出其在全体中所占的地位。4、百分等级分数的缺点：首先，它

24、是一种顺序量数，不能进行代数运算；其次，他对两极原始分数反应迟钝；再次，对原始分数较集中的地方。第四节：教育测量结果的组合1、教育测量结果的组合的方法有：直觉判断、加权求和、多重选择、多重回归。2、直觉判断是评价者凭直觉经验，主观地将各种因素加权而作出结论或进行预测。3、根据权重的不同，可以将加权求和分为等权相加、加权求和、多科测验分数加权平均的标准化。第七章：教育评价心理及其调控第一节：教育评价心理概述1、教育评价过程是评价者依据某种标准对被评价者有关方面情况进行评判的过程。2、评价心理是指评价者和被评价者对评价过程的实践活动和评价过程的各种关系、交往等现实活动的反映。3、评价心理的分类，根

25、据心理学的范畴可以分为评价的心理过程、心理状态、和心理特征。根据评价者和被评价者心理机制看，可分为意识倾向性、情意心理、认知倾向、个性心理特征。4、评价者对被评价者的一般心理影响表现在哪些方面：对自信心和自我概念、自我知觉的影响；对情绪稳定和不安的影响；对意志和动机的影响；对要求水平和达到目标的影响；对评价者和被评价者之间关系的影响。5、评价者心理对评价过程的影响表现：对制订评价方案的影响；对收集和分析评价信息的影响；对测定和评价的影响；对评价结果解释的影响。6、评价心理调控是指用一定的手段和方法，对评价者和被评价者可能出现的心理行为进行调节、控制和利用，使评价工作顺利开展。7、调控评价心理

26、的意义：第一，使教育评价的准备更加合理充分；第二，保证教育评价活动的实施得以顺利进行，更好地完成各环节的任务；第三，使评价的功能得以全面的发挥，圆满实现评价的目的。第二节：评价者心理与调控1、评价者准备过程中的心理现象包括角色心理、心理定势、新情感、时尚效应和期望效应。2、角色心理是指身份的自我意识及潜意识的表现的一种心理学现象，是特定的职业责任、道德规范、行为习惯、职业利益等的反映。3、心理定势是指由一定的心理活动所形成的准备状态，影响或决定同类后继心理活动趋势的一种心理现象。4、时尚效应是指对新颖、时髦事物的向往和崇拜的一种心理现象。5、评价实施前，对评价的期望主要表现有三种形式：积极期望

27、、消极期望、中性期望。6、施评过程心理包括自尊心理、首因效应、近因效应、晕轮效应、参照效应、理想效应、顺序效应、趋中心理、成见效应、宽大效应、附和权威心理。7、首因效应是指第一印象，比较鲜明，深刻，持续时间较长，经久不忘，不易改变的心理效应。晕轮效应又称光环效应，是指观察某个人时，由于对象的某些品质或特征看起来比较突出，使观察者对此产生了特别清晰和明显的知觉，从而掩盖了对其它特征、品质的知觉和评价。理想效应指对评价对象设想完美的先期印象影响实际评价的一种心理现象，也叫做“求全效应”。8、趋中心理是评价者对评价对象既不愿对优者给太高的评价，也不愿给劣者太低的评价，尽量缩小差距，向中间状态集中的一

28、种心理现象。9、顺序效应是指由于评价的先后顺序,而对评价对象的评价结果产生干扰的心理态势。成见效应是指对评价对象的既有看法和态度影响对评价对象作出正确判断的一种心理现象。10、结果处理过程的心理现象：类群效应、从众心理、逆反心理、本位心理、模式效应。11、从众心理是指个体因团体或个人真实的或臆想的压力所引起的行为、观点变化的一种心理现象。12、评价者心理的调控包括以下几个方面：第一，评价者素质能力的调控。主要有把好选拔关，评价技能的培训，思想品德教育。第二，管理上的调控。第三，通过心理“换位”使评价者自觉进行调控。第四，通过完善规章制度加以调控。第三节：被评价者心理与调控1、被评价者受评过程心

29、理现象包括自卫心理、迎合心理和应付心理。2、被评价者结果反馈中的心理现象有：敏感心理；护短心理；嫉妒心理；对评价进行评价心理。3、敏感心理主要表现在分数敏感、利害因素敏感和公正敏感。4、被评价者的心理调控包括：提高对评价的认识；采用多种评价形态，控制评价效应；保持评价者和被评价者良好的心理的交往状态；结果反馈方式的灵活多样。第八章：语文成绩测验第一节：语文成绩测验的历史和发展我国古代语文考试的五种题型;帖经、墨义、策问、论、诗赋。现代语文考试的特点：从内容、方法、组织管理和应用四个方面作答第二节：语文成绩测验的种类1.语文成绩测验的种类有：听说测验；单字测验；词语测验；阅读测验；作文测验；语文

30、综合测验。2、单字测验中三种类型：回忆、自由联想、随机抽样3、阅读测验的七种方法：问题回答法、次序排列法、正误分析法、预料后果法、确定要旨法、情感体察法、体味含意法。4、作文测验的五种方法：分析法、多段短文测量法、评定量表法、作文量表法、作文测验举例第三节：语文测验的编制1.语文教学目标分为识记、理解、应用和评价四级。第四节：语文高考语文高考改革的四大特点：试题的取样较宽，知识覆盖面较大、试卷的长度大，考了读、写速度、试题具有较强的客观性、注重能力的考查。第五节：作文评分的方法与误差控制1、影响作文评分的三个因素：作文题目类型及评分标准、被试者主观方面的因素、评分者方面的因素。2、常用的作文评

31、分误差控制方法：2人评分法、表格评分法、正态分布评分法、电脑控制评分法。第九章：数学成绩测验第一节：数学测验的历史和发展1.世界数学考试改革的趋势：考试成绩向评价靠近；兼顾主观性试题和客观性试题；逐步实现考试的标准化；大学招生入学考试成绩与平时学业成绩相结合。2、西周有数学教育，隋唐出现数学考试，科举制有“算学”。第二节：数学教学目标1、教学目标是指教师所期望学生在思维、感谢和行动方面变化的数量和程度。2、教育目标是指学校、家庭、社会所期望学生在德智、体、美、劳全面发展的情况。3、现阶段，中学数学教学目的包括数学基础知识，基本技能和数学能力。第三节：数学教学测验的编制1. 编制数学测验的步骤：

32、明确测验目的；制定命题原则；编制测验方案；数学题的编拟。第四节：学生数学能力测验 1、中学数学教学大纲对数学能力的规定：运算能力目标、空间想象能力目标、逻辑思维能力目标、分析问题解决实际问题能力目标第五节：中考数学命题 1、中考数学命题的六大特点：重达标、兼选拔，形成两种试卷模式以纲靠本，注重双基命题结构趋于稳定知识覆盖面增大试题具有小，新，活的特点传统试题命题有一定的规律第六节：高考数学命题1、高考数学命题三大特点：上受制于大纲、下联系教材，全面考查数学基础知识和基本技能、密切联系大学数学学习考查中学数学中的通性通法，包括数形结合的方法、数学归纳法、分类讨论、待定系数法注意试题的综合性，着重

33、考查数学思维品质第七节：数学竞赛试题的编制 1、数学竞赛：1886年俄国举办过数学竞赛；中学数学竞赛起源于匈牙利（1894）；1959年7月第一届国际奥林匹克数学在罗马尼亚举行。 2、数学竞赛题的三个特点：命题背景对已知结果的逻辑改造着眼于解题的数学思想方法。第十章：标准化考试第一节：主观经验性考试的弊端1、标准化考试：系统地组织程序，统一的标准，对误差进行了控制，即考试的编制、实施、评分、解释到常模均是标准化。2、命题的主观性、评分的误差较大、分数解释的片面性。第二节：标准化考试的特点1、标准化考试的特点：试题编制过程的标准化；考试实施过程的标准化；标准化考试的评分、计分方法要标准化；标准化

34、考试必须编制常模。2、常模：指的是标准化考试的大样本团体的成绩的平均数，亦即大样本团体分数的一般水平第三节：标准化考试的程序1、标准化考试的基本程序，包括以下七个最基本的程序：编制考试计划；编制考试初稿；预测；修改考试原稿；制定常模；收集考试的信息、效度资料；编制考试指导手册。2、标准化考试中的四种常模：年级、年龄、百分、标准分数。（对每种常模的理解）第四节：标准化考试的优缺点1、标准化考试的优缺点：优点：试卷编制的科学性；试卷取样的代表性；评分的客观性。缺点：能力测试的片面性；题型的僵化性；防止考生舞弊的困难性；各项质量指标也存在不完善性。第五节：我国高考标准化考试改革的实践结合我国基础教育

35、改革实际，谈谈你对标准化考试的认识及建议。（参考答案）标准化考试的特点标准化考试的基本程序标准化考试的优缺点第十一章：智力测验第一节：智力测验的意义和种类1、智力(IQ):是与认识活动有关的能力，直接影响认识活动的效率，使认识活动任务得以顺利完成的心理特征。对智力的表述多达100多种，常见的五种解释是：高级抽象思维能力；对环境的适应能力；学习能力；智力测验的结果；有机能力的整体。2、瑟斯顿智力群因素论中七因素：空间、数量、知觉、言语、言语流畅性、记忆、推理。3、智力结构论：1967年，美国心理学家吉尔福特提出了智力的三维结构论，他用内容、操作和成果三个变项构成的立体模型来描述智力结构。4、多

36、维智力论：受吉尔福特的智力结构论的影响，美国哈佛大学心理学教授嘉德纳提出多维智力理论。他强调人类的智力至少包括以下7种不同的智力：言语智力；数理逻辑智力；空间智力；音乐智力；体能智力；人际智力；自知智力。5、三重智力理论：美国耶鲁大学心理学教授斯滕伯格提出，这一理论从主体的内部世界、现实的外部世界以及联系内外经验世界这三个角度着手来分析智力，并与之对应提出了三类不同的智力：成分智力、情境智力和经验智力。6、智力测验是对人的智力的一种客观的、标准化的测量。它以一组标准刺激无一起被试反应根据这些客观反应来度量被试的智力高低。7、智力测验简史：我国古代民间的“七巧板”、“猜谜语”属智力测验萌芽；

37、智力测验的先驱者当数高尔顿（英）和卡特尔（美）；比纳西蒙量表对儿童测验有代表性；韦克斯勒量表对16岁以上成人测验有代表性。8、智力测验的三种类型：个别测验和团体测验；文字式测验和非文字式测验；一般能力测验与特殊能力测验。9、智力测验的先驱者是英国的遗传学家高尔顿和美国心理学家卡特尔。高尔顿首先使用等第评定量表和问卷法作为测验的辅助工具。卡特尔于1890年发表论文心理测验与测量，首先使用了“心理测验”这个术语。第二节：几种重要的智力量表1、斯一比智力量表：斯坦福大学推孟对斯比量表进行修订，此表为世界上优秀量表之一；斯一比量表每个年龄组有6个项目：A词汇；B区别；C图片补缺；D数概念；E相对应的类

38、比；F走迷津。 2、韦克斯勒智力量表包括语言和操作两部分，语言分常识、理解、算术、类似、词汇、数字广度；操作由数字符号、图像完成、积木设计、图像列、拼图、迷津组成。其测验结果有言语智商、操作智商、全量表智商三种。 3、中国比纳测验量表：陆志韦1924年对斯一比量表修订；1936，他与吴天敏主持第二次修订；1981年吴天敏主持了第三次修订。它所反映的是一个人的一般智力情况，而不能对智力的各个方面做出评价。第三节：智力测验结果的解释1、德国心理学家斯腾于1913年提出了心智商数的概念；推孟将心智商数乘以100，提出了智商的概念，也称为比率智商。智商公式：比率智商（IQ）=2、与智商相关的六个因素：

39、遗传与环境；种族；性别；学习成绩；参加测试的动机、情绪和努力程度；被试的人格特征。第四节：情绪智力及其内涵1、1995年戈尔曼出版情绪智力划时代的心智革命，将情绪智力以通俗的方式介绍给大家。2、沙洛维和梅耶最终确定情绪智力包括四个方面：（）情绪的知觉、评估和表达能力；（）思维过程中的情绪促进能力；（）理解、分析可得情绪知识能力；（）对情绪调节，促进与智力发展。第十二章：学生评价第一节：学生评价概述1、学生评价是以学生为对象的教育评价，它是依据一定的教育价值标准对学生的学业成就、个性发展、品德状况、体质能力等方面做出价值判断，并把判断结果反馈于教育实践以改进教学，是对学生学习进展与行为变化的评价

40、。2、学生评价的功能：是教师评价和学校评价的重要组成部分；是促进学生自我成长与发展的重要手段；是教师了解教学得失，改进教学方法，提高教学质量的重要途径；是教师了解学生的学习困难，帮助学生找出存在问题的重要方法。3、学生评价的类型：定位性评价：在特定的教学活动之前判定学生的前期准备，又称为安置性评价。形成性评价：是评价的结果能够指导以后的教学与学习的评价。诊断性评价：是为了使教学适合于学习者的需要和背景而在一门课程和一个学习单元开始之前对学习者所具有的认知、情感和技能方面的条件进行的评价。第二节：学生评价的原则和方法1、学生评价的原则：发展性原则、多元化原则、全息性原则、差异性原则。2、根据评价

41、主体的不同，学生评价可以分为学生自我评价、学生小组评价、教师对学生的评价。3、教师评价学生的一般方法：学业成绩测验、观察与调查法、评语评价法、表现性评价法、档案袋评价法。第三节：学生评价体系的构建1、建立促进学生全面发展的评价体系原则：坚持评价的导向性和激励性原则；坚持评价的主体性和多角度的原则；坚持评价学生差异性和整合性原则；坚持评价的开放性和客观性原则。2、学生评价的内容及环节：明确评价内容和评价标准、选择并设计评价工具和评价方法、收集和分析反映学生发展过程和结果的资料、明确促进学生发展的改进要点并制定改进的计划。第四节：学生学业的质性评价方法1、表现性评价：是一种质性的评价方法，是一种新

42、型的更直接地考察学生综合运用知识、解决实际问题能力的方法，在促进学生发展和改进教学方面有重要作用。2、表现性评价方法的构成：有一个表现性任务、有一个评价标准、有一个或几个好的评价者。3、表现性评价的主要形式：演示、口头表述、模拟表现任务、实验与调查、作品选集、完成研究项目。4、档案袋评价：根据学生的反映，以及教师的评价、观察、考查、成绩测验等，得出有关学生进步和发展的系统而持续的记录。5、档案袋评价的特性：目标性、计划性和组织性成长性和表现性整合性和多样性主题性和反思性。6、使用档案袋评价的原则：质化原则、发展性原则、重视个性反应方式又倡导合作的原则、过程性原则。第十三章：学生品德测评第一节：

43、品德测评概述1. 品德测评：是指根据一定的目标，运用科学的手段，对学生的政治品质、道德品质、思想品质（包括知、情、意、行）的测试和评定。2. 品德测评的意义：有利于学生思想上的自我教育和学校德育工作顺利开展；有利于激励先进和鞭策后进；有利于学生德育管理；品德测评也是德育和行为科学研究的重要手段。3. 品德测评的类型：诊断性测评；形成性测评；总结性测评。4. 品德测评的基本要求：外显行为测评与道德认识测评相结合；单项测评与整体测评相结合；定性测评与定量测评相结合。第二节：品德测评的指标体系1. 品德测评指标体系确立的依据：依据社会的需要；依据德育大纲；依据品德结构；依据学生年龄特征。2. 构建中

44、小学生品德测评指标体系的基本要求：重视指标体系的开放性；重视指标体系的教育性；处理好普遍性与特殊性的关系；处理好稳定性和发展性的关系；处理好统一性和灵活性的关系。第三节：品德测评的方法1. 定时考核法：是指根据德育的要求，拟定德育试题，指定考试地点，在规定的时间内，按照一定的考试要求，对学生进行考核。2. 问卷测评法：是指通过使用问卷或量表测试学生思想品德的一种方法。它包括自编问卷法和自陈量表法。3. 项目评分法：是指设置一些测试的项目，每一项目都给予一定的分值，然后参考这些项目，对学生的思想和行为表现进行测量。它主要包括加减评分和测试评分两种。4. 情境测验法：这种方法是由教师先巧妙地设计一

45、种情境，让学生在这种情境中开展活动，教师对学生在该条件下活动或反应进行全面的考察和分析，据此来对其思想行为加以衡鉴。它的种类颇多，主要有留痕法（由Voelker所创，我国学者略加改良）、评分法（由哈特逊梅即 Hartshorne & Ma所创）。5. 社会关系测量法：这是研究团体中友伴相互吸引与排斥关系的测量方法。（这里所说的社会关系是指学生在班级和学校社团中的人际关系。）6. 意向测评法：是指测评人的心理意向的一种方法。（在品德测评中，心理意向主要是指思想观点、意见、态度、兴趣、爱好等方面的内容。）适合学生品德测评应有的方法：Q技术：由斯蒂芬生（Stephenson,1953）所创用，它是

46、用来测评态度、兴趣、自我观念和其他情感变量的一种技术。实施方法主要包括两部分：Q分类资料和Q分类资料的实施。语意分析法：由奥古斯丁(Osgood,1957)和其同事所创立。这种方法的目的是测量和比较概念的意义。运用这种方法的理论依据是：人类是文字的动物，通过语言可以窥知人类本身许多东西。这种方法的具体运用是，使用一些由两个相对的形容词所构成的量尺，要求受试者对某个概念加以评定。7行为观测法：这是一种有目的有计划地考察学生思想行为的方法。较常见的方法有：自然观察法；实验观察法；情境观测法；跟踪观测法；时间样本法。8.目前，人们借助于测谎仪来观测人的行为，产生了测谎技术。测谎提问为什么能触发生理反应？归纳起来有三种因素：恐惧心理；谎答时形成逻辑上的、道义上的矛盾；条件反应，即俗话所说的“触景生情”。我们认为，测谎技术用于审讯犯罪是有一定作用的，但不能照搬过来用于测量学生生理反应，然后

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

11 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 自学考试复习专题现代教育测量评价串讲

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：自学考试复习专题：现代教育测量与评价串讲.doc
链接地址：https://www.taowenge.com/p-4585641.html