《教育测量与评价.docx》由会员分享,可在线阅读,更多相关《教育测量与评价.docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上教育测量与评价期末复习题一、简答1.简述教育测量的基本要素及四种水平包括哪些?答:(1)教育测量的基本要素包括:参照点和单位。 参照点: 计算事物数量的起点 ,也叫零点 。绝对参照点: 绝对零点, ,如长度, , 重量。相对参照点: 相对零点, ,如海拔高度 、 温度。 单位: 计量事物标准量的名称 。理想的单位要符合两个条件: 同一个单位意义相同, 即确定的意义;相邻两个单位间的差别相等。(2)教育测量的四种水平四、教育测量的水平(第二章 25页 未找到准确答案)从所使用的参照点来说 , 教育和心理测量的参照点均为相对参照点 。从所使用的单位来说 , 教育和心理测量
2、所使用的单位意义不太明确, 单位常常不等值 。 从本质上讲,教育和心理测量的量表属于等级量表。无论是对智力,还是对能力倾向或人格的测量,都只具有等级量表的特征。 由于多数心理特征具有常态分布的特征,无绝对零点,所以我们也可把测量后直接得到的原始分数转化为常态分布下的标准分数,把这些量表当作等距量表来处理。2.简述教育测验编制的基本程序有哪些?答:一、确定编制测验的目标二、制定编题计划三、设计测验项目四、预测与项目分析五、合成测验六、测验的标准化七、搜集信度、效度资料八、编写测验手册3简述实施教育测验应注意的问题。答:第三节、测验的实施(第4章 92页 未找到准确答案)(一)测试开始前的准备 主
3、试方面: 首先 ,主试在测试前要熟悉测验的结构和内容以及使用方法。 其次 ,测验实施者要熟练测验指导语并能口语清楚而流利地说出来。 有时还要对施测者进行必要的训练。训练的内容包括:1 、熟悉测验内容 ;2 、掌握施测步骤;3 、掌握记分方法;4 、掌握解释分数的技术。 测试方面: 主试在测验前要把测验材料准备好,以免短缺而临时寻找。(二)测试过程中应注意的事项1、指导语2、测验情景3、施测顺序4、测验焦虑(三)主试和被试的良好合作关系 主试保证测验结果绝对保密 对被试加以积极的鼓励4简述区分度的相对性包括哪些方面?答:1. 不同的计算方法,所得的区分度的值不同。两种相关值的比较。2. 样本容量
4、的大小影响相关法区分度值的大小3. 分组标准影响鉴别指数。4. 被试样本的同质性程度影响区分度值的大小。5.简述信度的几种估计方法?答:信度种类及估计方法(第六章 6页 只有估计同质性信度的方法) 重测信度 复本信度 分半信度 同质性信度 评分者信度估计同质性信度的方法库德 - 理查逊方法 20公式 (仅适用于以1 、0 记分)公式:公式K - R20 中:K 为构成测验的题目数;P i为通过第i 题的人数比例; qi 为未通过第i 题的人数比例;Sx为测验总分的标准差。 21 公式 (适用于以1 、0 记分,各题难度近似)公式: 公式K - R21 中:X杠为测验总分的平均分;其它符号同上。
5、 系数或克伦巴赫公式适用于一切非0 、1 记分和连续记分(即多重记分)的情况公式: 式中:K K 为测验的题目数;S i 为第i 题分数的标准差;Sx 为测验总分的标准差。6.简述提高信度的方法有哪些?答: (1)适当增加测验的长度 (2)使所有题目的难度接近正态分布 (3)努力提高测题的区分度 (4)选取恰当的被试团体7.简述效度的性质有哪些?答:(1)效度具有 相对性n 任何测验的效度是对一定的目标来说的,或者说 测验只有 用于与测验目标一致的目的和场合才会有效 。n(2) 效度是针对测验结果的,即测验结果的有效性程度。n (3) 效度具有连续性n 测验效度通常用相关系数表示,它只有程度上
6、的 不同, 而没有 “ 全有 ” 或 “ 全无 ” 的区别 。n 也就是说 我们 评价一 个测验时,不应该说 “ 有效 ” 或 “ 无效 ”, 而 应该用效度较高或较低来评价。8.简述影响效标效度的因素有哪些?答:(一)测验的长度n (二)效标的选择n (三)预测源与效标测量的信度n (四)受测者样本的特征n (五)基础率n (六)录取率二、论述9.论述教育测验的分类。答:( 一 ) 按测验功能 能力测验 成就测验 人格测验 能力测验 包括: : 实际能力测验与潜在能力测验( ( 能力倾向测验) ) ; 普通能力测验 ( 智力 ) 与特殊能力测验 。实际能力:指个人当前 “ 所能为者 ”, ,
7、 代表个人已有的知识 、经验与技能, , 是正式与非正式学习或训练的结果 。潜在能力: 是指个人将来 “ 可能为者 ”, , 是在给予一定的学习机会时 , 某种行为可能达到的水平 。 成就测验: 主要用于测量个人( ( 或团体) ) 经过某种正式教育或训练之后对知识和技能掌握的程度。 人格测验:主要用于测量性格、气质、兴趣、态度、品德、情绪、信念、价值观等方面的个性心理特征。( 二 ) 按测验方式分类 纸笔测验: :测验所用的是文字或图形材料, 实施方便, 团体测验多采用此种方式 。 操作测验: 操作测验项目多属于对图片 、 实物 、 工具 、 模型的辨认和操作 , 无需使用文字作答 , 所以
8、不受文化因素的限制 。( 二 ) 按测验方式分类 口头测验:测验项目为言语材料。主试口头提问,被试口头作答。 电脑测验:测验项目可以是文字、图形,在电脑上显示,被试按键作答。( 三 ) 按测验的对象人数 个别测验:每次仅以一位被试为对象 , 通常是一位主试与一位被试在面对面的情形下进行 。 团体测验:是在同一时间内由一位主试对多数人施测 。个别测验优点:获得的信息多;容易建立融洽的合作关系;特殊被试 ( 幼儿 、 盲人 )缺点:费时 、 复杂 、 对主试要求高 。团体测验 优点: 节省时间、短期内可收集大量的数据 缺点:被试的行为不易有效控制,容易产生测量误差。( 四 ) 按应用领域分: 学业
9、测验 职业测验 临床测验(五)按测验的性质分: 构造性测验 投射测验( 六 ) 按测验要求分类: 最高作为测验:此种测验要求被试尽可能做出最好的回答 , 主要与认知过程有关 , 有正确答案 。( 能力测验 、 成就测验 ) 典型作为测验:此种测验要求被试按通常的习惯方式作出反应 ,没有正确答案 。 ( 人格测验 )( 七 ) 按测验的目的分类: 描述性测验:测验的目的在于对个人或团体的能力 、 性格 、 兴趣 、 知识水平等进行描述 。 诊断性测验:目的在于对个人或团体的某种行为问题进行诊断 。 预示性测验:目的在于通过测验分数预示一个人将来的表现和所能达到的水平 。( 八 ) 按测验解释 常
10、模参照测验:此种测验是将一个人的分数与其他人比较 ,看其在某一团体中所处的位置 。 标准参照测验:此种测验是将被试的分数与某种标准进行比较来解释 。(九)按测验难度分类速度测验:此种测验题目比较容易,但数量多,时间短,几乎每个被试都不能作完所有题目。测量的是反应速度。难度测验:包含各种不同难度的题目,由易到难排列,其中有一些极难的题目,几乎所有被试都解答不了。但时间较充裕,测量的是解答难题的最高能力。10.论述教育测量工作者的素质要求与道德准则。答:(1) 教育测量工作者的素质要求 专业理论知识 专业技能 对心理测验的科学态度错误观念: 万能论 无用论 心理测验就是智力测验 (心理测验 = 智
11、力测验 = 智商 = 遗传决定论)对待测验的正确态度: 心理测验是研究心理学的重要方法之一,是决策的辅助工具; 心理测验作为研究方法和测量工具尚不完善; 防止乱编和滥用心理测验。(2) 心理测量工作者的道德准则( 一 ) 测验的保密和控制使用测验信息和样题的公布 有助于消除公众对心理测验的神秘感及误解 有关测验的技术程序以及信度 、 效度和其他测验属性应向所有人公开 让受测者熟悉测验,以消除焦虑,保证测验结果的准确性 对测验结果的反馈( 二 )测验中个人隐私的保护11.论述如何正确解释测验分数的意义。(一和二哪一个是正确答案)答:一、如何看待测验分数的意义1. 应根据教育和心理测量的特点进行分
12、析。应该把测验分数视为一个范围而不是一个确定的点。2. 不能把分数绝对化,绝不能根据一次测验的结果下定论,应参考其他有关资料。其他有关资料包括: 个人在测验前的经历 测验情境也是一个需要考虑的因素3. 为了对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料。4. 对于来自不同测验的分数不能直接加以比较。为了使不同测验的分数可以比较,必须将二者放在统一的量表上。二、如何向受测者报告测验分数 正确解释1. 不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议。2. 避免使用专业术语,使用当事人理解的语言。3. 要保证当事人知道这个测验
13、测量或预测什么。4. 如果测验是以常模为参考的,就要使当事人知道他是和什么团体在进行比较。5. 要使当事人知道如何运用他的分数。6. 要考虑测验分数将给当事人带来什么影响。7. 要让当事人积极参与测验分数的解释。12.论述影响测量信度的主要因素。答:(一)样本特征1. 样本团体异质性的影响 一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。2. 样本团体平均能力水平的影响测验的信度会由于不同团体间平均能力水平的不同而不同。因为对于不同水平的团体,项目具有不同的难度,每个项目在难度上的变化累积起来便会影响信度。(二)测验长度1. 测验越长,测验的测题取样或
14、内容取样就越有代表性。2. 测验越长,被试的猜测因素影响就越小。(三)测验难度 难度对信度的影响,只存在于某些测验中。如智力测验、成就测验、能力倾向测验等; 对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。就难度与信度的关系而言,并没有简单的对应关系。从理论上说,只有平均难度水平为 50% 时,才能使求得的信度最高。事实上,难度为 0.50 只适合于简答题,对于选择题由于存在猜测因素,难度值应提高。洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为: 五选一测题: 0.70 四选一测题: 0.74 三选一测题: 0.77 是非题: (
15、四)时间间隔时间间隔只对重测信度和不同时测量时的复本信度有影响。以再测法和复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越长,信度系数越低。13.论述中国古代的教育测量思想与实践。答:(1)中国古代的教育测量思想 心理特征差异性的思想 孔子 教育测量的思想 “ 性相近,习相远 ” 孔子说:人( ( 或生命) ) 先天具有的纯真本性,互相之间是接近的,而后天习染积久养成的习性,却是互相之间差异甚大 “中人以上可以语上也,中人以下不可以语上也” 孔子说:“具有中等资质或道德水平以上的人,可以告诉他较高的学问或道理; 而具有中等资质或道德水平以下的人,不可以告诉他较高的学问或道理。”
16、心理特征差异性的可测量性的思想 孟子 : “ 权,然后知轻重;度(( ( du ),然后知长短; 物皆然,心为甚” ( ( 孟子) ) 说 :“ 用秤称一称,才能知道轻重; ; 用尺量一量,才能知道长短。什么东西都是这样,人的心更需要这样。(2)中国古代的教育测量实践 教育测量的实践活动( ( 人才的评定和选拔) )1. 科举取士制度 - 欧洲文官考试制度 商周时代: : 礼、乐、射、御、书、数等 六艺汉代:法律、军事、农业、税收和地理等 五经隋唐:儒学经典( ( 形式多样: : 帖经、墨义、口义、策论等) )2. 民间的智力型游戏周岁试儿: : 到现在,婴幼儿的动作测量七巧板 九连环 古代测
17、智力水平的器具国外著名的 - 河内塔问题六 艺 九连环的设计精巧性可与现代的魔方、魔棍等操作性玩具相媲美,也可被视为较之现代认知心理学中的 河内塔 任务更为复杂的操作性问题解决任务。 被著名心理学家伍德沃斯称为“中国式的迷津”。 七巧板被著名心理学家伍德沃斯称为“唐图”,即“中国的图板”之意。 七巧板类型的拼图任务现在几乎为当代的多数智力测验和创造力测验所使用,并且已经发展成为标准化的纸笔型测验。 3. 三国时期 ,刘劭sho 人物志 “考课核实”法 、 “八观与五视”( ( 观察法 ) - 被美国人翻译后,名为 人类能力之研究 4. 韩非: 一手画圆,一手画方。 到现在用于测注意力 中国古代
18、测量思想的特点: 描述性 分类式 注重整体评价,和人的道德品质联系起来 实用性汉诺塔(河内塔)问题 河内塔是根据一个传说形成的一个问题: 有三根杆子A A ,B B ,C C 。A A 杆上有N N 个 (N1) 穿孔圆盘,盘的尺寸由下到上依次变小。 要求按下列规则将所有圆盘移至C C 杆:每次只能移动一个圆盘;大盘不能叠在小盘上面。 提示:可将圆盘临时置于B B 杆,也可将从A A 杆移出的圆盘重新移回A A 杆,但都必须尊循上述两条规则。 问:如何移?最少要移动多少次? 一位法国数学家曾编写过一个印度的古老传说: 在世界中心贝拿勒斯(在印度北部)的圣庙里,一块黄铜板上插着三根宝石针。 印度
19、教的主神梵( ( fn) ) 天在创造世界的时候,在其中一根针上从下到上地穿好了由大到小的 64 片金片,这就是所谓的汉诺塔。 不论白天黑夜,总有一个僧侣在按照下面的法则移动这些金片: 一次只移动一片,不管在哪根针上,小片必须在大片上面。 僧侣们预言,当所有的金片都从梵天穿好的那根针上移到另外一根针上时,世界就将在一声霹雳中消灭,而梵塔、庙宇和众生也都将同归于尽。 不管这个传说的可信度有多大,如果考虑一下把 64 片金片,由一根针上移到另一根针上,并且始终保持上小下大的顺序。这需要多少次移动呢? ? 这里需要递归的方法。假设有n n 片,移动次数是 f(n). 显然f f =1,f =3,f =7 ,且 f(k+1 ) =2*f(k)+1 。 此后不难证明 f(n)=2n- -1 1 。 n=64 时, f f ( 64 ) = 264- - 1=1844 6744 0737 0955 1615 假如每秒钟一次,共需多长时间呢? 一个平年 365 天,有 3153 6000 秒,闰年 366 天有3162 2400 秒,平均每年 秒,计算一下, / =5845 5404 9253.855年专心-专注-专业
限制150内