第三章-教育测量与评价的质量特性课件.ppt
《第三章-教育测量与评价的质量特性课件.ppt》由会员分享,可在线阅读,更多相关《第三章-教育测量与评价的质量特性课件.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 教育测量与评价的质量特性内蒙古师范大学教育科学学院2012年11月12日296957701第一节 教育测量与评价中常用的统计参数p一、平均数和标准差p平均数表示原始分数的总和N表示分数的个数平均数和标准差p方差:也称变异数、均方。用符号 表示p标准差:即方差的平方根,用S或SD表示。二、相关及相关系数(一)什么是相关1.事物之间的相互关系p因果关系p共变关系p相关关系2.相关的类别p正相关p负相关p零相关,即无相关(二)相关系数p是两例变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指标。p常用r表示。p相关系数的取值范围:-1r1(三)积差相关p简称皮尔逊相关,又称为积距
2、相关。揭示两个变量线性相关方向和程度最常用和最基本的方法。需要满足一下条件:1.要求成对的数据。2.两例变量各自总体的分布都是正态。3.两个相关的变量是连续变量。4.两例变量之间的关系是直线性的。利用原始数据计算积差相关的公式p例:10名中学生身高与体重的测量结果,问身高与体重的关系如何?被试编号 身高(X)体重(Y)X2 Y2 XY 1 170 50 28900 2500 8500 2 173 45 29929 2025 7785 3 160 47 25600 2209 7520 4 155 44 24025 1936 6820 5 173 50 29929 2500 8650 6 188
3、53 35344 2809 9964 7 178 50 31684 2500 8900 8 183 49 33489 2401 8967 9 180 52 32400 2704 9360 10 165 45 27225 2025 7425 1725 485 298525 23609 83891(四)斯皮尔曼等级相关p则是皮尔逊相关系数的延伸。是等级相关的一种。常用符号rR或rs表示。p主要用于解决名称数据和顺序数据的相关问题。对于属于等距或等比性质的连续变量数据,若按其取值大小,赋以等级顺序,转化为顺序变量数据,亦可计算等级相关,此时不必考虑是否正态。p适用于连续变量数据小于30,精确度稍差于
4、积差相关斯皮尔曼等级相关的计算公式例:现有10人的视、听两种感觉通道的反应时,问视听反应时是否具有一致性p被试p编号 身高(X)体重(Y)Rx RY D=Rx-RY D2Rx RYp 1 172 179 7 52 435p 2 140 162 2 20 04p 3 152 153 5 14 165p 4 187 189 8 80 064p 5 139 181 1 6-5 256p 6 195 220 9 10-1 190p 7 212 210 1 91 190p 8 164 182 6 7-1 142p 9 149 178 4 40 016p 10 146 170 3 30 09p 55 55
5、 48361第二章 教育测量的质量指标p衡量教育测量的质量,可采用四个指标:p信度 主要对整个测量而言。p效度 p难度 主要对测量的项目而言。p区分度 一、信度概述p(一)什么是信度p信度是指测量结果的稳定性或可靠性程度。p必须从以下两个方面去理解测量的信度:信度指实测值(X)真值(T)相差的程度p信度指同一个测验(或相等的两个、多个测验)对同一组被试施测两次或多次,所得结果的一致性程度,也即测验的可靠性。两次重复测量或等值测量之间的关联程度。(二)信度的估计方法p1、重复信度(再测信度)p指的是同一个量表对同一组被试施测两次所得结果的一致性程度。p其大小等于同一组被试在两次测验上所得分数的相
6、关系数,一般采用皮尔逊积差相关的公式来计算。例一p用一个算术四则的速度测验12个小学生,得分记为X,为了考察测量结果的可靠性,于3个月后再测一次,得分记为Y,问测验结果是否可靠?p序号 1 2 3 4 5 6 7 8 9 10 11 12pX 20 20 21 22 23 23 23 24 25 26 26 27pY 20 21 21 20 23 23 25 25 26 26 27 29在使用重测法计算稳定性系数时,应注意以下问题:p1、信度的取值范围为0,1,当信度值较大时,说明前后两次测量结果比较一致;p2、两次测验之间的时间间隔要适宜。应由测验的性质、测题类型、测题数量和被试特点所决定;
7、p3、重测法适用于速度测验而不适用于难度测验;p4、应注意提高被试者的积极性。再测信度的优缺点p优点:(1)它最符合重复测验的涵义(2)比编制两套等值测验题目要省力、省时(3)所测量的属性是完全相同的。p缺点:(1)使第二次测验分数有系统地增加(2)如果两次施测时间太长,被试身心的发展、新知识的获得,导致两次测验结果的不相同(3)容易失去被试的兴趣(4)收到被试在两次施测时的主观状态(5)两次施测的环境不同而产生测量误差。再测信度的适用范围p适用于异质性测验p适用于速度测验而不适用于难度测验p还适用于运动技能的测验,如跑、跳、掷等项目测验。2、复本信度p指的是两个平等的测验测量同一批被试所得结
8、果的一致性程度。p其大小等于同一批被试在两个复本测验上所得分数的相关系数。p所谓复本测验是指在性质、内容、题型、题数、难度等方面都一致(或相等)的两份或多份测验。例二p以A、B两型英语复本测验对初中三年级10个学生施测,为避免由测验施测顺序所造成的误差,其中5个学生先做A型测验,休息15分钟后,再做B型测验;而另5个学生先做B型测验,休息15分钟后,再做A型测验。10个学生A型测验结果记为X,B型测验结果记为Y,其测验的复本信度如何?p学生序号 1 2 3 4 5 6 7 8 9 10pX 19 19 18 17 16 15 15 14 13 12pY 20 17 18 18 17 15 13
9、 15 12 12复本信度的优缺点表现:p优点:1、一个测验有两个或几个复本,这意味着对于测验同一种属性具有两个或几个行为样本。2、测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一致性;3、两个复本在同时使用时,可以避免再测信息的一些缺点,如首测时再测在记忆、练习、效果的影响,间隔期间获得新知识的影响,两次施测的环境不同和被试主观状态不同的影响,以及为了应付测验所作训练的影响等。缺点:p1、编制两个完全相等的测验是很困难的,如果两个复本过分相似,则变成再测形式,而过分不相似,又使等值的条件不存在;p2、两个复本测验有可能在某种程度上测量了不同
10、的性质,这就会低估测验的信度;p3、被试同时接受性质相似的两个测验,可能减少完成测验的积极性;p4、虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。复本信度的适用范围p不仅适用于难度测验,也是估计速度测验信度的最好方法。p在作追踪研究或探讨某些影响测验成绩的因素时,大多使用复本测验。(三)内在一致性信度p内在一致性信度主要是指测验内部(即测题之间)的一致性程度,主要包括分半信度和同质性信度。1、折半信度(分半信度)p就是将一个测验分成对等的两半后,再求被试在每一半测验上所得分数的一致性程度(相关系数)。p首先根据内容、形式、题数、平均数、标准
11、差、难度、测题间相关以及分布形态相等的原则,将试题分成两半,或者将从易到难排列的测题,按照测题序号,奇数测题为一组,偶数测题为一组,分成两半;p然后计算每个被试在两个分半测验分数的积差相关系数,再用斯皮尔曼布朗公式加以校正。p斯皮尔曼布朗公式为斯皮尔曼布朗公式p 为整个测验的信度系数p 为两个“半测验”上得分的相关系数例:一个测验向15名被试施测,被试在奇偶数分半测验上的得分如表所示,计算该测验的分半信度系数。p被试 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15p奇数题 20 18 23 21 17 18 20 17 16 13 14 13 12 8 8p偶数题 20
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 教育 测量 评价 质量 特性 课件
限制150内