第九章测验等值.ppt
《第九章测验等值.ppt》由会员分享,可在线阅读,更多相关《第九章测验等值.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 测验等值测验等值第一节第一节 测验等值概述测验等值概述第二节第二节 测验等值计算的基本方法测验等值计算的基本方法第三节第三节 常用测验等值设计介绍常用测验等值设计介绍第一节第一节 测验等值概述测验等值概述l一、测验等值来源于测量实践的需要一、测验等值来源于测量实践的需要l二、测验等值的实质二、测验等值的实质l三、测验等值的条件三、测验等值的条件l四、测验等值的一些基本概念四、测验等值的一些基本概念l五、测验等值结果的表示方法五、测验等值结果的表示方法一、测验等值来源于测验实践的需要一、测验等值来源于测验实践的需要l 在我国考试实践中,有许多大规模的在我国考试实践中,有许多大规模的
2、考试需要进行测验等值,例如考试需要进行测验等值,例如高等教育自高等教育自学考试学考试各专业的各门课程的考试,通常是各专业的各门课程的考试,通常是在同一课程考试大纲下,每年重复测试所在同一课程考试大纲下,每年重复测试所谓的平行试卷,人们有理由提出这样的问谓的平行试卷,人们有理由提出这样的问题题:某门课程今年考生所得的某门课程今年考生所得的60分是否与分是否与去年同一课程考生所得的去年同一课程考生所得的60分等值分等值?因为因为只有在它们等值的情况下,考试对这两年只有在它们等值的情况下,考试对这两年参加同一门课程测验的考生才是公平的。参加同一门课程测验的考生才是公平的。l 将不同测验(考察同一特质
3、)上的分将不同测验(考察同一特质)上的分数(特质水平值)和项目(试题)参数做数(特质水平值)和项目(试题)参数做出单位系统转换,从而使之能相互比较的出单位系统转换,从而使之能相互比较的过程,叫做测验等值。过程,叫做测验等值。二、测验等值的实质二、测验等值的实质l 从从本质本质上说,测验等值就是通过对考核上说,测验等值就是通过对考核同一种心理同一种心理品质品质的多个测验形式作出测量分数系统的转换,进而使的多个测验形式作出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有得这些不同测验形式的测验分数之间具有可比性可比性。A B C 82 85 80l 1。测验等值中所说的测量分数系统的
4、转换与测验。测验等值中所说的测量分数系统的转换与测验原始分数及导出分数之间的转换是不相同的。原始分数及导出分数之间的转换是不相同的。l 2。寻找测验等值关系与寻找两测验之间预测关系。寻找测验等值关系与寻找两测验之间预测关系也是不相同的。也是不相同的。三、测验等值的条件三、测验等值的条件l(1)同质性)同质性 要求等值的两个测验必须是测量同一心理特质的。很难想象可以把数学测验的分数等值转换成语文测验的分数,但数学测验分数却可能等值转换成另一次内容难度近似的数学测验分数。l(2)等信度)等信度l(3)公平性)公平性l(4)对称性)对称性l(5)样本不变性)样本不变性 等值测验是两个或多个测验之间客
5、观存在的实际关系。l(6)可递推性)可递推性 如果f(x)=y,g(y)=z,那么h(x)=gf(x)=zl上述要求满足极为困难,除了心理现象复上述要求满足极为困难,除了心理现象复杂,测验技术发展不成熟外,测量理论框杂,测验技术发展不成熟外,测量理论框架本身的局限也是原因。架本身的局限也是原因。四、测验等值的一些基本概念四、测验等值的一些基本概念(一)成对出现的概念(一)成对出现的概念l1。经典测验理论与项目反应理论等。经典测验理论与项目反应理论等值值 经典测验理论(经典测验理论(CTTCTT)、项目反)、项目反应理论(应理论(IRTIRT)、概化理论()、概化理论(GTGT)区别在于等值时以
6、何种区别在于等值时以何种测验理论测验理论为指导。为指导。l2。测验分数等值与项目参数等值。测验分数等值与项目参数等值 根据测验等值的根据测验等值的直接操作对象直接操作对象不不同而构成的一对概念。同而构成的一对概念。缺陷:严重依赖缺陷:严重依赖样本;两测验上样本;两测验上被试分数分布大被试分数分布大体相同。体相同。l3。水平等值与垂直等值。水平等值与垂直等值 根据测验试卷的根据测验试卷的难度难度和和被试能力分布被试能力分布是否有差异而区分的一对是否有差异而区分的一对概念。概念。进行垂直等值化的原因:进行垂直等值化的原因:举例:举例:一套成就测验由不同水平的几个测验构成,每一水平适一套成就测验由不
7、同水平的几个测验构成,每一水平适应于某一年级范围的学生。例如该测验的水平应于某一年级范围的学生。例如该测验的水平1 1正好适合二年级初正好适合二年级初的学生,水平的学生,水平2 2正好适合二年级末的学生。然而,对那些在二年级正好适合二年级末的学生。然而,对那些在二年级进步较慢的学生而言,水平进步较慢的学生而言,水平2 2可能太难而无法得到准确的测验结果。可能太难而无法得到准确的测验结果。一种可能的解决办法就是对这些学生施测水平一种可能的解决办法就是对这些学生施测水平1 1。为了解释这些学。为了解释这些学生的测验成绩,就有必要知道这两种水平的等值分数。这个过程被生的测验成绩,就有必要知道这两种水
8、平的等值分数。这个过程被称为垂直等值化。称为垂直等值化。四、测验等值的一些基本概念四、测验等值的一些基本概念1。测验等值设计。测验等值设计 定义:定义:为了寻找不同测验形式之间的为了寻找不同测验形式之间的等值关系而预先对等值关系而预先对数据的采集方法数据的采集方法、等值等值实现的途径实现的途径、等值的计算方法等值的计算方法进行周密的进行周密的设计,称为测验等值设计。设计,称为测验等值设计。等值设计的最主要原则是要使得所采等值设计的最主要原则是要使得所采集的数据能最有效提供不同测验形式的差集的数据能最有效提供不同测验形式的差异信息。异信息。2。锚测验。锚测验 定义:在测验等值设计中,有时会采定义
9、:在测验等值设计中,有时会采用一组测验试题来关联两个待等值的测验用一组测验试题来关联两个待等值的测验形式,以便寻找两形式的等值关系,这些形式,以便寻找两形式的等值关系,这些测验试题被称作为锚测验。测验试题被称作为锚测验。要求:同质性;等信度;长度不小于要求:同质性;等信度;长度不小于原测验的原测验的1/5。V3。数据平滑法。数据平滑法比较实用的两种数据平滑法:比较实用的两种数据平滑法:l一种叫对数线性平滑法一种叫对数线性平滑法l一种叫一种叫二项式平滑模式二项式平滑模式l等值完成之后必须对等值结果进行评价。评价等值完成之后必须对等值结果进行评价。评价的目标是所估等值关系的可靠性与准确性,其的目标
10、是所估等值关系的可靠性与准确性,其指标是等值关系中所包含的等值误差的大小。指标是等值关系中所包含的等值误差的大小。l关于等值标准误差、等值偏差关于等值标准误差、等值偏差l 理解的时候可以从理解的时候可以从随机随机等值误差(等值标等值误差(等值标准误差)和准误差)和系统系统等值误差(等值偏差)的角度等值误差(等值偏差)的角度来理解。来理解。l 注意:以上主要是在注意:以上主要是在CTT的范围内对的范围内对测验测验分数等值分数等值所作的探讨。所作的探讨。4。等值标准误差。等值标准误差l测量学把由测量学把由抽样抽样而引起的等值误差称作等而引起的等值误差称作等值标准误差。值标准误差。l像测验误差不可避
11、免一样,等值误差也是像测验误差不可避免一样,等值误差也是不可避免不可避免的。的。等值标准误差的操作定义:等值标准误差的操作定义:应用样本数据估计测验形式应用样本数据估计测验形式X X与与Y Y的等值关系时,的等值关系时,如果反复抽取等容量的样本,可以求得许多个如果反复抽取等容量的样本,可以求得许多个X X与与Y Y的等值关系,对于的等值关系,对于X X的一个固定值的一个固定值X X0 0,会有若干个,会有若干个不等的不等的Y Y0 0与之对应,这若干个与之对应,这若干个Y Y0 0的标准差就是对应的标准差就是对应于于X=XX=X0 0的等值标准误差。的等值标准误差。从这里可以看出等值标准误差的
12、大小是会随着被等值的具体分数而变化的。从总的趋势来说,随机等值误差的大小是会随着样本容量的增大而减小的。控制办法:数据平滑法l测验等值误差是一个变量,随等值分数的测验等值误差是一个变量,随等值分数的大小而变,其大小而变,其总趋势总趋势是等值分数越趋于分是等值分数越趋于分布的两端,等值的标准误差越大。布的两端,等值的标准误差越大。5。等值偏差。等值偏差 在等值测验中除了抽样引起等值误差之外,在等值测验中除了抽样引起等值误差之外,等值处理方法不当也会引起等值误差,测量学等值处理方法不当也会引起等值误差,测量学上把这种等值误差称为偏差。上把这种等值误差称为偏差。系统等值误差系统等值误差l 在等值设计
13、和等值关系估计过程中,必在等值设计和等值关系估计过程中,必须作出若干假设,具备若干等值条件,如果须作出若干假设,具备若干等值条件,如果这些假设被违背或者条件不能被充分满足,这些假设被违背或者条件不能被充分满足,都会产生系统误差。都会产生系统误差。l 例如,设计一中的假设不能满足的情况例如,设计一中的假设不能满足的情况l 等值的系统误差与随机误差不同,系统等值的系统误差与随机误差不同,系统误差难以量化、难以发现,系统误差的大小误差难以量化、难以发现,系统误差的大小也不随样本容量的增大而变小。也不随样本容量的增大而变小。据研究,形成等值系统误差的可能原因有四种:据研究,形成等值系统误差的可能原因有
14、四种:l第一种是当应用等值方法的统计假设不满足时,所估等第一种是当应用等值方法的统计假设不满足时,所估等值关系中就会出现系统误差。值关系中就会出现系统误差。l第二种原因是当为估计等值关系所设计的数据采集规则第二种原因是当为估计等值关系所设计的数据采集规则未被严格遵循,所估等值关系中也会出现系统误差。未被严格遵循,所估等值关系中也会出现系统误差。l第三种原因是估计等值关系时所用的被试组与实际使用第三种原因是估计等值关系时所用的被试组与实际使用这两测验的被试组有实质性的差异,此时将所估等值关这两测验的被试组有实质性的差异,此时将所估等值关系应用于实测群体,系统误差也就产生了。系应用于实测群体,系统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 测验等值 第九 测验 等值
限制150内