项目反映理论与自适应测验.ppt
《项目反映理论与自适应测验.ppt》由会员分享,可在线阅读,更多相关《项目反映理论与自适应测验.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 测试与测试理论测试与测试理论测量的意义与分类教育测量一般概念及量表测量数据的记述与处理项目反应理论项目反应理论的应用一、测量的意义和分类狭量测试:针对具体的技能、知识、能力、适应性等特性的测试1、测量的分类器具测试与笔纸测试客观测试与非客观测试综合测试与分析测试标准测试与非标准测试集团基准测试与达到基准测试二、教育测量一般概念及量表测量:根据一定规则规则用数字对事物的特性加以描述和确定的过程。采用的方法采用的方法测量包含1)要明确被测量对象的属性或性质)要明确被测量对象的属性或性质2)确定能使这些属性显示出来并又可)确定能使这些属性显示出来并又可以被感知的一系列操作以被感知的一系列操作
2、3)制定一个程序使得结果可以量化)制定一个程序使得结果可以量化1、教育测量的一般概念参照点参照点计算的起点,有绝对零点和相对零点(人为定的参照点)。教育测量中的参照点为相对零点。单位单位测量的基础。理想单位的条件:要有确定的意义;具有相等的价值要有确定的意义;具有相等的价值?教育测量:根据教育目标的要求,按一定规则用数字对教育效果教育效果加以描述和确定的过程。即,遵照教育学、心理学和测量学的理论和原则,通过各种测验来确定由于教育引起的学生知识、通过各种测验来确定由于教育引起的学生知识、能力变化的方向和数量能力变化的方向和数量。间接测量。通过测量学生对所学知识的掌握程度通过测量学生对所学知识的掌
3、握程度来了解其智力或学业水平的现状和发展情况来了解其智力或学业水平的现状和发展情况。测量的结果是相对的。学生学业成绩只有在某种学生学业成绩只有在某种标准的比较中才有意义标准的比较中才有意义。只有把它们和集体的平均水平比较,或者和教学计划规定的教学内容、教学目标比较,才能确定测验分数的含义。2、教育测量的量表量表测量工具。具有一定单位和参照点的具有一定单位和参照点的连续体连续体,为获得有用的数据而设计。根据精确度1)类别(称名)量表)类别(称名)量表2)等级(顺序)量表)等级(顺序)量表3)等距(间隔)量表)等距(间隔)量表4)等比(比率)量表)等比(比率)量表1)类别量表)类别量表对被测对象进
4、行分类,并赋予各类以不同的符号。类之间只具有类之间只具有“质质”的差别而不具有的差别而不具有“量量”的差的差别。别。功能标记标记分类分类适用的统计百分比百分比卡方检验卡方检验2)等级量表)等级量表数字或符号表示测量对象在某一属性上的顺序或等级关系。不表明各数字间的差距相等,不能进行四则运算。不表明各数字间的差距相等,不能进行四则运算。适用的统计中位数中位数百分位数百分位数3)等距量表)等距量表具有类别量表和等级量表的性质外,还具有连续连续数量之间的差距相等数量之间的差距相等。数值间不能进行乘除运算,但可以进行加减运算。数值间不能进行乘除运算,但可以进行加减运算。量表的数值加或减一个常数或用一个
5、常数乘除,量表的数值加或减一个常数或用一个常数乘除,不会破坏原有数据间的关系。不会破坏原有数据间的关系。适用的统计均数均数相关系数相关系数Ft检验检验教育测量教育测量4)等比量表)等比量表具有最高的水平量度,除了具有前三者性质外,还具有绝对零度,可进行四则运算。物理测量物理测量心理测量中,反应时间属于该类。心理测量中,反应时间属于该类。教学与时间数据进行分析即可采用等比量表。教学与时间数据进行分析即可采用等比量表。3、教育测量的误差测量误差:在测量过程中由与目的无关的因素产生的不准确的或不一致的结果。随机误差:系统误差:由与测量目的无关的偶然偶然因素引起的变化无规律无规律的误差由与测量目的无关
6、的因素引起的恒恒定的有规律定的有规律的误差随机误差:系统误差:多次测量结果不一致,大小和方向是随机的。既影响测量的准确性又影响一致性。稳定地存在于每一次测量中。只影响测量的准确性。测验试题形式选择不当、指导语不清晰、评分标准不一致等。系统误差:随机误差:测验设计人员有偏见。经典测量理论关于误差三个假设1)测验的观察分数)测验的观察分数X可看作真分可看作真分数数T和测验误差分数和测验误差分数E的线性组合;的线性组合;2)误差分数)误差分数E的数学期望为的数学期望为0;3)任何两次测量所产生的误差相)任何两次测量所产生的误差相互独立。互独立。误差的来源1)测验自身所引起的误差;)测验自身所引起的误
7、差;2)测验过程所引起的误差;)测验过程所引起的误差;3)被试本身所引起的误差。)被试本身所引起的误差。三、测量数据的记述和处理(一)测量数据的统计测度1、平均值、分散和标准偏差X (x1x2x3xN)N1N1i=1 N xi平均值平均值x方差(分散)方差(分散)S2x测量得分的分散程度S2xN1i=1 N(XiX)2变异数变异数标准偏差标准偏差SxSxS2x N1i=1 N(XiX)22、协方差和相关系数协方差协方差SxySxyN1i=1 N(XiX)(yiy)相关系数相关系数xy xySxySxSyN1i=1 N(XiX)(yiy)N1i=1 N(XiX)2 i=1 N(yiy)2 N1(
8、二)测量数据应具备的特性1、测量的误差模型xi测试值ti 真值ei 测量误差xitieiN足够多ei=1 N 0eiXN1i=1 N xiN1i=1 N(tiei)N1i=1 N tiN1i=1 N eitet若测量误差与得分真值间是完全独立的,则:SteN1i=1 N(tit)(eie)0S2xN1i=1 N(XiX)2N1i=1 N (ti+ei)(ti+e)2S2t+S2e+2SteS2t+S2e2、测量的信度信度:当一个测验多次测量的结果一致或稳定时,它就被认为是可靠的。而估计测量一致性或稳定性程度的指标,称为信度。rXXS2T/S2X即指:测验中,被试的实得分数与真实分数差距越小,测
9、验的分数就越可靠,信度就越高;反之,信度就越低。估计信度的方法:1)再测信度)再测信度2)复本信度)复本信度3)分半信度)分半信度4)内部一致性信度)内部一致性信度5)评分者信度)评分者信度1)再测信度)再测信度rXXS1S2N1X1X2X1X2用同一个测验,对同一组被试前后两次施测,两次测验分数之间的相关程度就是再测信度。测验跨时间的一致性稳定性系数。例1假设有20个学生在1月1日接受了一个测验,到2月1日,又再一次接受同一测验,把1月1日的首测与2月1日的再测的分数分别记为X1X2,测验结果为:学生1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1
10、9 20X115 14 13 12 12 11 11 10 10 10 10 10 9 9 9 8 8 7 6 5X215 14 16 15 13 12 11 13 13 12 10 11 11 11 10 9 10 7 8 8计算得:X1X2S2S19.9511.452.462.422385X1X2rXX(2.462.42)(2385/209.9511.45)0.9再测信度满足条件所测量的特性必须是稳定的;所测量的特性必须是稳定的;遗忘与练习的效果相同;遗忘与练习的效果相同;两次施测期间被试的学习效果没有两次施测期间被试的学习效果没有差别。差别。优点:提供测验结果是否随时间而变化的资料,可作
11、为预测被试将来行为的依据;缺点:易受练习和记忆的影响。适用于速度测验,不适用于难度测验适用于速度测验,不适用于难度测验2)复本信度)复本信度平行测试法平行测试法根据一组被试在两个等值测验上的得分计算的相关系数即为复本信度系数。反映的是两个测验之间的等值程度等值系数,公式与稳定性系数公式相同,即再测信度公式。优点:一定程度上避免了受练习和记忆的影响缺点:很难编制两份等值的试卷3)分半信度)分半信度折半法折半法按正常的程序实施测验,然后将全部试题分成相等的两半,被试组在这两半测验上的分数之间的相关系数即为信度系数。如何如何分半分半?优点优点:分半法估计信度比再测法和副本法简便,减少了学生的疲劳、厌
12、烦等因素;局限局限:分半信度系数只能表示两半试题的等值程度,不能提供时间稳定性的信息。不采用前后分半,采用奇偶分半法,即将题目的奇数号分为一组,偶数号分为一组;求出所有被试在奇数和偶数题上总分的相关系数;求得的信度为半个测验信度,整个测验的信度需要进行矫正。rXX2rAB/(1rAB)求得当两半测验等值时,两半测验分数具有相同的平均数和标准差,可用斯皮尔曼布朗公式校正:当两半测验具不同的均值和方差时,可用卢伦公式校正:rXX1Sd2/Sx2Sd2两半测验分数两半测验分数之差的方差之差的方差Sx2整个测验总分整个测验总分的方差的方差4)内部一致性信度)内部一致性信度也称同质性,指测验内部所有题目
13、间的一致性。如果在一个测验中各道试题得分有较大的正相如果在一个测验中各道试题得分有较大的正相关时,我们说这个测验是同质的,也就是说,关时,我们说这个测验是同质的,也就是说,在该测验项目中所有的项目都测量相同的特质在该测验项目中所有的项目都测量相同的特质或程度略同的特质。或程度略同的特质。估计测验内部一致性的常用方法:库德理查逊公式rKR20kk1(1 )Sx2p pi iq qi irKR21kSx2X(kX)(k1)Sx2k测验题目数测验题目数 pi通过第通过第i题的人数比例题的人数比例qi为未通过第为未通过第i题的人数比例题的人数比例 Sx2测验总分数的方差测验总分数的方差X测验总分数的平
14、均数测验总分数的平均数例2假设在一次有100人参加的客观性试题的测验中,题量为20道,学生考试分数的标准差为4分,各试题的答对人数如表所示:试题号试题号1 2 3 4 5 6 7 8 9 10答对人数答对人数60 70 50 45 80 90 40 30 25 47 试题号试题号11 12 13 14 15 16 17 18 19 20答对人数答对人数82 74 20 10 24 25 19 15 12 10p pi iq qi i3.523.52Sx216k20rKR2020201(1 )163.523.520.82例3假定某次考试共有105道题,学生平均分数为75分,标准差为19分,则利用
15、kR21公式可计算得这次考试的信度是:rKR21kSx2X(kX)(k1)Sx210519275(10575)(1051)1920.95库德理查逊法只适于客观性客观性测验,不适用于主观性测验;只适用于题目得分不为题目得分不为1则为则为0的的测验测验,不适用于其他判分方式的测验。克伦巴赫系数可用于多重评分测验kkkk1(1 )Sx2Si2k测验的题目数Si2第I道题目分数的方差Sx2测验总分的方差与库德理查逊法不适用于速度测验5)评分者信度)评分者信度考察评分者信度的方法是随机抽取部分试卷,由两个或多个评分者按评分标准打分,然后求其间的相关。一般认为,当经过训练的成对评分者之间的相关系数达到0.
16、9以上时,才能认为评分客观。评分者之间的一致性越好,其信度也越高。1)5)估计信度的方法,只适用于常模参照测验,而不适用于标准参照测验;信度系数是衡量测验好坏的一个重要指标。最理想的情况是信度为;一般能力与学绩测验的信度系数常在0.90以上,性格、兴趣、态度等人格测验的信度系数通常在0.800.85之间。6)信度系数与个人测验真分数的估计)信度系数与个人测验真分数的估计常通过估计测量标准误标准误的方法对个人真正能力作置信区间的估计。测量标准误的大小影响实得分数对真分数估计的精确度,其数值与信度有关,两者之间的关系:SESX(1rxx)1/2SE测量的标准误SX 所得分数的标准差rxx测验的信度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 项目 反映 理论 自适应 测验
限制150内