心理与教育测量第四章课件讲课讲稿.ppt
《心理与教育测量第四章课件讲课讲稿.ppt》由会员分享,可在线阅读,更多相关《心理与教育测量第四章课件讲课讲稿.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理心理(xnl)与教育测量与教育测量主讲主讲(zhjing):邓稳根(博士):邓稳根(博士)赣南师范学院教育科学学院赣南师范学院教育科学学院E-Mail:第一页,共46页。第四章第四章 测量测量(cling)信度信度信度概述信度概述(i sh)信度的估计方法信度的估计方法提高测量信度的方法提高测量信度的方法第二页,共46页。第一节第一节 信度概述信度概述(i sh)信度的定义信度的定义(dngy)信度的作用信度的作用第三页,共46页。一、信度的定义一、信度的定义(dngy)信度的描述性定义信度的描述性定义信度(信度(reliability)指测量结果的稳定性程)指测量结果的稳定性程度度(ch
2、ngd),有时也叫测量结果的可靠性。,有时也叫测量结果的可靠性。信度系数(信度系数()是表示测量信度高低的指标,)是表示测量信度高低的指标,其值域为其值域为0,1。世界上没有百分之一。世界上没有百分之一百可靠的测量。百可靠的测量。只是理论上的。只是理论上的。信度也是多次测量同一对象的一致性程度信度也是多次测量同一对象的一致性程度(chngd)。第四页,共46页。信度的统计定义(统计等价定义)信度的统计定义(统计等价定义)信度是被试团体真分数方差与实得分数方差信度是被试团体真分数方差与实得分数方差之比,即:之比,即:信度是被试团体真分数与实得分数相关系数信度是被试团体真分数与实得分数相关系数的平
3、方,即:的平方,即:信度是一个信度是一个(y)测验与它的任意一个测验与它的任意一个(y)平行测验的相关系数,即:平行测验的相关系数,即:第五页,共46页。二、信度的作用二、信度的作用(zuyng)信度是测量过程中所存在的随机误差大小的信度是测量过程中所存在的随机误差大小的反映。反映。测量中随机误差越大,测量的信度越低。测量中随机误差越大,测量的信度越低。(但信度与系统误差无关!)(但信度与系统误差无关!)信度可以信度可以(ky)用来解释个人测验分数的意用来解释个人测验分数的意义。义。信度可以信度可以(ky)帮助进行测验分数的比较帮助进行测验分数的比较第六页,共46页。1、解释、解释(jish)
4、个人分数的意个人分数的意义义测量标准测量标准(biozhn)误的作用:误的作用:估计真实分数的范围;估计真实分数的范围;了解实得分数再测时可能的变化情形。了解实得分数再测时可能的变化情形。真分数的估计,或再测时实得分数的变化范真分数的估计,或再测时实得分数的变化范围计算:围计算:根据根据SE=Sxsqrt(1-rxx),求,求SE。根据显著性水平根据显著性水平或置信水平(或置信水平(1-)。)。则真分数的置信区间或再测时则真分数的置信区间或再测时X的变化范围的变化范围是:是:X-Z/2SE Z/2,则差异显著;反之,则差,则差异显著;反之,则差异不显著。异不显著。第九页,共46页。不同不同(b
5、 tn)测验分数的差异比测验分数的差异比较举例较举例某被试在韦氏成人智力测验中言语智商某被试在韦氏成人智力测验中言语智商(zh shn)为为100,操作智商,操作智商(zh shn)为为105,已知两个分数都是以,已知两个分数都是以100为平均数,为平均数,15为标准差的标准分数,假设言语分量表为标准差的标准分数,假设言语分量表和操作分量表的分半信度为和操作分量表的分半信度为0.87和和0.88,问,问言语智商言语智商(zh shn)和操作智商和操作智商(zh shn)是否存在显著性差异(是否存在显著性差异(=0.05)。第十页,共46页。需要需要(xyo)注意的问题注意的问题一个测验可以有多
6、个信度估计值,因而其误一个测验可以有多个信度估计值,因而其误差估计值也会有多个。差估计值也会有多个。本理论假定同一个团体本理论假定同一个团体(tunt)中所有人的中所有人的测量误差是相同的,但实际上水平高的人与测量误差是相同的,但实际上水平高的人与水平低的人在做测量时会有不同的随机误差。水平低的人在做测量时会有不同的随机误差。测量的结果不能僵硬地看成是一个点,而应测量的结果不能僵硬地看成是一个点,而应看成是一个以该点为中心,以看成是一个以该点为中心,以SE的某个倍的某个倍数为半径上下波动的一个范围。例如,真正数为半径上下波动的一个范围。例如,真正IQ一般在实得一般在实得IQ5的范围内波动。的范
7、围内波动。第十一页,共46页。第二节第二节 信度的估计信度的估计(gj)方法方法重测信度重测信度复本信度复本信度分半信度分半信度同质性信度同质性信度分半信度和同质性信度也叫内部一致性系数。分半信度和同质性信度也叫内部一致性系数。评分者信度评分者信度成套测验成套测验(cyn)综合分数的信度综合分数的信度第十二页,共46页。一、重测信度一、重测信度定义:定义:同一测验对同一批被试先后施测量两次所得同一测验对同一批被试先后施测量两次所得结果结果(ji gu)的一致性程度,其大小为两的一致性程度,其大小为两次分数的积差相关系数。次分数的积差相关系数。也叫稳定性系数。也叫稳定性系数。用于考查测量结果用于
8、考查测量结果(ji gu)跨时间的稳定跨时间的稳定性。性。计算公式:计算公式:第十三页,共46页。举例举例(j l):假设有一份考试假设有一份考试(kosh)焦虑调查表,先后两次焦虑调查表,先后两次施测于施测于10名学生,时间间隔为半年,结果如表所名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。示,求该测验的重测信度。第十四页,共46页。使用条件使用条件(tiojin)所测心理品质相对稳定,否则无法判断是所测心理品质相对稳定,否则无法判断是量具信度低,还是品质本身稳定性差。量具信度低,还是品质本身稳定性差。前后间隔时间要恰当,遗忘和练习的效果前后间隔时间要恰当,遗忘和练习的效果基本上
9、相互抵消。时间间距依问题的性质和基本上相互抵消。时间间距依问题的性质和测量目的而定。通常,以测量目的而定。通常,以2-4周为宜。智力周为宜。智力测验的间隔一般在测验的间隔一般在6个月左右。个月左右。间隔期间被试在所测品质方面无更多学习间隔期间被试在所测品质方面无更多学习和训练。和训练。有被试的真诚合作。有被试的真诚合作。第十五页,共46页。需要注意的问题需要注意的问题当某个测验涉及多个年龄或年级等不同层次当某个测验涉及多个年龄或年级等不同层次的考生(被试)时,重测信度不能直接用测的考生(被试)时,重测信度不能直接用测验的原始分数进行估算,而必须使用经过常验的原始分数进行估算,而必须使用经过常模
10、量表转换之后的量表分数或其他类型的标模量表转换之后的量表分数或其他类型的标准分数进行估算。否则会高估。准分数进行估算。否则会高估。当极少数考生的前测分数与后测分数相差特当极少数考生的前测分数与后测分数相差特别别(tbi)明显时,应去除这些异常的极端明显时,应去除这些异常的极端值(控制在值(控制在2%以内),以避免低估重测信以内),以避免低估重测信度。度。第十六页,共46页。评价评价优点:能提供有关测验是否随时间而变异的优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。资料,可作为被试将来行为表现的依据。缺点:难以缺点:难以(nny)消除记忆和练习及学习消除记忆和练习及学
11、习的影响;难以的影响;难以(nny)取得被试的全面合作。取得被试的全面合作。第十七页,共46页。二、复本二、复本(fbn)信度信度定义定义两个平行测验测量同一批被试所得结果的一致性程两个平行测验测量同一批被试所得结果的一致性程度度(chngd)。其大小为两次分数的积差相关系数。其大小为两次分数的积差相关系数。分类分类等值性系数(通常指复本信度):两个复本测验同等值性系数(通常指复本信度):两个复本测验同时连续施测。时连续施测。稳定性与等值性系数(通常指重测复本信度):两稳定性与等值性系数(通常指重测复本信度):两个复本测验相距一段时间分两次施测。是对信度的个复本测验相距一段时间分两次施测。是对
12、信度的最严格的检验。最严格的检验。实施实施平衡设计:将被试随机分成两半,一半先测平衡设计:将被试随机分成两半,一半先测A卷,卷,再测再测B卷;另一半先测卷;另一半先测B卷,再测卷,再测A卷。卷。第十八页,共46页。计算公式计算公式类似于重测信度。类似于重测信度。举例举例假设假设(jish)用用A、B两型智力复本测验对两型智力复本测验对五年级五年级10个学生施测。结果见下表。试求个学生施测。结果见下表。试求该测验的复本信度。该测验的复本信度。第十九页,共46页。测验 被试 1 2 3 4 5 6 7 8 9 10 X1 16 17 18 14 15 13 12 20 11 9 X2 15 16
13、19 18 16 12 11 19 10 8第二十页,共46页。使用前提条件使用前提条件要命制出真正等值的平行测验。要命制出真正等值的平行测验。被试要有条件(时间、经费等)接受两个测被试要有条件(时间、经费等)接受两个测验。验。评价评价(pngji)优点:能减少练习和记忆效应。优点:能减少练习和记忆效应。缺点:很难构造出两份以上的平行测验;只缺点:很难构造出两份以上的平行测验;只能减少而不能消除练习效应;无法消除迁移能减少而不能消除练习效应;无法消除迁移效应。效应。第二十一页,共46页。三、分半信度三、分半信度定义:定义:将一个测验随机分为对等的两半(常用奇偶将一个测验随机分为对等的两半(常用
14、奇偶分半),所有被试在这两半测验上得分的一分半),所有被试在这两半测验上得分的一致性程度。致性程度。计算计算通常也采用积差相关系数通常也采用积差相关系数(xsh)求取。求取。由于测验长度变短,通常需要校正,公式为:由于测验长度变短,通常需要校正,公式为:,其中,其中 为两半的相关系数为两半的相关系数(xsh)。第二十二页,共46页。举例举例(j l)已知某量表的分半信度为已知某量表的分半信度为0.63,请算出原长,请算出原长度度(chngd)的信度系数。的信度系数。第二十三页,共46页。上式为上式为Spearman-Brown公式,使用条件为两公式,使用条件为两半分数半分数(fnsh)的方差(
15、变异数)相等。如果的方差(变异数)相等。如果不等,可采用下列两个等价公式直接计算。不等,可采用下列两个等价公式直接计算。Flanagan公式:公式:Rulon公式:公式:其中其中、为两半测验分数为两半测验分数(fnsh)方差,方差,为为两半测验分数两半测验分数(fnsh)之差数的方差,之差数的方差,为总为总方差。方差。第二十四页,共46页。使用条件使用条件随机分成随机分成(fn chn)的两半必须是对等的的两半必须是对等的两半。两半。通常在只能施测一次或没有复本的情况下使通常在只能施测一次或没有复本的情况下使用。用。评价评价优点:只需施测一次便能求取信度。优点:只需施测一次便能求取信度。缺点:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 测量 第四 课件 讲课 讲稿
限制150内