五章心理测量的信度.ppt
《五章心理测量的信度.ppt》由会员分享,可在线阅读,更多相关《五章心理测量的信度.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、五章心理测量的信度 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望n一、信度的意义n二、信度系数的作用 n backn一、信度的意义n信度即测验的可靠性,指的是测量的一致性程度。n信度受随机误差的影响,随机误差越大,信度越低。n在测量学中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率。即n (公式51)n式中 代表信度系数,代表真分数的变异数,代表实得分数的变异数,即总变异数。n根据公式51,信度还可以表示为:n (公式52)n这个定义有两点
2、要注意:n(1)信度是一组测量分数的特性,不是某个测量分数的特性。是对一个人测量多次或对一个群体进行测量得到一组测量分数的特性n(2)真分数的变异数不能直接测量,因此信度是一个理论上构想的概念,只能根据一组实得分数进行估计。n对于信度系数,还应该注意以下几点:n(1)在不同的情况下,对于不同的样本,采用不同的方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。n(2)信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因。n(3)获得较高的信度系数并不是心理测量 有 效 的 充 分 条 件,只 是 一 个 必 要 条 件。backn1.评价测验n信度系数是衡量测验好坏的一个重要
3、的技术指标。n一般能力与学绩测验的信度系数为0.90以上,有的可以达到0.95;标准智力测验的信度系数应达到0.85以上,个性和兴趣测验的信度系数可稍低,一般应达到0.700.80,(也有人认为兴趣、性格、价值观等人格测验的信度系数,通常在0.800.85或更高些)。当信度系数小于0.70时,不能用测验来对个人进行评价,也不能用来进行团体间的比较;当信度系数大于0.70时,可用来进行团体间的比较;大于0.85时,可以用来鉴别个人。n2.用来估计个人的测验分数(真分数)n由于误差的存在,一个人通过测量得到的分数很难等于真分数。理论上,我们可以对一个人施测无数次,然后求得所得分数的平均数和标准差。
4、在这个假设的分布里,平均数就是这个人的真分数,标准差则为误差大小的指标。n在实际工作中,我们用一组被试(人数足够多)两次施测的结果来代替对同一个人反复施测,以估计测量误差的变异数。此时,个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差(误误差差分分布布的的标标准准差差)我们称之为测测量量的的标标准准误误,是表示测量误差的大小的指标,其计算公式为:n (公式54)n式中SE表示测量的标准误,即误差分布的标准差;Sx表示一次测量分数的标准差;rxx表示信度系数。n我们可以用测量的标准误来估计个人测验的真分数的大小。n如果选用95的可靠性水平(置信水平),即显著性水
5、平(a值)为.05,真分数有95的可能落入X SE,即X 1.96 SE的范围之内,也可以写成X1.96SE T X1.96 SE,SE则用公式54代入。或有5的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。n例1,已知WISC-R的标准差为15,信度系数为0.95,对一名12岁的儿童实施该测验后,IQ为110,那么他的真分数在95的可靠度要求下,变动范围应是多大?n注意几点:n(1)SE对真分数做的是区间估计,不可能由此得到一个确切的点。这就是说,测验分数不是一个定点,而是具有一定的分布范围。因此,两次测验分数之间存在差异是很正常的。n(2)置信水平确定后,估计的精度主要取决
6、于SE,SE越小,范围越小,估计就越精确,反之也然。n(3)真分数不能等同于真正能力或心理特质,真分数中包括了系统误差。n3.用来对两种测验分数进行比较n来自不同测验的原始分数是无法直接进行比较的,只有将它们转换成相同尺度的标准分数才能进行比较。n如,某班期末考试,小明的数学成绩是80分,语文成绩是70分。另外,已知小明所在班级的数学平均成绩是70分,标准差是10分,语文平均成绩是60分,标准差是7分。n我们可以用“差异的标准误”来检验差异的显著性。n差异的标准误的公式为:n (公式55)n 为差异的标准误,S为相同尺度的标准分数的标准差,Z分数为1,T分数为10。、分别为两个测验的信度系数。
7、n先将原始分数化成标准分数,然后将两个标准分数的差异与1.96SEd(0.05显著性水平)进行比较,如果其绝对值大于此值,则差异显著,否则差异不显著。n例2,某校五年级进行了两次数学测验,小张第一次考了85分,此次数学测验年级平均分是77分,标准差是8分,此次测验的信度系数是0.84;第二次考了95分,此次数学测验年级平均分是81分,标准差是10分,此次测验的信度系数是0.91;问小张这两次数学测验的成绩是否有显著差异?n backn一、再测信度n二、复本信度n三、等值稳定性系数n四、内部一致性系数 n五、评分者信度 n总结总结n练习练习n backn再测信度(Test-Retest Reli
8、ability),也叫重测信度,也叫稳定性系数。用同一个测验,对同一组被试前后施测两次,对两次测验分数求相关,其相关系数就叫再测信度。其计算公式(皮尔逊积差相关公式的变式)为:n (公式56)n式中X1、X2为同一被试的两次测验分数,、为全体被试两次测验的平均数,S1、S2为两次测验的标准差,N为被试人数。n再测法的模式是:施测 适当时距 再施测n例2:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。(为了便于理解和计算,本章估计信度的例子都是小样组,实际应用时应采用大样组。)n表51 某幸福感调查表的两次测试结果n 测验被试123456
9、78910X1 16151313111010987X21616141211911867n计算再测信度必须注意几个问题:n(1)所测量的特性必须是稳定的。当然绝对的稳定是不可能的,但应该是比较稳定的。n(2)遗忘和练习的效果基本上相互抵消。n在做第一次测验时,被试可能会获得某种技巧,但只要间隔时间适度,这种练习的效果会基本上被遗忘掉。n再测信度要考虑时间间隔的问题。到底多长合适呢?一般来说,无论对于那种被试,初测与再测的间隔最好不要超过六个月。n(3)再测法适用于速度测验而不适用于难度测验。n(4)应注意提高被试者的积极性。back n复 本 信 度(Alternate Form Reliabi
10、lity),也 称 等 值 性 系 数(Coefficient of Equivalence)n用两个平行(等值)的测验对同一组被试施测,得到两组测验分数,求这两组测验分数的相关系数,这就是复本信度。因为这反应了两个测验的等值程度,因此又称等值性系数。计算方法与再测法是一样的。n复本信度的模式是:复本A 最短时距 复本B n例3:假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果见表52。请同学们自己计算。n表52 某创造力复本测验测试结果 测验被试12345678910X1 20191918171614131210X22020181615171211139n复本信度应用时应注意以
11、下几点:n(1)复本信度的关键在于两个量表必须等值,即必须具有相同的难度、区分度、长度、题型等。n(2)两次测验的时距应尽可能短促,以便避免知识的积累、练习效应等因素的影响。n(3)由于量表的两个复份在许多方面近似,所以信度系数有稍稍偏高的倾向。n(4)被试易出现疲劳、失去积极性等反应,还会出现迁移。这些称为顺序效应,为了抵消顺序效应,可随机分配一半被试先做复本A再做复本,另一半被试先做复本再做复本A,以平衡顺序效应。n(5)复本法只能减少而不能完全排除练习和记忆的影响。n(6)对于许多测验来说,建立复本是相当困难的。backn三、等值稳定性系数n等值稳定性系数是用两个平行的(等值的)测验,间
12、隔适当时距施测于同一组被试得到两组测验分数,求这两组测验分数的相关,其相关系数就是等值稳定性系数。n等值稳定性系数的模式是:n测验A 适当时距 测验Bn计算方法同稳定性系数和等值性系数。n等值稳定性系数也是采用复本对被试施测,但等值性系数的测验要求两次测验的时间间隔尽可能短,而计算等值稳定性系数的两次测验却要求有一个适当的时距。n优点:n(1)因两次测试有适当的时间间隔,减少了复本法中的练习、疲劳效应。n(2)只要时间间隔适当,可用于计算稳定性不高的心理特质的测验的信度。n注意:n等值稳定性信度系数的值一般要比等值性系数和稳定性系数要低。n等值稳定性系数是测验信度的最严格的考察,得到的是信度系
13、数的下限。n backn利用一次测验所获得的资料来计算信度系数。这样计算出来的信度系数反应的是测验内部的一致性,即测验项目的同质性,叫做内部一致性系数或同质性系数。n(一)分半法(分半信度)n(二)其它计算内部一致性系数的方法 n back n分半信度(Split-half reliability):分半信度就是将测验题目分成等值的两半,分半求出量表题目的总分,再计算两部分总分的相关系数。n分半的方法很多,常见的方法是把一个量表按题目番号分为两半,一半是奇数题,另一半数偶数题。求出每个人的奇数题的总得分和偶数题的总得分,然后求出奇数题总得分和偶数题总得分的相关系数,最后对相关系数进行校正。n校
14、正公式有:n(1)斯 皮 尔 曼 布 朗(Spearman-Brown)公式(公式57)n 式中,是两半测验分数的相关系数,为整个测验的信度估计值。n 采 用 斯 皮 尔 曼 布 朗(Spearman-Brown)公式进行校正时,假定两半测验等值,亦即两半测验具有相同的平均数和标准差。当假定不能满足时,可以采用下面两个公式来估计信度。n弗朗那根公式:n (公式58)n式中,、分别为两半测验分数的变异数,为测验总分的变异数。r为信度值。n卢伦公式:n (公式59)n式 中,为 两 半 测 验 分 数 之 差 的 变 异 数,为测验总分的变异数。r为信度值。n例4:有一个由100题构成的量表施测于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 测量 信度
限制150内