第四章测量的信度与效度优秀课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第四章测量的信度与效度优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章测量的信度与效度优秀课件.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章测量的信度与效度第1页,本讲稿共87页第一节第一节 测量信度测量信度一、什么是信度一、什么是信度1.1.信度的描述定义信度的描述定义信度(信度(reliability)是指测量结果的稳定性和可靠性)是指测量结果的稳定性和可靠性程度。程度。第2页,本讲稿共87页2.信度的测量学定义(操作性定义)信度的测量学定义(操作性定义)第3页,本讲稿共87页3.误差方差与信度的关系误差方差与信度的关系第4页,本讲稿共87页二、信度的估计方法二、信度的估计方法(一)重测信度(一)重测信度(test-retest reliability)1.含义与计算含义与计算重测信度是指用同一量表对同一组被试测试两次所
2、得结重测信度是指用同一量表对同一组被试测试两次所得结果的一致程度,其大小等于同一组被试在两次测验上所果的一致程度,其大小等于同一组被试在两次测验上所得分数的积差相关系数。即:得分数的积差相关系数。即:第5页,本讲稿共87页第6页,本讲稿共87页第7页,本讲稿共87页2.重测信度使用的条件重测信度使用的条件(1)所测量的心理特质必须是稳定的)所测量的心理特质必须是稳定的(2)遗忘和练习的效果基本上相互抵消)遗忘和练习的效果基本上相互抵消(3)在两次测试时间间隔内,被试在所要测查的心理特)在两次测试时间间隔内,被试在所要测查的心理特质方面没有其他的学习和练习质方面没有其他的学习和练习第8页,本讲稿
3、共87页3.计算重测信度应注意的问题计算重测信度应注意的问题(1)两次测验时间间隔要适当)两次测验时间间隔要适当(2)应提高被试的积极性)应提高被试的积极性(3)适宜于人格测验与速度测验,不适合于智力等难)适宜于人格测验与速度测验,不适合于智力等难度测验度测验第9页,本讲稿共87页(二)复本信度(二)复本信度(Alternate-form reliability)1.含义与计算含义与计算是指两个平行测验测量同一批被试所得结果的一致程是指两个平行测验测量同一批被试所得结果的一致程度,其大小等于同一组被试在两个复本测验上所得分度,其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式
4、同重测信度。数的积差相关系数。计算公式同重测信度。第10页,本讲稿共87页两个复本测验实施的时间不同,复本信度所表达的含义略两个复本测验实施的时间不同,复本信度所表达的含义略有不同。有不同。(1)等值性系数)等值性系数如果两个复本测验是同时连续测试的,则称这种复如果两个复本测验是同时连续测试的,则称这种复本信度为等值性系数。等值性系数的大小主要反映本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的题目差别带来的变异情况。着两个复本测验的题目差别带来的变异情况。第11页,本讲稿共87页()稳定性与等值性系数()稳定性与等值性系数如果两个复本测验是相距一段时间分两次测试,则如果两个复本测
5、验是相距一段时间分两次测试,则称这种复本信度为稳定性与等值性系数。此时两个称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水平等方题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。面的差别都会成为测验结果不一致的原因。第12页,本讲稿共87页2.复本信度使用的条件复本信度使用的条件(1)两个测验必须在项目的内容、形式、数量、难易、时限、指导)两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。语等方面相同或相似。(2)两次测验的时间间隔要适当。)两次测验的时间间隔要适当。局限:局限:(1)复本法只能减少而不能
6、排除练习和记忆效应。)复本法只能减少而不能排除练习和记忆效应。(2)对于许多测验来说要建立复本是非常困难的。)对于许多测验来说要建立复本是非常困难的。第13页,本讲稿共87页(三)分半信度(三)分半信度(Split-half reliability)1.含义与计算含义与计算是指将一个测验分成对等的两半后,所有被试在这两半上得分的是指将一个测验分成对等的两半后,所有被试在这两半上得分的一致性。一致性。分半信度信度与等值性系数的解释一样,即可以把对等的两半测验看成是分半信度信度与等值性系数的解释一样,即可以把对等的两半测验看成是最短时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性,最短
7、时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性,所以也叫内部一致性系数。所以也叫内部一致性系数。第14页,本讲稿共87页注意题目分半的方法:按题号奇偶性分半、按题目注意题目分半的方法:按题号奇偶性分半、按题目难度分半、按题目内容分半等。难度分半、按题目内容分半等。计算方法与复本信度类似,但被试在两半测验上得计算方法与复本信度类似,但被试在两半测验上得分的相关系数只是半个测验的信度,所以必须用斯分的相关系数只是半个测验的信度,所以必须用斯皮尔曼皮尔曼布朗公式加以校正:布朗公式加以校正:第15页,本讲稿共87页第16页,本讲稿共87页第17页,本讲稿共87页第18页,本讲稿共87页2
8、.使用的前提条件和范围使用的前提条件和范围分半信度通常是在只能施测一次或没有复本的情况下使分半信度通常是在只能施测一次或没有复本的情况下使用。其中使用斯皮尔曼用。其中使用斯皮尔曼布朗公式时要求全体被试在两布朗公式时要求全体被试在两半测验分数的变异数相等。当测验无法分成对等的两半时,半测验分数的变异数相等。当测验无法分成对等的两半时,无法使用。无法使用。第19页,本讲稿共87页(四)同质性信度(四)同质性信度(Homogeneity reliability)1.含义含义同质性信度也叫内部一致性系数,它是测验内部所有题目间的一同质性信度也叫内部一致性系数,它是测验内部所有题目间的一致性程度。这里的
9、一致性有两种含义:一是所有题目都测的是同致性程度。这里的一致性有两种含义:一是所有题目都测的是同一种心理特质,二是所有题目得分之间都具有较高的正相关。同一种心理特质,二是所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。质性信度就是一个测验所测内容或特质的相同程度。第20页,本讲稿共87页第21页,本讲稿共87页第22页,本讲稿共87页第23页,本讲稿共87页第24页,本讲稿共87页实际上实际上系数是所有可能分半信度的平均值,但它是测系数是所有可能分半信度的平均值,但它是测验信度的一个下界值,即验信度的一个下界值,即系数值大,测量信度必然系数值大,测量信度必然
10、高,但高,但系数值小,却不能判断测量信度不高。系数值小,却不能判断测量信度不高。第25页,本讲稿共87页例题:某态度量表共道题目,例题:某态度量表共道题目,100个被试在各题上得个被试在各题上得分的方差分别是分的方差分别是0.81,0.82,0.80,0.86,0.88,0.79,0.89,测验总分的方差是测验总分的方差是26.00,计算该测量的信度。计算该测量的信度。第26页,本讲稿共87页第27页,本讲稿共87页(五)评分者信度(五)评分者信度(Scorer reliability)1.含义与计算含义与计算评分者信度指的是多个评分者给同一批人的答卷进评分者信度指的是多个评分者给同一批人的答
11、卷进行评分的一致性程度。对于主观试题,不同的评分行评分的一致性程度。对于主观试题,不同的评分者给出的分数是不等的,这样会造成误差,如何降者给出的分数是不等的,这样会造成误差,如何降低评分者信度是心理测量的重要任务之一。低评分者信度是心理测量的重要任务之一。第28页,本讲稿共87页当评分者人数为当评分者人数为2时,评分者信度等于两个评分者时,评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。如果是给同一批被试答卷所给分数的相关系数。如果是多个评分者,评分者信度采用肯德尔和谐系数进多个评分者,评分者信度采用肯德尔和谐系数进行估计。行估计。第29页,本讲稿共87页第30页,本讲稿共87页第
12、31页,本讲稿共87页第32页,本讲稿共87页第33页,本讲稿共87页三、信度的作用三、信度的作用(一)评价测验(一)评价测验信度是测量过程中所存在的随机误差大小的反映。信度低,测信度是测量过程中所存在的随机误差大小的反映。信度低,测量随机误差大,测量结果就会与真分数发生较大偏离。量随机误差大,测量结果就会与真分数发生较大偏离。信度是衡量一个测验好坏的重要指标之一,测验的信度达到多少信度是衡量一个测验好坏的重要指标之一,测验的信度达到多少才可以接受呢?一般来讲,能力与成就测验的信度应该在才可以接受呢?一般来讲,能力与成就测验的信度应该在0.90以上,以上,人格测量信度系数应该在人格测量信度系数
13、应该在0.80 以上。以上。测量中的系统误差与信度无关。测量中的系统误差与信度无关。第34页,本讲稿共87页(二)解释分数(二)解释分数1.解释个人测验分数的意义解释个人测验分数的意义从理论上讲,一个人的真分数本来是用同一测验对他反复施从理论上讲,一个人的真分数本来是用同一测验对他反复施测所得的平均值,其误差则是这些实测值的标准差。但实际测所得的平均值,其误差则是这些实测值的标准差。但实际上,这是做不到的。实际的做法是用一个团体(人数足够多)上,这是做不到的。实际的做法是用一个团体(人数足够多)两次施测得结果来代替对同一个人的反复施测,以估计测量两次施测得结果来代替对同一个人的反复施测,以估计
14、测量误差的变异数。误差的变异数。第35页,本讲稿共87页此时每个人两次测量的分数之差构成一个新的分布,此时每个人两次测量的分数之差构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标,有了这一指标,就可以对团中误差大小的客观指标,有了这一指标,就可以对团体中任何一个人的测验成绩做出恰当的解释。体中任何一个人的测验成绩做出恰当的解释。第36页,本讲稿共87页第37页,本讲稿共87页2不同测验分数的比较不同测验分数的比较第38页,本讲稿共87页四、影响测量信度的主要因素四、影响测量信度的主要因素测量信度是测量过程中随机误
15、差大小的反映,随机测量信度是测量过程中随机误差大小的反映,随机误差大,信度就低,随机误差小,信度就高。因此,误差大,信度就低,随机误差小,信度就高。因此,在测量过程中凡是能引起测量随机误差的因素都会在测量过程中凡是能引起测量随机误差的因素都会影响测量信度。影响信度的几种主要因素为:影响测量信度。影响信度的几种主要因素为:第39页,本讲稿共87页(一)被试方面(一)被试方面就单个被试而言,其身心健康状况、应试动机、注意水平、就单个被试而言,其身心健康状况、应试动机、注意水平、作答态度等会影响测量信度。作答态度等会影响测量信度。第40页,本讲稿共87页就团体而言,团体的异质程度与分数的分布密切相就
16、团体而言,团体的异质程度与分数的分布密切相关,一个团体越是异质,其分数分布范围越大,计关,一个团体越是异质,其分数分布范围越大,计算出来的信度系数值越高,这样会高估真正的信度算出来的信度系数值越高,这样会高估真正的信度值。当团体内部水平相差不大(同质)时,其得分值。当团体内部水平相差不大(同质)时,其得分分布必然会狭窄,以相关为基础计算出来的信度值分布必然会狭窄,以相关为基础计算出来的信度值必然小,可能会低估真正的信度值。此外若团体的必然小,可能会低估真正的信度值。此外若团体的平均数太高或太低,同样使测验的总分分布变窄,平均数太高或太低,同样使测验的总分分布变窄,低估测验的真正信度。低估测验的
17、真正信度。第41页,本讲稿共87页(二)主试者方面(二)主试者方面就主试者而言,若不按指导手册中的规定施测,或故意就主试者而言,若不按指导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,测量信制造紧张气氛,或给考生一定的暗示、协助等,测量信度会大大降低。度会大大降低。就阅卷评分者而言,若评分标准掌握不一,或前后标准不统就阅卷评分者而言,若评分标准掌握不一,或前后标准不统一,甚至随心所欲,则也会降低测量信度。一,甚至随心所欲,则也会降低测量信度。第42页,本讲稿共87页n(三)施测情境方面(三)施测情境方面n实施测验时,环境是否安静,光线和通风状况是否良好,所实施测验时,环境是
18、否安静,光线和通风状况是否良好,所需设备是否齐全,桌面是否合乎要求等都可能影响到测量需设备是否齐全,桌面是否合乎要求等都可能影响到测量信度。信度。第43页,本讲稿共87页(四)测量工具方面(四)测量工具方面测量的取样、测验的长度、难度等是影响测量信度的主要因素或测量的取样、测验的长度、难度等是影响测量信度的主要因素或关键因素。关键因素。一般来说,测验越长,信度值越高。这是因为:一般来说,测验越长,信度值越高。这是因为:测验加长,能够改进项目取样的代表性,从而能够更好地反映受测者测验加长,能够改进项目取样的代表性,从而能够更好地反映受测者的真实水平。测验的项目越多,每个项目上得随机误差会相互抵消
19、。的真实水平。测验的项目越多,每个项目上得随机误差会相互抵消。测验太难或太容易,都会降低测验的信度。测验太难或太容易,都会降低测验的信度。第44页,本讲稿共87页第45页,本讲稿共87页(五)两次施测之间的时间间隔(五)两次施测之间的时间间隔计算重测信度、稳定性与等值性系数时,两次测计算重测信度、稳定性与等值性系数时,两次测验相隔时间越短,其信度值可能会越大;两次测验相隔时间越短,其信度值可能会越大;两次测验相隔时间越长,其信度值可能会越小。验相隔时间越长,其信度值可能会越小。第46页,本讲稿共87页五、提高测量信度的常用方法五、提高测量信度的常用方法(一)适当增加测验的长度(一)适当增加测验
20、的长度增加新项目必须与原试卷中的所有项目同质,新增项目必须适度。增加新项目必须与原试卷中的所有项目同质,新增项目必须适度。(二)使测验中题目的难度接近正态分布,并控制在中等难度(二)使测验中题目的难度接近正态分布,并控制在中等难度(三)努力提高测验试题的区分度(三)努力提高测验试题的区分度(四)选取适当的被试团体(四)选取适当的被试团体(五)主试者严格按照要求去做(五)主试者严格按照要求去做第47页,本讲稿共87页第二节第二节 测量效度测量效度n一、什么是效度(一、什么是效度(validityvalidity)n(一)效度的概念(一)效度的概念n效度是指一个测验或量表实际能测出其所要测的心理特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 测量 信度 优秀 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内