第四章-心理测验的信度与效度课件.ppt
《第四章-心理测验的信度与效度课件.ppt》由会员分享,可在线阅读,更多相关《第四章-心理测验的信度与效度课件.ppt(114页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 心理测验的信度与效度任滨海任滨海提纲v信度信度信度概述信度概述信度的类型信度的类型影响信度的因素影响信度的因素v效度效度效度概述效度概述效度的类型效度的类型影响效度的因素影响效度的因素2SV2SI2SE2SX2ST23第一节 信 度一、信度定义一、信度定义v 1、通俗的定义、通俗的定义信度,即测量的可靠性,多次测量结果保持一致性的程信度,即测量的可靠性,多次测量结果保持一致性的程度。度。4v2、测量学定义:、测量学定义:信度为一组测量分数的真分数方差和总方差(实得分数信度为一组测量分数的真分数方差和总方差(实得分数的方差)的比率。的方差)的比率。l信度乃是一个被信度乃是一个被试试群体的
2、真分数与群体的真分数与实实得分数的相关系数的得分数的相关系数的平方。平方。l信度乃是一个信度乃是一个测验测验X与它的任意一个平行与它的任意一个平行测验测验Y的相关系的相关系数。数。信度只受随机误差影响,系统误差不影响信度信度只受随机误差影响,系统误差不影响信度5二、信度的指标二、信度的指标 信度以信度以信度系数信度系数为指标,常用相关系数表示,表示实得为指标,常用相关系数表示,表示实得分数的变异数中有多少比例是由真分数的变异决定的,分数的变异数中有多少比例是由真分数的变异决定的,v信度系数信度系数以相关系数为指标,以相关系数为指标,r rxxxx=r=rxTxT2 2=S=ST T2 2/S/
3、SX X2 2v信度的平方根就是信度的平方根就是信度指数信度指数,r rxTxT=S=ST T/S/SX X6信度指数(rxT)与信度系数(rXX)实得分数 x2真实分数 T2rxx 信度系数(百分比)rOT2信度指数(实得分数与真实分数的相关)rxx=rxT27v信度定理:信度定理:定理定理 1:如果满足独立性条件:如果满足独立性条件(即误差分数与真分数无关即误差分数与真分数无关)时,真分数方差与观察分数方差之时,真分数方差与观察分数方差之 比比(信度系数信度系数)等于真等于真分数与观察分数之间的相关系数的平方。分数与观察分数之间的相关系数的平方。定理定理 2:如果满足平行测验条件:如果满足
4、平行测验条件 时,真分数方差与观察时,真分数方差与观察分数方差之比分数方差之比(信度系数信度系数)等于两个平行测验的观察分数等于两个平行测验的观察分数之之 间的相关系数间的相关系数。补充补充:信度系数、信度指数、测定系数的讨论:信度系数、信度指数、测定系数的讨论Baidu 测定系数测定系数 信度系数信度系数 搜索搜索。8三、信度的评估方式三、信度的评估方式v(一)重测信度(一)重测信度v(二)复本信度(二)复本信度v(三)内在一致性信度(三)内在一致性信度v(四)评分者信度(四)评分者信度9(一)重测信度(一)重测信度1、定义:用同一个测验对同一组被试在不同时间施测两次所得结、定义:用同一个测
5、验对同一组被试在不同时间施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。又称稳定性信度、再测信度、施测皮尔逊积差相关系数。又称稳定性信度、再测信度、施测再施测再施测信度、跨时间一致性。信度、跨时间一致性。10施测施测施测施测 时间间隔时间间隔时间间隔时间间隔 再施测再施测再施测再施测 相关系数相关系数相关系数相关系数图图1 1 重测信度图式重测信度图式1110名学生幸福感调查的两次施测分数名学生幸福感调查的两次施测分数重测信度的重测信度的计算举例计算举例ABCDEFGHIJ1615131311
6、10109871516141210911867X1X22、注意事项:、注意事项:v所测量的心理特性必须是稳定的。所测量的心理特性必须是稳定的。v遗忘和练习的效果基本上是相互抵消的。遗忘和练习的效果基本上是相互抵消的。v在两次施测的间隔时期内,被试在所要测验的心理特在两次施测的间隔时期内,被试在所要测验的心理特质方面没有获得的更多的学习和训练。质方面没有获得的更多的学习和训练。v易受练习和记忆的影响,两次测试的时间间隔要适当,易受练习和记忆的影响,两次测试的时间间隔要适当,一般是一般是24周较宜,间隔时间最好不超过周较宜,间隔时间最好不超过6个月。个月。13(二)复本信度(二)复本信度1、定义:
7、又称等值性系数,是以两个等值但题目不同的、定义:又称等值性系数,是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。测验上得分的相关系数。2、方法:为排除施测顺序的影响,在实施时,可将被试、方法:为排除施测顺序的影响,在实施时,可将被试先分为两组,一组人先作先分为两组,一组人先作A型测验,再作型测验,再作B型测验;另一型测验;另一组人则反之。组人则反之。14施测型施测型施测型施测型 最短时距最短时距最短时距最短时距 施测型施测型施测型施测型 相关系数相关系数相关系数相关系数图图2 2 复本信度图式复本信度
8、图式1510名学生创造力的复本测验结果名学生创造力的复本测验结果复本信度的复本信度的计算举例计算举例ABCDEFGHIJX1X2201918181716141212102020191616171211139v3、注意事项、注意事项要构造真正的平行测验要构造真正的平行测验 v 复本测验必须在题目的内容、数量、形式、难度、复本测验必须在题目的内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式、测验区分度、指导语、时限以及所用的例题、公式、测验其它方面都相同或相似。其它方面都相同或相似。被试有条件接受两个测验。被试有条件接受两个测验。17(三)内部一致性信度(三)内部一致性信度v1 1
9、、定义:、定义:反映的是题目之间的关系,表示测验能够测量相同内容反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。或特质的程度。v2 2、方法:、方法:(1)(1)分半信度分半信度:v通常是先把一份测验按题目的奇偶顺序或其它方法分通常是先把一份测验按题目的奇偶顺序或其它方法分成两个尽可能平行的半份测验,然后计算两半之间的成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。相关,即得到分半信度系数。18v两半变异数相等:两半变异数相等:积差相关积差相关斯皮尔曼布朗公式校正斯皮尔曼布朗公式校正 19l变异数不相等:l弗朗那根(Flanagan)公式:l卢伦(Rulo
10、n)公式:20(2)(2)同质性信度同质性信度:v测验内部所有题目间的一致性。测验内部所有题目间的一致性。用每个题目和其它题目平均数用每个题目和其它题目平均数的相关。的相关。当各测题得分有较高的正相关时,即为同质;相反,当各测题得分有较高的正相关时,即为同质;相反,测题间相关很低或为负相关则为异质。测题间相关很低或为负相关则为异质。v0 0、1 1计分项目(库德计分项目(库德(KuderKuder)-)-理查逊理查逊(Richardson)(Richardson)方法)方法)v非非0 0、1 1计分项目(计分项目(系数或克伦巴赫系数或克伦巴赫(CronbachCronbach)公式公式 )21
11、注意事项注意事项v 在一个测量多种特质的问卷中,不同的因子的同在一个测量多种特质的问卷中,不同的因子的同质性信度应该分开计算。质性信度应该分开计算。v克伦巴赫克伦巴赫系数相当于计算了所有项目间的一致性系数相当于计算了所有项目间的一致性程度,避免了分半信度由于分半方式不同所造成的程度,避免了分半信度由于分半方式不同所造成的分半系数不一致的问题。分半系数不一致的问题。22(四)评分者信度(四)评分者信度v1、定义:用于测量不同评分者之间所产生的误差。、定义:用于测量不同评分者之间所产生的误差。是由多个评分者给一组测验结果评分,所得各个分是由多个评分者给一组测验结果评分,所得各个分数之间的一致性。数
12、之间的一致性。l对于客观性试题,评分所引起的误差或忽略不计对于客观性试题,评分所引起的误差或忽略不计l对于主观性题目来说,不同评分人员对相同被试的评分存在差异。对于主观性题目来说,不同评分人员对相同被试的评分存在差异。如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的如心理测量中的投射测验,学业测验中的高考作文,职业选拔中的面试等。面试等。l一般要求在成对的受过训练的评分者之间平均一致性达一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才以上,才认为评分是客观的。认为评分是客观的。23v2、计算、计算当评分者为当评分者为2人时,可以积差相关或等级相关人时,可以积差相关或等
13、级相关当评分者多于当评分者多于2人时,可以使用肯德尔和谐系数人时,可以使用肯德尔和谐系数24如有如有A A、B B、C C三位专家给三位专家给6 6位应聘者的面试评分,结果位应聘者的面试评分,结果如下,试求评分者信度。如下,试求评分者信度。ABC175664529072603816354460604258475636969066ABCRi15451422237345413466618533286111325=14+7+13+18+8+3=63 =142+72+132+182+82+32=811 由题意知由题意知K=3,N=6,将上述值代入公式有将上述值代入公式有:W=0.95如在评定中有相同的
14、等级时,用下式校正。其中如在评定中有相同的等级时,用下式校正。其中n为为相同等级的个数相同等级的个数26四、信度对测验分数的意义四、信度对测验分数的意义v1 1、解释真实分数与实得分数的相关、解释真实分数与实得分数的相关 信度系数可以解释为测验的总变异中,真分数造成的变信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。如,当异占百分之几。如,当rxxrxx=0.90=0.90时,我们可以说实得分时,我们可以说实得分数中有数中有90%90%的变异是真分数造成的,仅的变异是真分数造成的,仅10%10%来自测验的误来自测验的误差。差。rxxrxx=1.00=1.00,则表示完全没有测量误
15、差,所有的变异,则表示完全没有测量误差,所有的变异均来自真实分数;同样,信度系数也告诉测量的误差比均来自真实分数;同样,信度系数也告诉测量的误差比例是多少。例是多少。27v2 2、确定信度可以接受的水平、确定信度可以接受的水平 一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情况是况是rxxrxx=1.00=1.00,但实际上是办不到的。根据多年的研究结果,一般,但实际上是办不到的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在的能力测验和成就测验的信度系数都在0.900.90以上,有的可以达以上,有的可以达0.95
16、0.95;而人格测验、兴趣、态度、价值观等测验的信度一般在;而人格测验、兴趣、态度、价值观等测验的信度一般在0.800.850.800.85或更高些。一般原则是:当或更高些。一般原则是:当rxxrxx0.700.70时,测验不能用于对个人做出时,测验不能用于对个人做出评价或预测,而且不能作团体比较;当评价或预测,而且不能作团体比较;当0.70rxx0.850.70rxx0.85时,可用于时,可用于团体比较;当团体比较;当rxx0.85rxx0.85时,才能用来鉴别或预测个人成绩或作为。时,才能用来鉴别或预测个人成绩或作为。28v3 3、解释个人分数的意义(区间估计)、解释个人分数的意义(区间估
17、计)从信度可以解释个人分数的意义,这就是测量标准误的从信度可以解释个人分数的意义,这就是测量标准误的应用。它有两个作用应用。它有两个作用v其一是估计真实分数的范围;其一是估计真实分数的范围;v其二是了解实得分数再测时可能的变化情形。其二是了解实得分数再测时可能的变化情形。29v由于误差的存在,一个人通过测量得到的分数很难由于误差的存在,一个人通过测量得到的分数很难等于真分数。理论上,我们可以对一个人施测无数等于真分数。理论上,我们可以对一个人施测无数次,然后求得所得分数的平均数和标准差。在这个次,然后求得所得分数的平均数和标准差。在这个假设的分布里,平均数就是这个人的真分数,标准假设的分布里,
18、平均数就是这个人的真分数,标准差则为误差大小的指标。差则为误差大小的指标。3031v在在实实际际工工作作中中,我我们们用用一一组组被被试试(人人数数足足够够多多)两两次次施施测测的的结结果果来来代代替替对对同同一一个个人人反反复复施施测测,以以估估计计测测量量误误差差的的变变异异数数。此此时时,个个人人在在两两次次测测验验中中的的分分数数差差异异就就是是测测量量误误差差。据据此此可可制制成成误误差差分分数数的的分分布布。这这个个分分布布的的标标准准差差(误差分布的标准差)我我们们称称之之为为测量的标准误,是是表表示示测测量量误误差差的的大大小小的的指指标标,其计算公式为:其计算公式为:v (公
19、式(公式5 54 4)v式式中中SESE表表示示测测量量的的标标准准误误,即即误误差差分分布布的的标标准准差差;S Sx x表示一次测量分数的标准差;表示一次测量分数的标准差;r rxxxx表示信度系数。表示信度系数。32v我们可以用测量的标准误来估计个人测验的真分数我们可以用测量的标准误来估计个人测验的真分数的大小。的大小。v如果选用如果选用9595的可靠性水平(置信水平),即显著的可靠性水平(置信水平),即显著性水平(性水平(a a值)为值)为.05.05,真分数有,真分数有9595的可能落入的可能落入X 1.96SE X 1.96SE,即,即X 1.96 SEX 1.96 SE的范围之内
20、,也可以的范围之内,也可以写成写成X X1.96SE 1.96SE T T X X1.96 SE1.96 SE,SESE则用公式则用公式5 54 4代入。或有代入。或有5 5的可能落入这范围之外。这实际的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。上也表明了再测时分数改变的可能范围。33v例例1 1,已知,已知WISC-RWISC-R的标准差为的标准差为1515,信度系数为,信度系数为0.950.95,对一名,对一名1212岁的儿童实施该测验后,岁的儿童实施该测验后,IQIQ为为110110,那么他的真分数在,那么他的真分数在9595的可靠度要求下,的可靠度要求下,变动范围应
21、是多大?变动范围应是多大?34=103.4 116.635v注意几点:注意几点:v(1 1)SESE对对真真分分数数做做的的是是区区间间估估计计,不不可可能能由由此此得得到到一一个个确确切切的的点点。这这就就是是说说,测测验验分分数数不不是是一一个个定定点点,而而是是具具有有一一定定的的分分布布范范围围。因因此此,两次测验分数之间存在差异是很正常的。两次测验分数之间存在差异是很正常的。v(2 2)置置信信水水平平确确定定后后,估估计计的的精精度度主主要要取取决决于于SESE,SESE越越小小,范范围围越越小小,估估计计就就越越精精确确,反反之也然。之也然。v(3 3)真分数不能等同于真正能力或
22、心理特质,)真分数不能等同于真正能力或心理特质,真分数中包括了系统误差。真分数中包括了系统误差。36v4 4、比较不同测验分数的差异、比较不同测验分数的差异测量标准误和测验信度在评价两个不同测验的分数是测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。分数的差别和同一被试在两个测验上的差别。37v我们可以用我们可以用“差异的标准误差异的标准误”来检验差异的显著性。来检验差异的显著性。v差异的标准误的公式为:差异的标准误的公式为:v (公式(公式55)v 为为差差异
23、异的的标标准准误误,S为为相相同同尺尺度度的的标标准准分分数数的的标标准准差差,Z分分数数为为1,T分分数数为为10。、分分别别为为两两个个测测验验的的信信度度系系数。数。v先先将将原原始始分分数数化化成成标标准准分分数数,然然后后将将两两个个标标准准分分数数的的差差异异与与1.96SEd(0.05显显著著性性水水平平)进进行行比比较较,如如果果其其绝绝对对值值大于此值,则差异显著,否则差异不显著。大于此值,则差异显著,否则差异不显著。38例题例题v某被试在韦氏成人智力测验中言语智商为102,操作智商为110。假设言语测验和操作测验的信度分别为0.87和0.88,则该被试的操作智商与言语智商有
24、显著性差异吗?v解答一:标准分数差异的范围(标准分数差异的范围(95%95%):):-1.967.5-1.967.51.967.51.967.5-14.7-14.714.714.7所以被试的操作智商与言语智商无显著性差异所以被试的操作智商与言语智商无显著性差异39解答二40v例,某校五年级进行了两次数学测验,小张第一例,某校五年级进行了两次数学测验,小张第一次考了次考了8585分,此次数学测验年级平均分是分,此次数学测验年级平均分是7777分,分,标准差是标准差是8 8分,此次测验的信度系数是分,此次测验的信度系数是0.840.84;第;第二次考了二次考了9595分,此次数学测验年级平均分是分
25、,此次数学测验年级平均分是8181分,分,标准差是标准差是1010分,此次测验的信度系数是分,此次测验的信度系数是0.910.91;问;问小张这两次数学测验的成绩是否有显著差异?小张这两次数学测验的成绩是否有显著差异?v 41五、影响信度的因素五、影响信度的因素v样本的影响样本的影响样本团体的异质性高,信度就高样本团体的异质性高,信度就高样本团体平均能力水平的影响样本团体平均能力水平的影响v测验长度的影响测验长度的影响可以通过增加测验长度的方式提高信度值。可以通过增加测验长度的方式提高信度值。v新增项目必须与试卷中的原有项目同质。新增项目必须与试卷中的原有项目同质。v新增项目的数量必须适度。新
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 心理 测验 信度 课件
限制150内