《心理测验的信度.ppt》由会员分享,可在线阅读,更多相关《心理测验的信度.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于心理测验的信度现在学习的是第1页,共43页第二章第二章 心理测量的信度心理测量的信度信度与误差信度与误差1信度的种类与估方法信度的种类与估方法 2信度的影响因素信度的影响因素 3心理测量发展简史心理测量发展简史 4现在学习的是第2页,共43页你如何解释下述现象?一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值现在学习的是第3页,共43页量表帮助我们了解教育、心理现象就像尺子帮助我们测量身高。思考:我们如何知道我们有多高?有两个工具:尺子/秤 现在学习的是第4页,共43页尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一
2、致。因此,尺子是测量身高的有效工具效度。什么材料的尺子?什么材料的尺子?钢铁(热胀冷缩)钢铁(热胀冷缩)涉及到一致性的问题。涉及到一致性的问题。信度信度现在学习的是第5页,共43页第二章第二章 心理测量的信度心理测量的信度第一节第一节 信度与误差信度与误差1现在学习的是第6页,共43页一、误一、误 差差n随机误差(随机误差(Random ErrorRandom Error)u在不同情境下测量结果是不稳定的,与测量情境和测量条件有关在不同情境下测量结果是不稳定的,与测量情境和测量条件有关u由于这一误差是由测量过程造成的,因此也称测量误差(由于这一误差是由测量过程造成的,因此也称测量误差(Meas
3、urement Measurement EroorEroor)n系统误差(系统误差(System ErrorSystem Error)。)。u由于测量本身所造成,测量结果向一个方向偏离,其数值按一由于测量本身所造成,测量结果向一个方向偏离,其数值按一定规律变化。定规律变化。u以相同的方式影响测量值以相同的方式影响测量值n随机误差随机误差-信度,如何控制和减少随机误差信度,如何控制和减少随机误差n系统误差系统误差-效度,如何提高测量工具本身的准确性效度,如何提高测量工具本身的准确性现在学习的是第7页,共43页二、信度的定义(一)信度的概念(一)信度的概念n可信性可信性 稳定性稳定性 一致性一致性
4、n 测量结果的可信程度测量结果的可信程度 n 测验结果的一致性和稳定性程度测验结果的一致性和稳定性程度 u受随机误差的影响,随机误差越大,信度越低 n 同一测试同一测试-同一测试对象同一测试对象-多次施测多次施测结果不稳结果不稳定定-缺乏信度。缺乏信度。n 测验本身测验本身-抗干扰能力强抗干扰能力强-误差控制的好误差控制的好-多次施多次施测分数的一致性高测分数的一致性高-信度高,信度高,现在学习的是第8页,共43页(二)信度的统计学定义n真分数Tu真实分数,在测量学上叫真分数(True Score)u理论定义:所谓真分数就是一个测量工具在测量没有误差时,所得到的真值(纯正值)。u操作定义:真分
5、数是,经过无数次测量所得的平均值。即一个被试在许多(理论上无限多)平行测验上得分的平均值。现在学习的是第9页,共43页(二)信度的统计学定义n真分数与观测分数的关系真分数与观测分数的关系u实的分数与真分数关系:实的分数与真分数关系:X=T+EX=T+EnX X2 2=T T2 2+E E2 2(方差可加性)(方差可加性)n如果误差为如果误差为0 0,则,则T=X-T=X-X X2 2=T T2 2测验误差期望为测验误差期望为0(或误差的平均数为(或误差的平均数为0)误差大小、正负方向是随机的,因此其平均数为误差大小、正负方向是随机的,因此其平均数为0误差与真分数之间是相互独立的误差与真分数之间
6、是相互独立的即误差的出现、大小方向都与真分数无关即误差的出现、大小方向都与真分数无关因此得出:因此得出:T=X 即一组被试真分数的平均数与实的分数的平均数相等。即一组被试真分数的平均数与实的分数的平均数相等。X:实的分数:实的分数 观测分数观测分数T:真分数:真分数E:测验误差:测验误差现在学习的是第10页,共43页(二)信度的统计定义(二)信度的统计定义信度的统计定义信度的统计定义1定义定义1:信度是被试团体真分数方差与实得分数方差之比:信度是被试团体真分数方差与实得分数方差之比u真分数的变异在实得分数变异中所占的比重真分数的变异在实得分数变异中所占的比重 u实得分数的变异在多大程度上是由真
7、分数的变异引起的实得分数的变异在多大程度上是由真分数的变异引起的。u当实得分数的变异可以由全部真分数的变异解释时,测验当实得分数的变异可以由全部真分数的变异解释时,测验误差就是误差就是0 0,这时测验的信度为,这时测验的信度为1 1 (rxx=1)现在学习的是第11页,共43页信度的统计定义二n信度乃是一个被测团体真分数与实得分数的相关系数的平方。nrXX=2TXn思考:相关系数的平方?(二)信度的统计定义(二)信度的统计定义现在学习的是第12页,共43页信度的统计定义三n信度乃是一个测验信度乃是一个测验X X与它的任意一个平行测验与它的任意一个平行测验X X的相关的相关系数。系数。nr rX
8、XXX=X XX X (操作定义)操作定义)n于是,可根据测试结果分数的形式,是连续变量还是二分变量等,可采用不同的相关系数计算公式。(二)信度的统计定义(二)信度的统计定义现在学习的是第13页,共43页三、信度的作用u评价测验评价测验n信度越高,说明测验所得分数越接近被试的真分数,分数就信度越高,说明测验所得分数越接近被试的真分数,分数就可靠可靠 。n信度要求信度要求:u解释分数解释分数n对被试的真分数进行估计,信度越高,实得分数越能代表对被试的真分数进行估计,信度越高,实得分数越能代表他的真分数,信度为他的真分数,信度为1 1时,实得分数就是真分数时,实得分数就是真分数.n能力测验:0.9
9、0n人格/兴趣测验:0.80-0.85n r0.85时,可对个人进行诊断、鉴别、解 也可以进行团体比较nr=0.70-0.85,只能进行团体比较nr0.70时,不能评价个人,也不能进行团体比较 现在学习的是第14页,共43页第二章第二章 心理测量的信度心理测量的信度第二节第二节 信度的种类与估方法信度的种类与估方法 2现在学习的是第15页,共43页信度的种类u重测信度u复本信度u同质性信度n分半信度n克龙巴赫(cronbach)系数n库德-理查森信度u评分者信度现在学习的是第16页,共43页一、重测信度nTest-Retest Reliabilityn定义:同一量表,同一被试群体,在不同时间,
10、两次施测,求其相关。n实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability)n形式:施测 再施测 间隔适当时间现在学习的是第17页,共43页重测信度时间间隔的把握n间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。n年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。n一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)现在学习的是第18页,共43页重测信度的计算方法u求取同一组被试在两个不同时间施测同一个测量工具所得的
11、结果分数的相关系数,一般使用积差相关法积差相关法(r r)u计算重测信度的原理是对平行测验的假定,假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。但因为重测时被试的心理特质会发生变化,导致真分数变异,练习和疲劳效应也会也会使得重测的结果出现差异。u在测验手册上报告的重测信度,一般要注明被试样本的性质、大小,及是间隔多长时间所测的信度系数,以便使用者了解样本及时间因素对测验稳定性的影响。现在学习的是第19页,共43页计算重测信度时应注意的问题n所欲测量的心理特质是否稳定u所测的如果是人格、智力、兴趣等心理特质,则可以使用重测法,而知识、情绪等不稳定的心理特质使用重测法必须慎重。n重测
12、结果要尽量减少练习或遗忘因素的影响u智力测验的时间间隔不能太短,成就测验则不能间隔太长,既不能让被试记住上次测验的内容,又不能使其特质发生变化,或对所学知识产生遗忘。u如果使用年龄小的被试时,测验间隔要小些,年龄大的被试可以长些。对儿童的智力测验一般是两周到四周为宜。对成年人,间隔可到半年,很少超过6个月。现在学习的是第20页,共43页重测信度适用条件n重测信度适用于异质性测验。u所谓异质性测验就是说一个测验包括几个不同的部分,这几个部分分别测量着几个不同的心理特质,它们之间可能并不存在相关,或相关较低。n重测信度适用于速度测验而不适用于难度测验。u速度测验的测题数量多,而且有一定的时间限制,
13、被试很难记住第一次施测的内容,所以第二次施测较少受记忆的影响,而难度测验则相反。u重测信度还适用于运动技能的测验,如跑、跳、掷等,其测验成绩较少受重复测量的影响。现在学习的是第21页,共43页二、复本信度n复本测验/平行测验u指在试题格式、题数、难度、指导语说明、施测要求等方面都相指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验测验。(AB卷)现在学习的是第22页,共43页复本测验等值要符合下列条件:n各份测验测量的是同一种心理特性。n 各份测验具有相同的内容和形式。n
14、各份测验的题目不应重复。n 各份测验题目数量相等,难度和区分度大体相同。n 各份测验的分数分布(平均数和标准差)大致相等。n复本编好后,应再测一次,以确保各份测验的等值。现在学习的是第23页,共43页n复本信度(Alternate-form raliability)u指两个平行测验测量同一批被试所得结果的一致性指两个平行测验测量同一批被试所得结果的一致性程度程度u数值上是两个复本施测于同一被试样本所得测验分数值上是两个复本施测于同一被试样本所得测验分数的相关系数数的相关系数.u施测方式施测方式n同一个时间连续施测同一个时间连续施测-等值性系数 n间隔一段时间后施测间隔一段时间后施测-等值稳定性
15、系数 现在学习的是第24页,共43页复本测验的形式1n等值性系数:同时连续施测,反映内容变异。u形式:复本A最短时间复本Bu被试易出现疲劳、失去积极性、会出现迁移(顺序效应)n可随机分配一半被试先做复本A后做复本B,另一半先做B再做A,以平衡顺序效应。现在学习的是第25页,共43页复本测验的形式2n等值稳定性系数:u时间间隔施测,内容变异重测信度误差u同时兼顾试题抽样与时间影响u形式:复本A适当时间复本B n时间间隔,减少了练习效应和疲劳效应n 时间间隔适当,可用于计算稳定性不高的心理特质的测验信度,克服了等值性系数的局限 现在学习的是第26页,共43页复本信度优缺点n优点:复本信度优于重测信
16、度u避免了重测带来的记忆效应和练习效应;u可用于长期追踪研究前后测量;u减少了作弊的可能性。n缺点:u有些测验的复本很难找到;u有些测验因正迁移效应使测验性质改变;u如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。现在学习的是第27页,共43页复本信度使用条件n各份测验测量的是同一种心理特性。n各份测验具有相同的内容和形式。n各份测验的题目不应重复。n各份测验题目数量相等,难度和区分度大体相同。n各份测验的分数分布(平均数和标准差)大致相等。n复本编好后,应再测一次,以确保各份测验的等值。现在学习的是第28页,共43页三、同质性信度n也叫内部一致性信度,指测验内部所有题目间的一
17、致性程度,是一个测验所测内容或特质的相同程度 u所有题目测的是同一种心理特质 u所有题目得分之间都具有较高的正相关 u假设 n同质性信度高,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映 u估计方法 n分半信度 n克龙巴赫(cronbach)系数 n库德-理查森系数现在学习的是第29页,共43页*分半信度(Split-Half Reliability)n定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。n计算分半信度先要对测验分半。不同的分半法可能会得到不同
18、的信度值。现在学习的是第30页,共43页n分半方法:u为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。n由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。n斯皮尔曼-布朗公式:rxx=2rhh/(1+rhh)rxx:-信度系数rhh-两个“半测验”的的相关系数现在学习的是第31页,共43页库德-理查森系数n当测验都是二计分题目时,可以用库德当测验都是二计分题目时,可以用库德-理查森系数理查森系数来估计同质性信度来估计同
19、质性信度n适用条件:只适合预测题目是二分法计分题目。适用条件:只适合预测题目是二分法计分题目。n公式:公式:nK K:测验:测验 题目的个数题目的个数nP Pi i:被试在项目:被试在项目i i上的正确做答比例上的正确做答比例nqi:qi:被试在项目被试在项目i i上错误作答的比例上错误作答的比例nS S2 2x x:测验的总方差:测验的总方差 现在学习的是第32页,共43页u当测验题型较多、并非都是二分记分题时,估计测验信度可采用克龙巴赫系数 u表征多个测验项目的内部一致性 u公式:nK:测验 题目的个数nSi2:被试在项目i上的得分的方差nSx2:测验总分的总方差*克龙巴赫(Alpha)系
20、数现在学习的是第33页,共43页四、评分者信度nScorer Reliabilityn指不同评分者之间在测验结果计分上的一致性。u随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。评分越一致,评分者信度越高。n适用条件u作文、创造力、投射、道德判断等测验现在学习的是第34页,共43页评分者信度的评估方法u计算积差相关或斯皮尔曼相关系数n两个评分者、或一个人两次评分u计算肯德尔和谐系数:n评分者在三人以上,而且采用等级记分。现在学习的是第35页,共43页五、信度系数误差来源五、信度系数误差来源n1、不同类型信度的误差来源现在学习的是第36页,共43页五、信度系
21、数误差来源五、信度系数误差来源n2 2、测试次数和测试卷分数与信度估计方法、测试次数和测试卷分数与信度估计方法现在学习的是第37页,共43页五、信度系数误差来源五、信度系数误差来源n3、各种心理评估工具的信度标准现在学习的是第38页,共43页实际上,有多少种误差来源,便有多少种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变异数分成不同的分支。现在学习的是第39页,共43页第二章第二章 心理测量的信度心理测量的信度第三节第三节 信度的影响因素信度的影响因素 3现在学习的是第40页,共43页一、影响测验信度的因素n被试方面:u测验动机、注意力、焦虑水平、测验经验、身心健康等n主试方面:u年龄、性别、态度,及计分、评分的客观性;n测验情境方面:u噪声光线、房间大小、环境的熟悉程度等n测量工具因素u测验长度、试题难易程度、指导语是否清晰、试题同质性。n两次施测时间间隔:u时间间隔越短,信度越高,时间越长,信度越低。现在学习的是第41页,共43页二、提高信度的方法n适当增加测验题目的数量。增加测验长度n测验的难度要适中。n测验的内容应尽是同质。n测验的时间要充分。n测验的程序应统一。n评分要客观化,减少评分误差。现在学习的是第42页,共43页感谢大家观看现在学习的是第43页,共43页
限制150内