信度与效度精选PPT.ppt
《信度与效度精选PPT.ppt》由会员分享,可在线阅读,更多相关《信度与效度精选PPT.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于信度与效度第1页,讲稿共81张,创作于星期日5.1测评信度及检验5.1 测评效度的概念1、信度概念:测评结果的前后一致性。又称可靠性程度。2、信度系数:用一样本在两种不同时间、不同情景条件下或两组不同评价材料的评定结果之间的相关系数(rxx)。信度系数越大,则说明该测量或评定方法的可靠性越强,反之,则可靠性弱。简单地说信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。第2页,讲稿共81张,创作于星期日我们可以举例说明信度的问题:如果想知道某人的体重,我们可以叫两个人来估计,一个人的估计为150镑,另一个人的估计为300镑,那么我们就可以认为,叫别人
2、来估计体重是非常不可信的方法。如果用磅秤,连续测量两次的结果都是相同的,因而我们可以说,在测量体重方面,用磅秤的方法要比叫人来估计更可信。我们可以用信度系数来表示信度的大小。第3页,讲稿共81张,创作于星期日 对信度系数要注意三点:对信度系数要注意三点:第一,在不同情况下,对不同样本,采用不同方第一,在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个法会得到不同的信度系数,因此一个测验可能不止一个信度系数;信度系数;第二,信度系数只是对测量分数不一致程度的估计,第二,信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因;并没有指出不一致的原因;第三,
3、获得较高的信度系数并不是心理测量追第三,获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是使测验有求的最终目的,它只是迈向目标的一步,是使测验有效的一个必要条件。效的一个必要条件。第4页,讲稿共81张,创作于星期日信度系数要达到多高才可以接受呢?信度系数要达到多高才可以接受呢?一般能力与学绩测验的信度系数在一般能力与学绩测验的信度系数在0.90 0.90 以上;人格以上;人格测验的信度系数通常在测验的信度系数通常在0.80 0.80 以上。以上。当当r rxxxx 0.700.70时,时,不能用测验对个人作评价,也不能在团体间作比较;不能用测验对个人作评价,也不能在团体间
4、作比较;当当 r rxxxx 0.70 0.70时,可用于团体间比较时,可用于团体间比较;当当r rxxxx 0.85 0.85 时,可用于鉴别个人。时,可用于鉴别个人。第5页,讲稿共81张,创作于星期日为何要进行信度的衡量?为何要进行信度的衡量?我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。X=T+B+ET表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E第6页,讲稿共81张,创作于星期日5.1.2测评信
5、度的分类测评信度的分类(一)重测信度又称稳定性信度,它用于分析两次间隔一定时间的评定或测定结果之间的相关关系。这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时间间隔太久,可能会发一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。第7页,讲稿共81张,创作于星期日5.1.2测评信度的分类测评信度的分类(二)折半信度(二)折半信度通常是在无副本且不准备重测的情况下,我们就用折半信度来计通常是在无副本且不准备重测的情况下,
6、我们就用折半信度来计算信度系数。算信度系数。举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现象。利用折半信度时,可将是个问题随机分成两组,每组有五个象。利用折半信度时,可将是个问题随机分成两组,每组有五个问题,然后根据每组的测量结果来计算两组的相关系数,就问题,然后根据每组的测量结果来计算两组的相关系数,就是折半信度是折半信度,Rhh。但整个问卷的信度需要用校正公式来得到:。但整个问卷的信度需要用校正公式来得到:Rxx=2Rhh/(1+Rhh)第8页,讲稿共81张,创作于星期日5.1.2测评信度的分类测评信度的分类(三)等值信度(
7、复本信度)等值信度是指以两个平行型的测评量表在最短时距内施行两次所的结果的相关系数来评估的。什么是平行型量表:内容、形式和长度相同,难度(即有相同的平均数)和差异程度(相同的标准差)也相同。A型量表B型量表最短时距相关系数为等值信度第9页,讲稿共81张,创作于星期日5.1.2测评信度的分类测评信度的分类等值信度的实施技巧:为了抵消测评先后顺序效应,一般要求有一半人先用A型量表进行测定,然后再用B型量表进行测定;另一半人则先用B型,再用A型。二者间隔时间要求保持在最短时距内。其范围为几分钟到几小时。第10页,讲稿共81张,创作于星期日5.1.35.1.3影响信度的因素影响信度的因素主体客体第11
8、页,讲稿共81张,创作于星期日 影响信度的主体的因素不严格按照规定实施测验、制造紧张气氛、给予特别协助、评分主观第12页,讲稿共81张,创作于星期日来自客体的影响因素:被试方面:身心健康状况、动机、注意力、持久性、求胜心、作答态度等均随时在变化中测验内容方面:试题取样不当、内部一致性较低、题数过少、题意模糊等施测环境方面:施测现场条件,如通风、温度、光线、噪音、桌面好坏、空间的阔窄等 第13页,讲稿共81张,创作于星期日另外几个重要的影响因素:一、分数分布范围二、测验长度三、测验的难度四、间隔时间第14页,讲稿共81张,创作于星期日 误差变异越大,信度越低。除前面谈到的几种误差来源外,误差变异
9、越大,信度越低。除前面谈到的几种误差来源外,还有以下几个因素会影响信度系数的大小:还有以下几个因素会影响信度系数的大小:一、被试样本(分数分布范围)一、被试样本(分数分布范围)(一)团体的异质性(一)团体的异质性 信度系数受分数的分布范围(全距)的影响,而分数范围信度系数受分数的分布范围(全距)的影响,而分数范围与被试团体的异质程度有关。一个团体越异质,其分数范围越与被试团体的异质程度有关。一个团体越异质,其分数范围越大,信度系数也就越高。相反,相对同质的团体分数则较为均大,信度系数也就越高。相反,相对同质的团体分数则较为均匀。如图所示匀。如图所示:第15页,讲稿共81张,创作于星期日 图中大
10、方框显示的是一个较大的异质团体在两次施图中大方框显示的是一个较大的异质团体在两次施测中的分数分布测中的分数分布,显然有很高的正相关显然有很高的正相关.在小方框中显示的在小方框中显示的是一个高度同质的亚团体是一个高度同质的亚团体,两次分数几乎呈随机变化两次分数几乎呈随机变化,相关相关接近于零接近于零.第16页,讲稿共81张,创作于星期日 (二)团体的平均水平(二)团体的平均水平 对于不同的团体,题目具有不同的难度。每个题目在难度上的对于不同的团体,题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响信度。微小差异积累起来便会影响信度。例如,同一量表对不同年龄,不同例如,同一量表对不同年
11、龄,不同IQ水平的被试,信度则水平的被试,信度则不尽相同。不尽相同。因此,我们在编制测验量表,抽选被试时,往往要考虑选取因此,我们在编制测验量表,抽选被试时,往往要考虑选取不同层次的被试,以使得测验团体呈异质性,从而使得信度提高。不同层次的被试,以使得测验团体呈异质性,从而使得信度提高。反之,当需要同质团体的信度时,就应该尽量选取同一层次的被反之,当需要同质团体的信度时,就应该尽量选取同一层次的被试。试。第17页,讲稿共81张,创作于星期日 二、题目的数量二、题目的数量 一般说来,在一个测验中增加同质的题目,可一般说来,在一个测验中增加同质的题目,可以使信度提高。即测验越长,信度越高。这是因以
12、使信度提高。即测验越长,信度越高。这是因为测验加长,加大了分数分布的范围,可能改进为测验加长,加大了分数分布的范围,可能改进项目取样的代表性,从而能更好地反映受测者的项目取样的代表性,从而能更好地反映受测者的真实水平。即测验的项目越多,在每个项目上的真实水平。即测验的项目越多,在每个项目上的随机误差就可以互相抵消。随机误差就可以互相抵消。第18页,讲稿共81张,创作于星期日 增加测验长度的效果可以用斯皮尔曼增加测验长度的效果可以用斯皮尔曼布朗公式来计布朗公式来计算:算:rxx=Krxx/1+(K-1)rxx 式式中中,K为为改改变变后后的的长长度度与与原原来来长长度度之之比比,rxx为为原原测
13、测验验的的信信度度,rxx为为测测验验长长度度是是原原来来的的K倍倍时时的的信信度度估估计计。一一般般来说,题目数量对相关系数的影响是递增的。如表所示来说,题目数量对相关系数的影响是递增的。如表所示题目数量相关系数10 50 100 200 300 400 5000.50 0.83 0.91 0.95 0.968 0.976 0.980第19页,讲稿共81张,创作于星期日 但是,增加测验长度的效果遵循报酬递减率,测验过长是但是,增加测验长度的效果遵循报酬递减率,测验过长是得不偿失的,可以通过上式确定一个测验究竟要增长多少才得不偿失的,可以通过上式确定一个测验究竟要增长多少才能达到理想的信度水平
14、。能达到理想的信度水平。注意:只有当新题目是与原题目选自同一总体,增长测验注意:只有当新题目是与原题目选自同一总体,增长测验才能改进信度。才能改进信度。第20页,讲稿共81张,创作于星期日随堂练习随堂练习 1.假设有一份由假设有一份由20题组成的测验,题组成的测验,rxx=0.50,若测验增加同质性题目,若测验增加同质性题目80道,道,则增长后的测验信度则增长后的测验信度rxx是多少?是多少?按照公式:按照公式:rxx=Krxx/1+(K-1)rxx=0.8 第21页,讲稿共81张,创作于星期日 随堂练习随堂练习2.假设有一个包括假设有一个包括 10个题目的测验,信度为个题目的测验,信度为0.
15、60,若把测验增加到若把测验增加到80个题目,其信度将增加到多少个题目,其信度将增加到多少?3.一个包含一个包含40个题目的测验信度为个题目的测验信度为0.8,欲将信度提高,欲将信度提高到到0.90,需要增加多少题目?,需要增加多少题目?第22页,讲稿共81张,创作于星期日5.1.4信度检验:计算不同的信度系数 第23页,讲稿共81张,创作于星期日一、重测信度(稳定性系数)一、重测信度(稳定性系数)(一)定义与计算(一)定义与计算定义定义 用同一种测验,对同一组受试者,前后施测用同一种测验,对同一组受试者,前后施测两次,再根据受试者两次测验分数计算其相关系两次,再根据受试者两次测验分数计算其相
16、关系数,即得重测信度。数,即得重测信度。即测验即测验时距(几分几年)时距(几分几年)再测验再测验 此种信度能表示两次测验结果有无变动,反映测此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数。验分数的稳定程度,故又称稳定性系数。第24页,讲稿共81张,创作于星期日 计算方法计算方法 计算使用皮尔逊积差相关公式的变式:计算使用皮尔逊积差相关公式的变式:第25页,讲稿共81张,创作于星期日(二)误差来源(二)误差来源 1.测验本身:测验所测的特性本身就不稳定,例如测验本身:测验所测的特性本身就不稳定,例如情绪。情绪。2.被试方面:成熟、知识的发展并非人人都等被试方面:成熟
17、、知识的发展并非人人都等量增长,且练习因素、记忆效果也存在个体差异。量增长,且练习因素、记忆效果也存在个体差异。3.施测情境:偶发因素的干扰,如计时错误,情绪波施测情境:偶发因素的干扰,如计时错误,情绪波动,健康状况,动机变化等。动,健康状况,动机变化等。重测信度高,说明分数受被试状况和测验情境变化重测信度高,说明分数受被试状况和测验情境变化影响小。这里题目取样并不影响重测信度。影响小。这里题目取样并不影响重测信度。第26页,讲稿共81张,创作于星期日所测量的特性必须是所测量的特性必须是 稳定的;稳定的;遗忘与练习的效果相同;遗忘与练习的效果相同;两次施测期间被试的学习效果没有差别。两次施测期
18、间被试的学习效果没有差别。(三)计算重测信度的几个假设(三)计算重测信度的几个假设第27页,讲稿共81张,创作于星期日 (四)使用重测信度的优缺点(四)使用重测信度的优缺点 优点:优点:能提供有关测验结果是否随时间而变异的资料,能提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为的依据。可作为预测受测者将来行为的依据。缺点:缺点:容易受练习和记忆的影响,前后两次施测间隔的长短容易受练习和记忆的影响,前后两次施测间隔的长短必须适度必须适度;第一次尝试所发现的错误也可能导致第二次反第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异。应的变化而增加误差变异。第28页,讲稿共
19、81张,创作于星期日 (五)注意事项(五)注意事项 两次测验的时间间隔要适当。最适宜的时距随两次测验的时间间隔要适当。最适宜的时距随测验目的、性质及被试特点而异;测验目的、性质及被试特点而异;此方法适用于速度测验或人格测验,不适于此方法适用于速度测验或人格测验,不适于难度测验;难度测验;注意提高被试的积极性。注意提高被试的积极性。第29页,讲稿共81张,创作于星期日 二、复本信度(等值系数)二、复本信度(等值系数)(一)定义与计算(一)定义与计算 1.定义定义 根据一组被试在两个平行(等值)测验上的得分计根据一组被试在两个平行(等值)测验上的得分计算相关系数算相关系数。测验复份测验复份A 测验
20、复份测验复份B 因为它反映的是两个测验之间的等值程度,故又因为它反映的是两个测验之间的等值程度,故又称等值系数。称等值系数。最短时距最短时距第30页,讲稿共81张,创作于星期日 2.计算方法计算方法 AB A B/N r rxxxx =NAB 式中,式中,A A、B B为同一被试在两个测验复份为同一被试在两个测验复份A A、B B上的分数,上的分数,A A 、B B为为A A、B B两型测验的平均分数,两型测验的平均分数,A A、B B为为A A、B B两型测验的标准差,两型测验的标准差,N N为被试人为被试人数。数。第31页,讲稿共81张,创作于星期日 (二)误差来源(二)误差来源 1.测验
21、两种形式是否等值:测验两种形式是否等值:(1)测题取样是否匹配;)测题取样是否匹配;(2)格式是否相同;)格式是否相同;(3)内容、题数、难度、平均数、标准差是否一致。)内容、题数、难度、平均数、标准差是否一致。2.被试方面情绪波动、动机变化等。被试方面情绪波动、动机变化等。3.测验情境的变化测验情境的变化,偶发因素的干扰。偶发因素的干扰。第32页,讲稿共81张,创作于星期日 (三)等值测验应符合的条件(三)等值测验应符合的条件 等值测验可避免重测法的缺点,但所使用的必须是真正等值测验可避免重测法的缺点,但所使用的必须是真正的复本。复本应符合以下条件:的复本。复本应符合以下条件:1.各份测验测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信度 精选 PPT
限制150内