《测量误差以及其检验.ppt》由会员分享,可在线阅读,更多相关《测量误差以及其检验.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 关于测量的误差及其检验第一张,PPT共五十五页,创作于2022年6月 请列举一些你所使用过或接触过的量表请列举一些你所使用过或接触过的量表 思考思考:量表的作用是什么?量表的作用是什么?你如何解释下述现象?一个很聪明的孩子,测得智商是80分。一个学习很好的学生,考试成绩为60分。一个人缘很好的人,人际关系测量低于常模值。第二张,PPT共五十五页,创作于2022年6月 尺子的数据与我们的目测更一致,而秤盘的数尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高据则与我们的目测不一致。因此,尺子是测量身高的有效工具的有效工具效度。效度。什么材料的尺子?什么材料的尺
2、子?钢铁(热胀冷缩)钢铁(热胀冷缩)涉及到一致性的问题。涉及到一致性的问题。信度信度 总结:量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。第三张,PPT共五十五页,创作于2022年6月 第一节测量的误差第一节测量的误差一、误差种类及其含义一、误差种类及其含义系统误差:系统误差:与测量目的无关的因素所引起的恒定的有规与测量目的无关的因素所引起的恒定的有规律的误差,稳定地存在与每一次测量之中,这种误差律的误差,稳定地存在与每一次测量之中,这种误差就叫做系统误差。就叫做系统误差。随机误差:随机误差:与测量目的无关的偶然因素所引起的变化无与测量目的无关的偶然因素
3、所引起的变化无规律的误差,使得多次的测量结果不一致,其误差的规律的误差,使得多次的测量结果不一致,其误差的大小和方向是随机的。这种误差叫随机误差。大小和方向是随机的。这种误差叫随机误差。系统误差只影响测量的准确性,而随机误差既影响准确系统误差只影响测量的准确性,而随机误差既影响准确性,又影响一致性。性,又影响一致性。第四张,PPT共五十五页,创作于2022年6月 第五张,PPT共五十五页,创作于2022年6月 二、误差的来源二、误差的来源 1、测量工具:测量工具:项目取样项目取样;表述的清晰与准;表述的清晰与准确,及其可操作性确,及其可操作性;信度与效度的问题;信度与效度的问题。2、测量对象测
4、量对象被试:情绪、动机、疲劳、被试:情绪、动机、疲劳、经验(技能与技巧)、学习效应、反应倾经验(技能与技巧)、学习效应、反应倾向等;向等;3、实测过程:实测过程:由于一些恒定因素容易控制,由于一些恒定因素容易控制,故主要指一些偶然因素:如物理环境、时故主要指一些偶然因素:如物理环境、时间安排、主试因素、意外干扰、评分等。间安排、主试因素、意外干扰、评分等。第六张,PPT共五十五页,创作于2022年6月 三、真分数三、真分数 真分数是一个理论上构想的概念,指测量没真分数是一个理论上构想的概念,指测量没有误差时的所得到的值。有误差时的所得到的值。任何一个测验分数都是真分数与测量误差的任何一个测验分
5、数都是真分数与测量误差的和,即:和,即:X=T+E 这里的误差这里的误差E只是随机误差,而系统误差则包含只是随机误差,而系统误差则包含在真分数在真分数T中。中。E可以是正的,也可能是负的。可以是正的,也可能是负的。第七张,PPT共五十五页,创作于2022年6月 第八张,PPT共五十五页,创作于2022年6月 对团体来说,实得分数的变异数(方差)等于对团体来说,实得分数的变异数(方差)等于真分数的变异数加上误差的变异数,即真分数的变异数加上误差的变异数,即SX2=ST2+SE2 而系统误差的变异数包含在真分数的变异数之中,而系统误差的变异数包含在真分数的变异数之中,所以真分数的变异数是由两部分组
6、成:与测量目的有关所以真分数的变异数是由两部分组成:与测量目的有关的变异数,与测量目的无关的变异数。即:的变异数,与测量目的无关的变异数。即:ST2=SV2+SI2 这样,一组分数的变异性就由三部分组成:与测量这样,一组分数的变异性就由三部分组成:与测量目的有关的变异数,与测量目的无关的变异数,以及随目的有关的变异数,与测量目的无关的变异数,以及随机误差变异数,即:机误差变异数,即:SX2=SV2+SI2+SE2。第九张,PPT共五十五页,创作于2022年6月 SX2ST2 SE2SI2SV2第十张,PPT共五十五页,创作于2022年6月 四、心理测验的基本指标四、心理测验的基本指标1、行为样
7、本、行为样本(behavior sample):测查的是部分心理特质与特定的行为,而非全部,这与质检、水检、血检一样涉及抽样问题(根据心理理论抽样)。2、标准化、标准化3、信度、信度(reliability):测验的可靠性,表示测量结果的一致性,通常用同一测验多次测量同一团体或个体的结果之间的一致程度来表示。4、效度、效度(validity):有效性,实际测出所要测的心理特质的程度。5、难度或应答率、难度或应答率 难度难度:成就测验或能力测验要求项目难度值(天花板效应和天花板效应和地板效应),地板效应),题目应由简到难、由易到繁排列难度控制。第十一张,PPT共五十五页,创作于2022年6月 第
8、二节心理测量的信度第二节心理测量的信度一、什么是信度:一、什么是信度:稳定性稳定性、可靠性、可靠性、一致性、一致性 1信度指实测值和真值相差的程度信度指实测值和真值相差的程度 2信度指统计量与参数之间的接近程度信度指统计量与参数之间的接近程度 3信度是指一种测验对相同的应试者再次测验时引起同信度是指一种测验对相同的应试者再次测验时引起同样反应的程度样反应的程度 一个良好的心理测量,多次进行测量,其结果应该的是始一个良好的心理测量,多次进行测量,其结果应该的是始终保持不变。终保持不变。第十二张,PPT共五十五页,创作于2022年6月 通常,心理测量的信度通过信度系数来衡量:通常,心理测量的信度通
9、过信度系数来衡量:1 1、信度乃是一个被测团体真分数的变异数与实得分数的变信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。异数之比。r rXXXX=S=ST T2 2/S/SX X2 2 2 2、信度乃是一个被测团体真分数与实得分数的相关系数的平、信度乃是一个被测团体真分数与实得分数的相关系数的平方。方。r rXXXX=P=P2 2TXTX 3 3、信度乃是一个测验、信度乃是一个测验X X与它的任意一个平行测验与它的任意一个平行测验XX的相的相关系数。关系数。r rXXXX=P=PXXXX第十三张,PPT共五十五页,创作于2022年6月 二、信度的种类:二、信度的种类:1、重测信度、
10、重测信度(test-retest reliability):):也叫稳定系数,是一组被试在不同时间用同一也叫稳定系数,是一组被试在不同时间用同一测验测量两次(间隔一段时距)所得分数的相测验测量两次(间隔一段时距)所得分数的相关系数。关系数。实质:表示测验结果的稳定性。故称之为稳定性系数实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability)形式:施测形式:施测适当时间适当时间再施测再施测重测信度的计算方法是积差相关法,因而重测信度的计算方法是积差相关法,因而rxx就是皮尔就是皮尔逊的积差相关系数。逊的积差相关系数。第十四张,PPT共五十五页,创作于20
11、22年6月 时间间隔的把握:时间间隔的把握:间间隔隔时时间间越越长长,稳稳定定性性系系数数越越低低。适适宜宜时时间间间间隔隔依依照照测测验验目目的的、性性质质及及被被试试特特点点而而定定。几分钟至几年。几分钟至几年。年年幼幼儿儿童童,间间隔隔要要小小;年年长长群群体体,间间隔隔可可大大。智智力力测测验验的的间间隔隔不不能能太太短短,成成就就测测验验的的间间隔隔不能太长。不能太长。第十五张,PPT共五十五页,创作于2022年6月 一一般般间间隔隔时时间间不不超超过过六六个个月月。(即即不不能能让让被被试试记记住住上上一一次次测测验验的的内内容容,又又不不能能让让其其特特质质发发生生变变化化,或对
12、所学知识产生遗忘)。或对所学知识产生遗忘)。在在一一般般情情况况下下,间间隔隔施施测测的的副副本本信信度度最最低低,因因为为很很多多因因素素有有机机会会影影响响到到分分数数。相相反反,校校正正过过的的分分半半相相关关,因因为为影影响响的的因因素素少少,所所得得的的信信度度估计为最高。估计为最高。第十六张,PPT共五十五页,创作于2022年6月 l使用重测信度应注意:不是所有测验都可使用重测信度应注意:不是所有测验都可以计算重测信度。并且重测信度只是反映以计算重测信度。并且重测信度只是反映了随机误差的影响,而不是反映被试心理了随机误差的影响,而不是反映被试心理特点的长期变化。特点的长期变化。第十
13、七张,PPT共五十五页,创作于2022年6月 2、复本信度、复本信度(alternate-form reliability):):两个平行测验,也叫等值系数,估计的两个平行测验,也叫等值系数,估计的是两个假定相等的复份测验之间的一致性,是是两个假定相等的复份测验之间的一致性,是两个平行测验分数的相关。当一个测验不能用两个平行测验分数的相关。当一个测验不能用来实施两次时,就需要给同一个测验编制两份来实施两次时,就需要给同一个测验编制两份平行的测验。平行的测验。第十八张,PPT共五十五页,创作于2022年6月 定定义义:两两个个复复本本施施测测同同一一被被试试群群体体,求其相关。求其相关。等等值值
14、性性系系数数:同同时时连连续续施施测测,反反映映内内容容变变异。异。形式:复本形式:复本AA最短时间最短时间复本复本B B稳稳定定性性与与等等值值性性系系数数:时时间间间间隔隔施施测测,内内容变异重测信度误差容变异重测信度误差形式:复本形式:复本AA适当时间适当时间复本复本B B 第十九张,PPT共五十五页,创作于2022年6月 复本等值要符合下列条件:复本等值要符合下列条件:各份测验测量的是同一种心理特性。各份测验测量的是同一种心理特性。各份测验具有相同的内容、形式、数量、各份测验具有相同的内容、形式、数量、难度、区分度、时限、指导语等。难度、区分度、时限、指导语等。各份测验的题目不应重复。
15、各份测验的题目不应重复。前后测验的时间间隔要适当,太长和太短前后测验的时间间隔要适当,太长和太短都不好。都不好。各份测验的分数分布(平均数和标准差)各份测验的分数分布(平均数和标准差)大致相等。大致相等。复本编好后,应再测一次,以确保各份测验复本编好后,应再测一次,以确保各份测验的等值。的等值。第二十张,PPT共五十五页,创作于2022年6月 优点:优点:避免了重测带来的记忆效应和练习效避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少应;可用于长期追踪研究前后测量;减少了作弊的可能性。了作弊的可能性。缺陷:缺陷:1 1、有些测验因正迁移效应使测验性、有些测验因正迁移效应使测
16、验性质改变;如测量的内容很容易受练习的影质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。响,复本信度也无法清除这种练习效应。2 2、对许多测验来说,难以编制合、对许多测验来说,难以编制合适的复本。适的复本。第二十一张,PPT共五十五页,创作于2022年6月 重测复本信度:即在不同的时间里施测两重测复本信度:即在不同的时间里施测两个等值的测验(复本),得到的相关就个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。是重测复本信度,也叫稳定等值系数。它比单一的重测信度或复本信度都要严它比单一的重测信度或复本信度都要严格、全面一些。格、全面一些。第二十二张,P
17、PT共五十五页,创作于2022年6月 3、折半信度、折半信度(split-half reliability):):在测验没有复本且只能实施一次的情在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相据被试在这两半测验中所得的分数计算相关系数,即得分半信度。关系数,即得分半信度。计计算算分分半半信信度度先先要要对对测测验验分分半半。不不同同的分半法可能会得到不同的信度值。的分半法可能会得到不同的信度值。第二十三张,PPT共五十五页,创作于2022年6月 为了使两半基本等值,可将项目按由易到难为了使两半基本等值
18、,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值密的项目分在相同的一半,否则会使信度值偏高。也不要出现前后直接分段偏高。也不要出现前后直接分段.由由于于分分半半信信度度实实际际上上只只是是半半个个测测验验的的信信度度,测测验验越越长长、项项目目越越多多,两两半半分分数数的的相相关关就就越越高高。因因此此,对对长长度度不不同同的的测测验验,要要用用校校正正公公式。式。当当试试卷卷中中存存在在任任选选题题或或试试卷卷为为速速度度测测验验时
19、时,不宜采用分半法不宜采用分半法.第二十四张,PPT共五十五页,创作于2022年6月 4、同质性信度、同质性信度(homogeneity reliability):所有:所有题目间的一致性程度。题目间的一致性程度。同同质质性性指指测测验验的的所所有有题题目目测测量量的的是是同同一一种种心心理理特特质质,表表现现为为各各个个题题目目得得分分之之间间有有较较高高的的相相关关,相相关关越越高高则则同同质质性性越越强强,如如果果相相关关很很低低或或是是呈呈负相关,则题目为异质。负相关,则题目为异质。因素分析的思路因素分析的思路第二十五张,PPT共五十五页,创作于2022年6月 分半信度是求测验两半之间
20、的一致分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间性或同质性,而同质性是求所有题目间的一致性。因此分半信度实际上是同质的一致性。因此分半信度实际上是同质性信度的一种,可以作为测验同质性评性信度的一种,可以作为测验同质性评价的粗略估计指标。因为可以根据测验价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思,得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度叫结构效度,它实际上介于信度与效度之间。之间。第二十六张,PPT共五十五页,创作于2022年6月 5、评分者信度:、评
21、分者信度:多个评分者对同一多个评分者对同一测验结果评分所得分数之间的一致性。测验结果评分所得分数之间的一致性。评评分分者者信信度度是是指指不不同同评评分分者者之之间间在在测测验验结结果计分上的一致性。果计分上的一致性。在在心心理理测测验验中中,评评分分者者信信度度的的计计算算,通通常常是是随随机机抽抽取取若若干干份份试试卷卷,由由至至少少两两位位受受过过训训练练的的评评分分者者按按计计分分规规则则分分别别判判分分,然然后后计计算算它它们们的的相相关关。几几个个评评分分者者的的评评分分越越一一致致,评评分分者信度越高者信度越高.第二十七张,PPT共五十五页,创作于2022年6月 估计信度的方法与
22、测验复本的数目估计信度的方法与测验复本的数目以及施测次数的关系以及施测次数的关系被试所需要施测的次数所需要复本的数目一二一分半信度同质性信度评分者信度复本信度(连续施测)二再测信度复本信度(间隔施测)在一般情况下,间隔施测的复本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半信度,因为影响的因素少,所得的信度估计为最高。第二十八张,PPT共五十五页,创作于2022年6月 各种信度系数相应误差变异的来源各种信度系数相应误差变异的来源信度系数的类型误差变异的来源再测信度复本信度(连续施测)复本信度(间隔施测)分半信度同质性信度评分者信度时间取样内容取样时间与内容取样内容取样内容的异质性评
23、分者间的差异第二十九张,PPT共五十五页,创作于2022年6月 三、信度系数的应用三、信度系数的应用 1、解释预测个人分数的意义。、解释预测个人分数的意义。2、解释真实分数与实得分数间的关系,明确告、解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。诉我们测验误差大小。3、新编的测验信度应高于原有的同类测验或相新编的测验信度应高于原有的同类测验或相似测验。似测验。4、下结论说某测验比较可靠,必须是依据情境的,、下结论说某测验比较可靠,必须是依据情境的,经多次证实的。经多次证实的。5、它是确定测验好坏的一个指标。一般的原则、它是确定测验好坏的一个指标。一般的原则是:是:当当rxx 0.7
24、0时,测验不能用于对个人作出评价或预测,而且不能做时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。团体间比较。当当0.70rxx0.85时,可用于团体比较。时,可用于团体比较。当当rxx 0.85时,才可以用来鉴别或预测个人成绩时,才可以用来鉴别或预测个人成绩第三十张,PPT共五十五页,创作于2022年6月 实际上,有多少种误差来源,便有多少实际上,有多少种误差来源,便有多少种估计信度的方法。一个测验哪种误差大,便种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要有几应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变异数分种信度系数
25、,这样我们就把总分数的变异数分成不同的分支。成不同的分支。第三十一张,PPT共五十五页,创作于2022年6月 假设对假设对100个六年级学生以两个月的时个六年级学生以两个月的时间间隔先后施测一个创造力测验的间间隔先后施测一个创造力测验的A、B两两个复本,所得的等值性与稳定性系数为个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分我们还根据被试对每个复本的反应计算出分半信度为半信度为0.80(先计算每个复本的分半相关(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼系数。将二者平均后再用斯皮尔曼-布朗公式布朗公式校正)。同时,我们让另一个评分者随机抽校正)。
26、同时,我们让另一个评分者随机抽取取50份卷子另外评分,得到评分者信度为份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误。然后,我们对这三种方法所产生的误差变异进行分析。差变异进行分析。第三十二张,PPT共五十五页,创作于2022年6月 一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度(间隔施测)1-0.70=0.30时间与内容取样分半信度1-0.80=0.20内容取样上述二者差异0.30-0.20=0.10 时间取样评分者信度1-0.92=0.08评分者差异误差变异总和0.20+0.10+0.08=0.38真实变异1-
27、0.38=0.62第三十三张,PPT共五十五页,创作于2022年6月 一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析真实变异误差变异时间上的稳定性,复本之间的一致性,评分者之间的一致性 内容取样误差时间取样误差评分者间差异62%20%10%8%第三十四张,PPT共五十五页,创作于2022年6月 四、影响信度的因素:四、影响信度的因素:1、被试样本与同质程度:个体身心状、被试样本与同质程度:个体身心状况,如应试动机、注意力、耐心、求胜心、况,如应试动机、注意力、耐心、求胜心、作答态度等会影响测量的误差。团体被试:作答态度等会影响测量的误差。团体被试:团体内部的离散程度以及团体的平均
28、水平;团体内部的离散程度以及团体的平均水平;被试的样本。被试的样本。第三十五张,PPT共五十五页,创作于2022年6月 (1)样本团体得分分布的影响:求信度的样样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。本团体得分分布如果比较窄小的话信度就低。(2)样本团体异质性的影响:样本团体异质样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。实际上,的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质造高信度可能是假性高信度,是由
29、样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的的信度样本求得的信度就是真信度。这时,相反的情况就需要校正信度。情况就需要校正信度。第三十六张,PPT共五十五页,创作于2022年6月 (3)样本团体平均能力水平的)样本团体平均能力水平的影响。由于信度也会因样本间团影响。由于信度也会因样本间团体平均能力水平的不同而不同,体平均能力水平的不同而不同,因此在求信度时,一定要注意信因此在求信度时,一定要注意信度样本与常模总体间是否一致。度样本与常模总体间是否一致。第三十七张,PPT共五十五页,创作于20
30、22年6月 2、测验的长度:在其他条件均等的情况、测验的长度:在其他条件均等的情况下,测验越长,信度越高。下,测验越长,信度越高。原因在于:(原因在于:(1)测验越长,即题测验越长,即题目越多,测验的内容取样就越有可能有目越多,测验的内容取样就越有可能有代表性。代表性。(2)测验越长,被试的猜测因素测验越长,被试的猜测因素影响就越小。增加的项目须与原项目影响就越小。增加的项目须与原项目同质;增加的数目适当,过多同质;增加的数目适当,过多疲疲劳、反感,从而降低信度。劳、反感,从而降低信度。第三十八张,PPT共五十五页,创作于2022年6月 3、测验的难度:难度对信度的影响只存在、测验的难度:难度
31、对信度的影响只存在于某些测验中,如智力测验、成就测验、于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为如果测验过难,对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。过于容易,被试的得分会集中在低分区。过于容易,分数则集中在高分区。两种情况都使信度分数则集中在高分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而样本的得分范围变窄,变异量降低,从而低估测验信度。因此,当难度为低估测验信度。因此,当难度为0.5时信时信度最高。度最高。第三十九张,PPT共五十五页,创作于2022年6月 4、测验的时
32、间间隔:这一因素之对重测信、测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信度有影响,度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。对其余的信度来说不存在时间间隔问题。第四十张,PPT共五十五页,创作于2022年6月 第四节心理测量的效度第四节心理测量的效度效度要回答的基本问题:效度要回答的基本问题:l要测量的是什么东西?或者说是否测到要测量的是什么东西?或者说是否测到了它所要测的东西?了它所要测的东西?l测验对它所测量的东西测到什么程度测验对它所测量的东西测到什么程度?第四十一张,PPT共五十五页,创作于2022年6月 一一 效度的一般定义及其内涵效度的一般
33、定义及其内涵效度是指测验的准确性,即测验能够测出他效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。们所欲测的特质的程度。、效度的性质:效度的真实含义是指测验结果的效、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。度,也就是测验结果的准确程度。(1)效度具有相对性。效度具有相对性。(2)效度具有连续性。测验的有效性只有程度上的效度具有连续性。测验的有效性只有程度上的差别。差别。(3)效度也不是直接就可以测量到的,它是从已效度也不是直接就可以测量到的,它是从已有的证据推理而来的。有的证据推理而来的。第四十二张,PPT共五十五页,创作于2022年6月 2 效度的
34、统计与原理:效度的统计与原理:3 效度和信度关系:效度和信度关系:两者所涉及的误差不同:信度仅考虑偶两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效度则然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误差。还包括与测验无关的但稳定的测量误差。(1)信度是效度的必要而非充分条件。信度是效度的必要而非充分条件。(2)效度是受信度制约的。效度是受信度制约的。l高效度,高信度高效度,高信度l高信度,低效度高信度,低效度l低信度,低效度低信度,低效度第四十三张,PPT共五十五页,创作于2022年6月 二、效度的估计1966年美国心理学会在教育心理测验值标准中将效度
35、分为三大类:(一)内容效度(Content Validity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。、满足条件:l要确定好内容范围,并使测验的全部项目均在此范围内;l测验项目应是已界定内容范围的代表性样本。第四十四张,PPT共五十五页,创作于2022年6月 、确定内容效度的方法、确定内容效度的方法:l专家判断法专家判断法定义好内容总体,并描绘出有关知识与技能的轮廓;定义好内容总体,并描绘出有关知识与技能的轮廓;划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详细的描述;细的描述;确定每道题目所测的知
36、识与技能,将自己的分类与测验编制的纲目做比确定每道题目所测的知识与技能,将自己的分类与测验编制的纲目做比较;较;指定判定量表,从各方面对测验作出评定。指定判定量表,从各方面对测验作出评定。l复本法复本法l再测法再测法l经验法经验法、内容效度应用:、内容效度应用:内容效度内容效度表面效度表面效度第四十五张,PPT共五十五页,创作于2022年6月 (二)构想效度(二)构想效度(Construct Validity)构想效度是指测验对于被称作构想的某构想效度是指测验对于被称作构想的某一理论概念或特质测量的程度。一理论概念或特质测量的程度。研究构想效度就是要搞清楚:研究构想效度就是要搞清楚:测验测量的
37、是什么构想(概念或特质)?测验测量的是什么构想(概念或特质)?测验分数的变异中有多少来自于测验的理论构想测验分数的变异中有多少来自于测验的理论构想?构想效度是没有单一指标的,它是由各方面证构想效度是没有单一指标的,它是由各方面证据累积起来作出评价的。据累积起来作出评价的。第四十六张,PPT共五十五页,创作于2022年6月 、构想效度的基本步骤:、构想效度的基本步骤:确定结构效度的基本步骤:建立理论框确定结构效度的基本步骤:建立理论框架、根据理论框架推演出有关测验成绩的假架、根据理论框架推演出有关测验成绩的假设、用逻辑或实证的方法来证明假设。设、用逻辑或实证的方法来证明假设。相关、因素分析相关、
38、因素分析第四十七张,PPT共五十五页,创作于2022年6月 、确定构想效度的方法:、确定构想效度的方法:l测验内法:是通过研究测验内部结构来界定理论构想,测验内法:是通过研究测验内部结构来界定理论构想,从而为构想效度提供证据。从而为构想效度提供证据。确定测验的内容效度确定测验的内容效度分析被试对项目作反应的过程分析被试对项目作反应的过程考察测验的同质性考察测验的同质性l测验间法:通过分析几个测验间的相关关系,找出其共同测验间法:通过分析几个测验间的相关关系,找出其共同之处,进行推断这些测验测量的特质是什么,也可以确定之处,进行推断这些测验测量的特质是什么,也可以确定这些测验构想效度如何。这些测
39、验构想效度如何。相容效度相容效度区分效度区分效度因素效度因素效度l效标关联法效标关联法l实验操作法实验操作法第四十八张,PPT共五十五页,创作于2022年6月 (三)效标效度:指一个测验对处于特定情景(三)效标效度:指一个测验对处于特定情景中的个体的行为进行估计的有效性。中的个体的行为进行估计的有效性。、预测效度与同时性效度、预测效度与同时性效度、效标和效标测量:、效标和效标测量:效标:效标:指衡量测验有效性的外在标准,通常指我们所要预测的行为。指衡量测验有效性的外在标准,通常指我们所要预测的行为。效标测量:效标测量:对观念效标的数量化。对观念效标的数量化。观念效标是效标的理论定义,效标测量是
40、效标的操作定义,效标观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。测量必须能真正反映观念效标。第四十九张,PPT共五十五页,创作于2022年6月 好的观念效标应具备的条件:好的观念效标应具备的条件:l效标测量必须真实地反应观念效标的重要效标测量必须真实地反应观念效标的重要方面;方面;l效标测量必须稳定可靠;效标测量必须稳定可靠;l效标测验必须客观,避免偏见;效标测验必须客观,避免偏见;l在保证有效性的前提下,效标测量必须尽在保证有效性的前提下,效标测量必须尽可能简单、省时、花费少。可能简单、省时、花费少。第五十张,PPT共五十五页,创作于2022年6月 效
41、标测量的一个重要特征是客观性。为效标测量的一个重要特征是客观性。为此因做到:此因做到:避免偏见影响效标测量,特别是以等级评定为效标测量时,避免偏见影响效标测量,特别是以等级评定为效标测量时,评分者的主观偏见会有很大影响。评分者的主观偏见会有很大影响。防止效标污染,即指个人的效标因评定者知道个体的测验防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。分数(也叫预测源分数)而受到影响。常用的效标:常用的效标:学业成就、临床诊断、实际工作表现、学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级特殊训练成绩、效标团体比较、先前有效的测验
42、、等级评定。评定。第五十一张,PPT共五十五页,创作于2022年6月 、效标效度的估计方法:、效标效度的估计方法:P59()相关法()相关法()分组法()分组法()预期表法()预期表法()命中率法()命中率法()功利率法()功利率法第五十二张,PPT共五十五页,创作于2022年6月 三、标准参照测验的效度:三、标准参照测验的效度:P61第五十三张,PPT共五十五页,创作于2022年6月 四、影响效度的因素:四、影响效度的因素:、测验本身的因素:、测验本身的因素:()项目质量()项目质量()项目数量:可提高信度和一定的效度()项目数量:可提高信度和一定的效度、测验的实施:、测验的实施:、被试:、
43、被试:()身心状态:()身心状态:(2)样本的性质:样本的性质:不同的团体对同一测验的反应可能会不一样,因被试的背景不同的团体对同一测验的反应可能会不一样,因被试的背景不同,对测验的题目可能采取完全不同的方法来回答。不同,对测验的题目可能采取完全不同的方法来回答。同一个测验,效度团体的性质不同,效度也会有很大差别。效度团体的同一个测验,效度团体的性质不同,效度也会有很大差别。效度团体的性质包括年龄、性别、教育程度、智力水平、动机、职业等有关的特点,性质包括年龄、性别、教育程度、智力水平、动机、职业等有关的特点,这些性质特点使测验对不同的团体具有不同的预测能力。故称为干涉变这些性质特点使测验对不同的团体具有不同的预测能力。故称为干涉变量。量。样本团体的异质性。其他条件相同的时候,样本同质性越高,效度越低。样本团体的异质性。其他条件相同的时候,样本同质性越高,效度越低。、效标:、效标:第五十四张,PPT共五十五页,创作于2022年6月 感谢大家观看第五十五张,PPT共五十五页,创作于2022年6月17.09.2022
限制150内