《e 第五章 心理测量学.doc》由会员分享,可在线阅读,更多相关《e 第五章 心理测量学.doc(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 心理学测量学知识第一节 概述第一单元 测量与测量量表一、什么是测量 测量:是依据一定的法则用数字对事物加以确定 包括三元素:事物、数字、法则 数字:这些数值具有自然数的特点:区分性、序列性或等级性、等距性、可加性 法则:代表测量所依据的规则和方法二、测量要素 测量具备的两要素:参照点和单位 (一)参照点:要确定事物的量,必须有一个计算的起点,这起点即称参照点 分为:绝对零点和相对零点 理想的参照点是绝对零点 (二)单 位:好的单位须具备:有确定的意义 有相同的价值三、测量量表 根据量表的精确程度,斯蒂文斯将测量从低级到高级分为四种水平: (一)命名量表:最低水平;如用1代表男性,用2代
2、表女性(二)顺序量表:次低水平;如学生考试的名次 在顺序量表中,既无相等单位,又无绝对零点,数字仅代表等级(三)等距量表:较高水平;不但有大小关系还具有相等单位,其数值能做加、减运算;0并不代表没有温度(四)等比量表:最高水平;长度、重量、时间都是等比量表,所得的数值可做加、减、乘、除运算。心理测量是在顺序量表中进行的第二单元 心理测验的基本概念一、心理测验的定义 心理测验:依据心理学的理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段 心理测验测量:(一)人的行为 (二)行为样组 (三)测量的标准化 (四)测量要
3、看常模二、心理测验具有独特的性质: (一)间接性: (一)相对性: (一)客观性:心理测量标准化的内容:测量的刺激是客观的 评分记分的原则和手续经过了标准化 对结果推论第三单元 心理测验的分类一、按测验的功能分类:智力测验、特殊能力测验、人格测验(未包括智力测验)二、按测验的材料分类:文字测验、操作测验三、按测验材料的严谨程度分类:客观测验、投射测验四、按测验的方式分类:个别测验、团体测验五、按测验的要求分类:最高作为测验:有正确答案;如:智力测验、成就测验典型行为测验:没有正确答案;如:人格测验第四单元 纠正错误的测量观一、错误的测量观 (一)测验万能论 (二)测验无用论 (三)心理测验即智
4、力测验二、正确的测量观 (一)心理测验是重要的心理学研究方法之一,是决策的辅助工具 (二)心理测试作为研究方法和测量工具尚不完善第五单元 心理测验在心理咨询中的应用在我国,目前心理门诊中运用较多的心理测验:智力测验、人格测验及心理评定量表第六单元 心理测验的发展史一、科学心理测验的产生与发展 高尔顿:提出人的不同气质特点和智能是按身体特点的不同而遗传的 为了研究差异的遗传性,设计了测量差异的方法 为心理测验奠定了统计学的基础 第一个提出心理测验的概念 他的学生皮尔逊创立积差相关法 卡特尔:心理测验与测量一文,是心理测验第一次出现于心理学文献中 心理学必须立足于实验与测量上,才能有自然科学的准确
5、性 极力主张测验手续和考试方法应有统一规定,并要有常模以便比较 比 内:他与助手西蒙编制一个包括30个项目的量表,是世界上第一个正式的心理测验 20世纪心理测验主要有下列发展: (一)操作测验的发展 (二)团体智力测验的发展:始于第一次世界大战中奥蒂斯所编的陆军甲种和乙种智力测验 (三)能力倾向测验的发展 (四)人格测验的发展:人格测验的先驱是克雷丕林 罗夏测验是投射测验的发端二、现代心理测验在我国的发展 我国近代心理测验源于1914年,1979年后,先后对国外广泛采用的测量工具进行修订 近来我国的心理学家正致力于测验本土化第二节 测验的常模第一单元一、常模团体的性质 常模团体:是由具有某种共
6、同特征的人所组成的一个群体,或者是该群体的一个样本 对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识 常模团体必须能够代表该总体,包括:确定一般总体、确定目标总体、确定样本二、常模团体的条件 (一)群体的构成必须明确界定 (二)常模团体必须是所测群体的代表性样本 (三)样本的大小必须要适当:在实际工作中,应从经济的或实用的可能性和减少误差这两方面来综合考虑样本的大小 最低:不小于30或100个 全国性常模应有20003000人为宜 (四)标准化样组是一定时空的产物(具有新进性)三、取样的方法 取样即从目标人群中选择有代表性的样本 抽样方法: (一)简单随机抽样:按照随机表顺序选
7、择被试构成样本 (二)系统抽样:要求无序可排,也无等级结构存在 K为组距:KNn 121名学生中取40人作为样本调查 则K12140;K3;所以3人为一段,可分40段,每段取一人 (三)分组抽样:总体数目大,且群体又有多样性,先将群体进行分组,再在组内进行随机取样 (四)分层抽样:在确定常模时,最常用的方法 又可分:分层比例抽样和分层非比例抽样四、常模分数与常模 (一)常模分数:是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数 导出分数具有一定的参照点和单位,是一个有意义的测验量表,它与原始分数等值,可以进行比较 (二)常 模:是常模分数构成的分布,是解释心理测验分数的基础
8、 常模分:一般常模与特殊常模第二单元 常模的类型一、发展常模 人有许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,可将个人的成绩与各种发展水平的人的平均表现相比较。根据这平均表现所制成的量表就是发展常模,也称年龄量表在此量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平(一)发展顺序量表 最直观的发展常模是发展顺序量表能告诉人们儿童的发育与其年龄相比为超前、正常或滞后 最早的一个范例是葛塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四方面的大致发展水平(儿童感觉运动发展:4周眼球能动;16周头能平衡;28周手抓握东西;40周能坐或爬行;52周
9、站立和行走) 瑞士心理学家皮亚杰最为著名的是对守恒概念的研究 皮亚杰发现:儿童5岁时能理解质量守恒;6岁掌握重量守恒;7岁才有容量守恒概念(二)智力年龄 比内西蒙量表中首先使用智力年龄的概念 一个儿童在年龄量表上所得的分数,是最能代表他的智力水平的年龄,这种分数叫智力年龄,简称智龄 例:某儿童通过了4岁组的全部题目,5岁组通过3题、6岁组通过2题、7岁组通过1题,请问其智龄为? 答:4岁(322212)月4岁(642)月4岁12个月5岁 或:4岁【(321)2】月4岁(62)月4岁12个月5岁(三)年级当量 年级当量就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用 年级量表的
10、单位为10个月间隔,例:4.0(或40)为四年级开始时的平均成绩,4.5(或45)表示学年中的平均成积例:常模样本6年级的算数平均分是35,某儿童在算数测验中得35分,说明该儿童的算数年级当量是6年级水平二、百分位常模(一)百分等级 一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比 百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低 例:55的百分等级表示在常模中样本中有55的人比这个分数低 百分等级的计算分两种情况:未分组数据及分组数据 未分组数据的百分等级计算,公式为: 100R50 PR100 其中R是原始分数排列顺序数,N指总人数 N 例:王红
11、在30名同学中物理成绩是80分,排列第5名,其百分等级为? PR100(10055030) PR100(45030)PR10015PR85(二)百分点 百分点也称百分位数,与百分等级的计算方法相反 百分点是计算处于某一百分比例的人对应的测验分数是多少 在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数 例:高考的最高分为650分,其百分等级为100,最低分为105分,百分等级为1,要录取20的学生进入大学,则百分等级为80的百分位数是?105分 x分 650分 1 80 100 650X X105 10080 801 7965079X20X20105 5135079X20X2100
12、51350210020X79X 5345099X 540X 在实际应用中,我们一般既可以由原始分数计算百分等级,又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模 (三)四分位数和十分位数 四分位数:百分等级的25、50和75对应的三个百分分成的四段 十分位数:110为第一段,91100为第十段三、标准分常模 标准分常模:是将原始分数与平均数的距离以标准偏差为单位表现出来的量表。因为它的基本单位是标准偏差,所以叫标准分数常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商(IQ)等 标准分数可以通过线性转换,也可以通过非线性转换得到 (一)线
13、性转换的标准分数 XX z X为任一原始分数,X为样本平均数,SD为样本标准偏差 SD ZABz 加上一个常数是为了去掉负值,乘一个常数是为了使单位变小而去掉小数点 (二)非线性转换的标准分数 当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的 常态化过程主要是将原始分数转化为百分等级,在将百分等级转化为常态分布上相应的离均值 T5010z 50为平均数,10为标准偏差,叫做T分数 标准九分其量表是个9级的分数量表,以5为平均数、以2为标准偏差的一个分数量表 标准十分:以5为平均数、以1.5为标准偏差 标准二十分:以10为平均数、以3为标准偏差四、智商及其意义 单纯用心理年龄
14、来表示智力高低的方法缺乏不同年龄儿童间的可比性,目前一般都用比率智商和离差智商来表示智力的高低(一)比率智商:被定义为心理年龄(MA)与实足年龄(CA)之比 MAIQ 100 CA 由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试 (二)离差智商 由心理学家韦克斯勒提出 韦克斯勒将离差智商的平均数定为100,标准偏差定为15 离差智商建立在统计学的基础上,表示的是个体智力在年龄组中所处的位置,是表示智力高低的一种理想的指标 15(XX) IQ10015z100 SD 从不同的经验获得的离差智商只有当标准偏差相同或接近时才可以比
15、较,标准偏差不同,其分数的意义便不同第三单元 常模分数的表示方法一、转换表法 最简单而且最基本的表示常模的方法就是转换表,也叫常模表 测验的用户利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释二、剖面图法 剖面图是将测验分数的转换关系用图形表示出来 从剖面图可以很直观的看出被试在各个分测验上的表现及其相对的位置第三节 测验的信度第一单元 信度的概念一、信度的意义 信度:指同一被试者,在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度 信度只受随机误差的影响,随机误差越大,信度越低。系统误差产生恒定效应,不影响信度 每一实验可用公式表示:X
16、(实得分数)T(真实分数)E(误差) 此公式又可表示为:SXSTSE在测量理论中,信度被定义:一组测量的真分数方差与总方差(实得分数的方差)的比率 即: ST rxx SX 而:STSXSE 所以又可转化为: SXSESE rxx SX SX二、信度的指标信度指数的平方就是信度系数测量标准误:测量误差分布的标准偏差 rxxSESX rxxSXSX(1SESX) rxxSXSXSE SESXSX SESX(1rxx) SESX1rxx公式中SE为测量的标准误,SX是所得分数的标准偏差,rxx是测验的信度系数从公式可看出,测量的标准误与信度之间互为消长的关系:信度越高,标准误越小 信度越低,标准误
17、越大第二单元 信度评估的方法对信度的评估方法是没有通用法则的,因为不同的信度反映测验误差的不同来源信度评估的方法可分:一、重测信度 又称稳定性系数 使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数 人的心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化 优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据 缺点:易受练习和记忆的影响 重测信度的时距一般是两周到四周较宜,间隔时间最好不超过六个月二、复本信度 又称等值性系数 以两个等值但题目不同测验(复本)来测量同一群体,然后求被试在两个测验上得分的相关系数 这个相关系
18、数代表复本信度的高低。复本信度反映的是测验在内容上的等值性 如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数 优点:能避免重测信度的一些问题,如记忆效果、学习效应 缺点:如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除此影响 由于第二个测验只改变题目的内容,已经掌握的解题原则,可以很容易迁移到同类问题 对许多的测验来说,建立复本是十分困难的三、内部一致性信度 主要是反映题目之间的关系,表示测验能够测量相同内容或特质的程度 (一)分半信度:采用分半法估计所得的信度系数 斯皮尔曼布朗公式: 2rhh rxx 1rhh 式中rhh为一半分数的相关系数,rxx为测验在原长
19、度时的信度估计值 (二)同构型信度:代表测验内部所有题目间的一致性 当各个测验的得分有较高的正相关时,不论题目的内容或形式如何,则测验为同质的;所有题目看起来好像测验同一性质,但相关很低或为负相关时,则测验为异质的 库德理查德德德德逊公式:KR20公式或KR21公式;只适用答对一题记一分,答错无分的测题,不适用多重记分测题 克伦巴赫系数:多项选择人格测验、态度量表等四、评分者信度 评分者信度:用于测量不同评分者之间所产生的误差。随机抽取若干份测验卷,由两位评分者按评分标准分别分,然后根据每份测验卷的两个分数计算相关 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观
20、的 可采用肯德尔和谐系数(W)作为评分者信度的估计第三单元 信度与测验分数的解释一、解释真实分数与实得分数的相关 当rxx0.90时,则是实得分数中有90的变异是真分数造成的,仅10是来自测验的误差 信度系数同时告诉我们测量的误差比例是多少二、确定信度可以接受的水平 能力测验和成就测验的信度系数都是在0.90以上,有些可达0.95 人格测验、兴趣、态度、价值观等测验的信度一般在0.800.85或更高些 一般原则:当rxx0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较 当0.70rxx0.85时,可用于团体比较;当rxx0.85时,才能用来做鉴别或预测个人成绩或作为 另一原则:
21、新编的测验信度应高于原有的同类测验或相似测验三、解释个人分数的意义 从信度可以解释个人分数的意义,也是测量标准误的应用。作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形 一般采用95的或然水平,其置信区间为:X1.96SEXTX1.96SE 例:在一个智力测验中,某个被试的IQ为100,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准偏差为15,信度系数为0.84,则其IQ的测量标准误和可能范围分别为: SESX1rxx SE1510.84 SE6X1.96SEXTX1.96SE 1001.966XT1001.966 所以88XT112 则这个被
22、试的真实IQ有95的可能性落在88与112之间。即使再测一次他的智商低于88、高于112的可能性不超过5四、比较不同测验分数的差异 测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。包括两个人不同分数的差别和同一被试在两个测验上的差别。这是差异分数的标准误问题。其公式为:SEdS2rxxryy例:某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准偏差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否高于言语智商呢?SEdS2rxxryySEd1520.870.88SEd7.5将差异
23、标准误7.5乘1.96,结果为14.7,表明个体在韦氏测验两半得分的差异高于约15分,才能达到0.05显着差异的水平(在统计学上,要求两个分数的差异达到0.05以上,才能承认不是误差的影响)第四单元 影响信度的因素一、样本特征 (一)样本团体异质性的影响若获得信度的取样团体较为异质,往往会高估测验的信度,相反则会低估测验的信度 SE SE rxx1 则rxx大 若 rxx 1 则rxx小 SX(异质性大) SX(异质性小) (二)样本团体平均能力水平的影响 对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度二、测验长度 在一个测验中增加同质的题目可能使信度提
24、高 (一)测验越长,测验的测题取样或内容取样就越有代表性 (二)测验越长,被试的猜测因素影响就越小 测验过长是得不偿失的,反而会引起被试的疲劳和反感而降低可靠性 公式:Krkk(1rxx)rxx(1rkk) 例:一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,问至少需要增加多少题目? Krkk(1rxx)rxx(1rkk) K0.90(10.80)0.80(10.90) K0.900.200.800.10 K1.80.8 K2.5 即若要取得0.90的信度,测验长度应为原来的2.5倍,即需增加402.54060个题目三、测验难度 洛德提出在学绩测验中,为了保证其可靠性,各类选择
25、题的理想平均难度为:五择一测题0.70 四择一测题0.74;三择一测题0.77;是非题0.85四、以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大信度的特殊问题:一、对于速度测验,不存在评分者信度,只有分半信度不能按传统方法估计二、每个分测验有一个分数,据此可将它们组合为言语量表分、操作量表分和全量表分,以估计被试的言语智商(VIQ)、操作智商(PIQ)和总智商(FIQ)分测验分数几乎可以肯定不如合成分数可靠第四节 测验的效度第一单元 效度的概念一、效度的定义 在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或说是一个心理测验的准确性 就是一个测验对其所要测量的特
26、性测验到什么程度的估计STSESVSISE 有效方差 无效方差 (系统方差) STSVSI 在测验理论中,效度被定义为在一组测量中,与测验目标有关的真实方差(或称有效方差)与总方差的比率 SV rxy SX Rxy代表测验的效度系数,SV代表有效方差,SX代表总方差 测验的效度除受随机误差影响外,还受系统误差的影响二、效度的性质 (一)效度具有相对性:评鉴测验的效度时,必须考虑其目的与功能 (二)效度具有连续性:测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或 “全无”的区别,我们评价一个测验时,也不应说“有效”或 “无效”应说效度较高或效度较低表示 测验的有效性是针对测验结果
27、而言,即测验效度是“测验结果”的有效性程度信度和效度的关系一、信度是效度的必要而非充分条件高信度 高效度高信度 低效度低信度 低效度二、效度是受信度制约的SVSISE SVSISESVSISE 第二单元 效度评估的方法美国心理学会在1974年逤所发行的教育与心理测量之标准一书中将效度分为三大类:内容效度、构想效度和效标效度一、内容效度 (一)何谓内容效度 指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测验的行为领域的代表性取样,又称逻辑效度 如何编制较高内容效度的心理测验: 要对测量的心理特性有个明确的概念 测验题目应是所界定的内容范围的代表性取样 要求内容效度的测验,并不
28、一定要求测验为同质的 (二)内容效度的评估方法 专家判断法:请专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目代表了所测内容,则测验具有内容效度 为使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能不一致,可采用下列步骤: 定义好测验内容的总体范围 编制双向细目表 制定评定量来测量测验的整个效度 统计分析法:除描述性语言外,内容效度的确定也可采用一些统计分析方法,例: 计算两个评分者之间评定的一致性两个测验复本上得分之相关来作评估再测法也可用于内容效度的评估 经验推测法:通过实践来检验效度 (三)内容效度的特性 内容效度经常与表面效度混
29、淆。表面效度是由外行对测验作表面上的检查确定的,它不反应测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西 在编制测验时,表面效度是一个必须考虑的特性。如:最高行为的测验要求有较高的表面效度,使被试者有较强的动机,尽最大努力去完成;典型行为测验则要求较低的表面效度二、构想效度 (一)何谓构想效度 构想效度的概念是1954年提出的,也翻译为构思效度,也称结构效度 主要涉及的是心理学的理论概念问题,指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何 (二)构想效度的评估方法 对测验本身的分析 构思效度的证据:测验的内容效度
30、测验的内部一致性指标 分析被试者对题目的反应特点 测验间的相互比较 计算两种测验之间得分的相关,其中一个测验是有研究效度的,另一个是已有效度证据的成熟测验,但两者测验的是同一种心理特质。假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为,此相关称为兼容效度 构思效度的证据:相容效度、区分效度、因素分析法 效标效度的研究证明 实验法和观察法证实三、效标效度 (一)何谓效标效度 效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标 根据效标数据是否与测验分数同时获得,又可分为:同时效度:测验所得的分数可与效标同时验证,如:
31、智力测验以学生当时的成绩为效标预测效度:效标数据通常需要一段时间才可收集到,如:高考的效度 一个好的效标必须具备的条件: 效标测量本身必须有效 效标必须具有较高的信度,不随时间等因素变化 效标可以客观地加以测量,可用数据或等级来表示 效标测量的方法简单,省时省力,经济实用 (二)效标效度的评估方法相关法:是评估效标效度最常用的方法,是求测验分数和效标数据间的相关 最常用积差相关法,也可用点二列相关公式或二列相关公式及贾斯朋多系列相关公式区分法:是检验测验分数能否有效区分由效标所定义的团体的一种方法 当团体较大时,平均数间的小差异在统计上也变得有意义,但测验区分这些团体的实际价值很小,所以应该分
32、析高分组与低分组分布的重叠量 还可计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差命中率法:当测验用来作取舍的依据时,用其正确决定的比例作为效度指标的一种方法 命中:预测成功实际也成功、预测失败实际也失败失误:预测成功但实际失败、预测失败而实际成功、 方法:计算总命中率(PCT)、计算正命中率(PCP)第三单元 效度的功能一、预测误差 测验的效度是0.80,则测验的总方差中有64的方差是测验分数的方差 SestSy1rxy rxy代表效度系数的平方,即决定系数;Sy为效标成绩的标准偏差 当效标完美时(即rxy1.00)估计标准误是零,测验分数可完全代替效标;当测
33、验效度为零,估计标准误与效标分数的分布标准偏差相同(SestSy)二、预测效标分数 Y对X的回归方程:YabyxX Y是预测的效标分数;a是综轴的截距,用来纠正平均数的差异;byx是斜率,是Y向X回归的系数;X为测验分数三、预测效率指数 K1rxy E100(1K) E值大小表明使用测验比盲目猜测能减少多少误差,例如一个测验的效度系数为0.80,那么K10.80 0.60 所以E40这表明预测误差仅为随机猜测所产生误差的60;亦即由于使用该测验,使我们在估计被试的效标分数时减少了40的误差第四单元 影响效度的因素一、测验本身的因素 要保证测验具有较高效度,要做好以下几点: (一)测验材料必须对
34、整个内容具有代表性 (二)测题设计时应尽量避免容易引起误差的题型(如是非题) (三)测题难度要适中,具有较高的区分度 (四)测验长度要恰当,即要有一定的测题量 (五)测题的排列按先易后难顺序二、测验实施中的干扰因素 (一)主试的影响因素:测验情境,如场地布置、材料的准备、测验场所有无噪音和其它干扰因素也会影响测验的效度 (二)被试的影响因素三、样本团体的性质 (一)样本团体的异质性 与信度系数一样,如其它条件相同,样本团体越同质,分数分布范围越小,测验效度就越低 以下情况会影响样本团体的异质性: 只以选拔上的被试为样本团体参加效度研究,降低了测验的效度 选拔标准太高,样本团体的同构型增加,降低
35、了测验的效度 (二)干涉变量 对不同性质的团体,同一测验的效度会有很大不同 这些性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征 由于这些特征的影响,使测验对于不同的团体具有不同的预测能力,测验学上称这些特征为干涉变量 美国心理学家吉赛利提出如何找出干涉变量的方法: 利用回归方程求每个人的预测效标分数,将该分数与实际效标分数比较,获得差异数D。 若D的绝对值很大,说明测验中可能存在干涉变量根据样本团体的组成分析,找出对照组,分别计算效度,找出干涉变量对于预测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。 对于预测性高的团体获得的测验效度会有所提高四、效标的性质 效标与测验分数之间的关系是否线性关系是很重要的一个因素 皮尔逊积差相关系数的前题是假设两个变量的关系是线性的分布 效标测量的可靠性即效标测量的信度第五节 项目分析测验的项目分析包括定性分析和定量分析定性分析:考虑内容效度,题目编写的恰当性和有效性定量分析:对题目难度和区分度进行分析第一单元 项目的难度一、定义 难度:指项目的难易程度 在能力测验中需要一个反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标是通俗性 难度的指标以通过率表示,即以答对或通过该题人数百分比表示: R P 100 P代表项
限制150内