心理咨询师二级复习5-心理测量学知识(共17页).doc
-
资源ID:17104882
资源大小:103.50KB
全文页数:17页
- 资源格式: DOC
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
心理咨询师二级复习5-心理测量学知识(共17页).doc
精选优质文档-倾情为你奉上二级心理复习5:心理测量学知识第一节 概述第一单元 测量与测量表一、什么是测量对测量的描述正确的是,测量就是依据一定的法则用数字对事物加以确定。测量的元素包括:法则;数字;事物。测量所用数字具有自然数的特点,即具有:区分性;等级性;等距性;可加性。二、测量要素任何测量都应该具备的要素是:参照点;单位。(一)参照点:参照点就是确定事物的量时,计算的起点。参照点有两种,即:绝对零点;相对零点。参照绝对零点可加减乘除,参照相对零点只能加减(心理测量参照相对零点)。(二)单位:好的单位必须具备两个条件:确定的意义;相同的价值。心理现象既没有确定的意义,也没有相同的价值。心理测验的结果是有误差的,要用区间来解释,而不是用点来解释。三、测量量表定义:在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。斯蒂文斯(S.S.Stevens)将测量从低级到高级分成4种水平:命名量表;顺序量表;等距量表;等比量表。(一)命名量表:是测量水平最低的量表形式,只是用数字来代表事物或把事务归类。用1代表男,用2代表女等等,这样的量表通常叫命名量表。(二)顺序量表:比命名量表水平高,数字不仅指明类别,同时指明类别的大小或属性程度。我们通常将学生的考试结果按名次排队,这些名次属于顺序变量。在顺序量表中,变量具有等级。(三)等距量表:比顺序量表进一步,有相等的单位,其数值可以相互做加减运算;但没有绝对零点,因此不能做乘除运算。0并不意味着没有温度,这种说法对。(四)等比量表:最高水平量表,有相等单位又有绝对零点,所得的数字可以做加减乘除运算。其数值可以进行加、减、乘、除运算的量表是等比变量。一般说来,心理测量是在顺序量表上进行的,主要用于分等级和排序。斯蒂文斯的4种量表(水平从低到高)水平量表属 性可进行大小关系相等单位绝对零点1命名量表无无无标记和分类2顺序量表有无无分等级和排序3等距量表有有无加减运算4等比量表有有有加减乘除运算第二单元 心理测量的基本概念一、心理测验的定义正确的说法是,心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。二、心理测验的性质心理测验具有独特的性质,即具有:间接性;相对性;客观性。相对性属于心理测验的重要性质。影响心理测量客观性的要素是:测验刺激的客观性;对反应的量化的客观性;对测验结果的推论的客观性。测验的客观性不包括绝对的标准的客观性。第三单元 心理测验的分类一、按测验的功能分类按测验的功能进行分类,可将测验分为:智力测验;特殊能力测验;人格测验。二、按测验材料的性质分类按测验材料的性质分类,可将测验分为:文字测验;操作测验。三、按测验材料的严谨程度分类按测验材料的严谨程度分类,可将测验分为:客观测验;投射测验。刺激没有明确意义,对被试反应没有明确规定的心理测验,称之为投射测验。投射测验的主要特点是刺激材料的意义是不明确的。四、按测验的方式分类按测验的方式分类,可将测验分为:个别测验;团体测验。团体测验始于第一次世界大战,陆军甲种和乙种智力测验是第一个团体测验。五、按测验的要求分类按测验的要求分类,可将测验分为:最高作为测验;典型行为测验。心理测验的分类分类原则测验种类测验实例按功能分类智力测验特殊能力测验人格测验比内一西蒙智力测验;斯坦福一比内智力量表;韦氏儿童成人智力量表升学、职业指导,特殊工种人员筛选,临床较少MMPI、16PF、EPQ、罗夏、主题统觉(TAT)(0308-3-191)按材料性质分类文字测验操作测验MMPI、EPQ、16PF、韦氏智力量表中的言语量表罗夏、TAT、瑞文测验、韦氏智力量表中的操作量表按材料严谨程度分类客观测验投射测验绝大多数心理测验均属此类罗夏、主题统觉、自由联想、句子完成按方式分类个别测验团体测验比内一西蒙智力量表;韦氏智力量表;不能用于团体陆军甲种乙种测验;教育成就测验;团体测验可个别实施,如MMPI、EPQ、16PF等按要求分类最高作为测验典型行为测验智力测验、成就测验均属最高作为测验各种人格测验均属典型行为测验第四单元 纠正错误的测验观一、错误的测验观错误的测验观包括:测验万能论;测验无用论;心理测验即智力测验。错误的测验观不包括“以上一个也不是”。二、正确的测验观正确的测验观包括(习题137):心理测验是重要的心理学研究方法之一,是决策的辅助工具;心理测验作为研究方法和测量工具尚不完善。第五单元 心理测验在心理咨询中的应用我国目前心理门诊中运用较多的心理测验有:智力测验;人格测验;心理评定量表。一、智力测验我国修订后的韦氏智力量表包括:龚耀先等修订的韦氏成人智力量表WAIS-RC;韦氏儿童智力量表C-WISC;韦氏幼儿智力量表C-WYCS1。林传鼎等修订的韦氏儿童智力量表WISC-CR二、人格测验 目前应用较多的有:艾森克人格问卷(EPQ)、卡特尔16种人格因素问卷(16PF)、明尼苏达多项人格调查表(MMPI)等。三、心理评定量表 主要包括精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。第六单元 心理测量的发展史一、科学心理测验的产生与发展英国生物学家和心理学家高尔登(F.Galton)的主要贡献有:提出人的不同气质特点和智能是按身体特点的不同而遗传的;为了研究差异的遗传性,设计了测量差异的方法;为心理测验奠定了统计学基础,第一个提出了相关的概念。美国心理学家卡特尔(J.M.Cattell)对促进心理测验发展做出的巨大贡献是:使心理测验首次出现于心理学文献中;认为心理学应立足于实验和测验;认为心理测验应有统一的标准。比内(A.Binet)编制了世界上第一个正式的心理测验。20世纪以后,心理测验在如下几方面取得了长足发展:操作测验;团体智力测验;能力倾向测验;人格测验。20世纪在智力测验方面的新发展是研发了:罗夏测验;团体测验;操作测验;投射测验(P335)。有关心理测验的发展史,正确的描述是中国的科举制度是世界上较早的心理测验的实践。二、现代心理测验在我国的发展近些年来,我国心理学家正在致力于心理测验的本土化研究。第二节 测验的常模第一单元 常模团体一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。常模团体的选择一般包括:确定一般总体;确定目标总体;确定样本。二、常模团体的条件常模团体的条件包括:群体构成的明确界定;对群体具有代表性;样本量大小要适当;具有新近性(标准化样组是一定时空的产物)。抽样方法不是常模团体的条件。(一)群体的构成必须明确界定(二)常模团体必须是所测群体的代表性样本(三)样本大小要适当实际工作中,样本量大小适当须从如下几方面考虑:经济;实用;减少误差。常模样本量的大小,一般最低不小于30或 100。全国性常模,样本量一般要在20003000之间。样本大小适当的关键是样本要有代表性。(四)标准化样组是一定时空的产物三、取样的方法抽样的方法一般有:简单随机抽样;系统抽样;分组抽样;分层抽样。取样是指从目标人群中选择有代表性的样本。随机号码表法是简单随机抽样。系统抽样要求:目标总体无序可排;无等级结构存在。系统抽样法的关键是计算组距。先将群体分组,再在组内进行随机取样的方法是分组抽样。四、常模分数与常模(一)常模分数定义:常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。常模分数又叫导出分数。导出分数的特性:与原始分数等值;具有意义;等单位;具有参照点。(二)常模常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。对于某些特殊的群体来说,情况很具体而特殊,我们就需要制定特殊常模。常模表示一种最简单、最基本的且常用的呈现常模资料的方法。它的构成要素为:原始分数;导出分数;对常模团体的有关具体描述。第二单元 常模的类型一、发展常模发展常模就是年龄量表。在年龄量表中,个人的分数指出了他的行为在按正常途径发展方面处于什么样的发展水平。(一)发展顺序量表发展顺序量表可以告诉人们某儿童的发育与其年龄相比:超前;滞后;正常。最早的一个发展顺序量表的范例是葛塞尔发展程序表。葛塞尔发展程序表,其中按月份显示儿童在如下几方面的大致发展水平:运动水平;适应性;语言。社会性。按照葛塞尔研究的婴儿行为变化的顺序,16周的婴儿能使头保持平衡。皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对守恒概念的研究。皮亚杰发现,儿童在不同时期出现不同的守恒概念,通常儿童到5岁时才会理解质量守恒;6岁时才会掌握重量守恒;7岁时才具有容量守恒概念。发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。所以,它的基本要素是:一组可以区分不同年龄组的题目;一个常模团体;常模表。最直观的发展常摸是发展顺序量表。(二)智力年龄比内一西蒙量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫智力年龄,简称智龄。在吴天敏修订的比内一西蒙量表中,某儿童通过了 4岁组的全部题目,5岁组通过3题,6岁组通过2题,7岁组通过1题,其智龄为5岁。用陆志韦修订的比内西蒙量表做测验,某儿童6岁组题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为7岁6 个月。(三)年级当量常模样本中6年级的算术平均分为35,某儿童在算术测验中得35分,那就是说,该儿童的算术年级当量是6年级水平。二、百分位常模百分位常模包括:百分等级;百分点;四分位数;十分位数。(一)百分等级一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。55的百分等级表示在常模样本中有55的人比这个分数低。王红在 30名同学中物理成绩是 80分,排列第五名,则其百分等级为85。(二)百分点在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。高考的最高分为650,其百分等级为100,最低分为105分,百分等级为1,要录取20的学生进入大学,百分等级为80的百分位数540。(三)四分位数和十分位数四分位数是将量表分成四等份,相当于百分等级的25、50和75对应的三个百分数分成的四段。十分位数110为第一段。三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。常见的标准分数有Z分数和:Z分数;T分数;标准九分数;离差智商。标准分数可以通过线性转换和非线性转换得到。(一)线性转换的标准分数Z(X)/SD式中 SD为样本标准差。X为任一原始分数,为样本平均数。ZABZ式中Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。(二)非线性转换的标准分数当原始分数不是常态分布时,也可以使之常态化,这一转换过程是非线性的。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。当以50为平均数,以10为标准差来表示时,通常叫T分数。最早使用T分数者是麦柯尔。注:未见教材中描述。标准九分是一种标准分数系统,其量表是个9级的分数量表。它是以5为平均数,以2为标准差的一个量表。标准十分,平均数为5,标准差为1.5。标准二十分,平均数为10,标准差为3。常用标准分数标准分数平均数标准差分数样本平均数样本标准差SD分数5010标准九分52标准十分5.51.5标准二十分103离差智商10015(韦氏)四、智商及其意义若儿童的心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在实践中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性。(一)比率智商比率智商(IQ)被定义为心理年龄与实足年龄之比。比率智商的计算公式是IQ(MACA)×100。不符合比率智商含义的说法是:心理年龄除以实足年龄所得的商数;实足年龄除以心理年龄所得的商数;被试成绩与平均数之差除以标准差所得的商数;被试成绩除以标准差所得的商数。由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄不同步增长,所以比率智商并不适合于年龄较大的被试者。(二)离差智商韦克斯勒将离差智商的平均数定为100,标准差定为15。离差智商的优点是:建立在统计学的基础之上;表示的是个体智力在年龄组中所处的位置;表示的是智力高低的一种理想的指标。离差智商表示的是个体智力在年龄组中所处的位置。IQ100十15Z100十15(X)SD是离差智商的计算公式。从不同测验获得的离差智商只有当标准差相同或接近时才可以比较。两种智商及其计算公式智 商计算公式比 率 智 商IQ(MACA)×100离差智商(韦氏)IQ100十15(X)SD第三单元 常模分数的表示方法一、转换表法最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的解释。二、剖面图法剖面图是将测验分数的转换关系用图形表示出来,从而可以很直观地看出被试者在各个分测验上的表现及其相对的位置。第三节 测量的信度第一单元 信度的概念一、信度的定义信度是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。信度只受随机误差的影响。在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,即rxxST2/ Sx2。二、信度的指标(一)信度系数与信度指数公式rxxrxT2ST2Sx2和公式rxTSrSx表明信度指数的平方就是信度系数。(二)测量标准误SESx公式中SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。从公式中可以看出,测量的标准误与信度之间的关系是:信度越低,标准误越大;信度越高,标准误越小。第二单元 信度评估的方法估计信度的方法一般有:重测信度;复本信度;内部一致性信度;评分者信度。一、重测信度使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。用重测法估计信度,最适宜的时距随测验的目的、性质和被试者的特点而异,一般是24周较宜,间隔时间最好不超过6个月。二、复本信度复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性。如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则称:重测复本信度;稳定与等值系数。复本信度的缺点有:如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题;对于许多测验来说,建立复本是十分困难的。三、内部一致性信度(一)分半信度分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。斯皮尔曼一布朗公式rxx2rhh/(1rhh)式中rhh为一半分数的相关系数,rxx为测验在原长度时的信度估计值。(二)同质性信度同质性信度主要代表测验内部所有题目间的一致性。KR20公式、KR21公式有别于克伦巴赫 a系数的是,它们只能用于是非题。四、评分者信度一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的正确的描述是:随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度;所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的;人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化;不同的信度反映测验误差的不同来源。第三单元 信度与测验分数的解释一、解释真实分数与实得分数的相关rxx为信度系数。下列情况属于极端情况:rxx0;rxx1.00。二、确定信度可以接受的水平确定可以接受的信度水平的一般原则是,当rxx0.70时,测验不能用于对个人做出评价或预测,而且不能作团体比较。0.70rxx0.85时,可用于团体比较;rxx0.85可用于个人和团体三、解释个人分数的意义信度系数在解释个人分数的意义时的作用是:估计真实分数的范围;了解实得分数再测时可能的变化情形。“大约有 95的可能性真分数落在所得分数±1.96SE的范围内,或有5的可能性落在范围之外”的描述,其置信区间为X1.96SE XT X1.96SE。四、比较不同测验分数的差异甲被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和 0.88,那么甲被试的操作智商不显著高于言语智商。第四单元 影响信度的因素一、样本特征一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度。二、测验长度一般来说,在一个测验中增加同质的题目,可以使信度提高。下列描述中正确的是:测验越长,测验的测题取样或内容取样就越有代表性;测验越长,被试者受猜测因素的影响就越小;测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。一个包括 40个题目的测验信度为 0.80,欲将信度提高到 0.90,通过斯皮尔曼一布朗公式的导出公式计算出至少应增加50个题数。教材(P355)和习题74均错:K=0.9(1-0.8)/0.8(1-0.9)=2.25,即要取得0.9的信度,测验长度应为原来的2.25倍(而不是2.5倍),即需增加40×2.2540=50,习题74的正确选择应为(姜长青)。三、测验难度对于不同平均能力水平的团体,题目的难度会影响信度系数。洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;二择一题,0.85。四、时间间隔以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。第四节 测验的效度第一单元 效度的概念一、效度的定义在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率。二、效度的性质效度具有两个性质:相对性;连续性。效度具有相对性,因此,在评鉴测验的效度时,必须考虑测验的目的与功能。专栏5-4 信度和效度的关系 信度与效度的关系可表述为:信度是效度的必要而非充分条件;效度是受信度制约的。第二单元 效度评估的方法美国心理学会在1974年发行的教育与心理测量之标准一书中将效度分为几个大类:即:内容效度;构想效度;效标效度。一、内容效度(一)什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。(二)内容效度的评估方法内容效度的评估方法有:专家判断法;统计分析法;经验推测法。1专家判断法专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。因此,内容效度有时又称逻辑效度。为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能不一致,可采用的步骤是:定义好测验内容的总体范围;编制双向细目表;制定评定量表来测量测验的整个效度。2统计分析法除了描述性语言外,内容效度的确定也可采用一些统计分析方法,如:计算两个评分者一致性;复本相关;再测法。3经验推测法(三)内容效度的特性在编制测验时,效度是重要的要考虑的特性。如果是编制最高行为测验,除了内容效度,也要求有较高的表面效度。相反,典型行为测验却要求较低的表面效度。二、构想效度(一)什么是构想效度构想效度是:构思效度(结构效度);主要涉及的是心理学的理论概念问题;指测验能够测量到理论上的构想或特质的程度;测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。(二)构想效度的估计方法构想效度的估计方法包括:对测验本身的分析;测验间的相互比较;效标效度的研究证明;实验法和观察法证实。1对测验本身的分析可以作为构思效度证据的有:测验的内容效度;测验的内部一致性指标;分析被试者对题目的反应特点。2测验间的相互比较可以作为构思效度的测验间比较的有:相容效度;区分效度;因素分析法。计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。这种方法叫相容效度。3效标效度的研究证明4实验法和观察法证实三、效标效度(一)什么是效标效度又称实证效度。效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。它可分为:同时效度;预测效度。在检验一个测验的效标效度时,难点在于找到合适的效标。因此效标的选择至关重要,一个好的效标必须具备如下条件:效标必须能最有效地反映测验的目标,即效标测量本身必须有效;效标必须具有较高的信度,稳定可靠,不随时间等因素而变化;效标可以客观地加以测量,可用数据或等级来表示;效标测量的方法简单,省时省力,经济实用。(二)效标效度的评估方法效标效度的主要评估方法有:命中率法;区分法;相关法。1相关法相关法是求测验分数与效标资料间的相关,这一相关系数称为效度系数。根据变量的不同,可选用的计算方法有:积差相关法;点二列相关公式;二列相关公式;贾斯朋(Juspen)多系列相关公式。2区分法区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3命中率法命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中的情况是指:预测成功而且实际也成功;预测失败且实际上也失败。第三单元 效度的功能一、预测误差效度系数的实际意义常常以决定系数来表示,如测验的效度是 0.80,则测验的总方差中有64的方差是测验分数的方差。如果某测验的效度是0.70,则在测验中无法作出正确预测的比例是0.51。SestSy中,rxy2代表效度系数的平方,即决定系数,Sy为效标成绩的标准差。二、预测效标分散Y a + bxy式中Y是预测的效标分数三、预测效标指数预测效率指数 E值的大小表明使用测验比盲目猜测能减少多少误差。如一个测验的效度系数为 0.80,E40,这表明由于该测验的使用,使得我们在估计被试者的效标分数时减少了40的误差。第四单元 影响效度的因素一、测验本身的因素要保证测验具有较高效度,测验本身的因素要做到:测验材料必须对整个内容具有代表性;测题设计时应尽量避免容易引起误差的题型(如是非题);测题难度要适中,具有较高的区分度;测验长度要恰当,测题的排列应先易后难。二、测验实施中的干扰因素测验实施中的干扰因素包括:主试者的影响因素;测验情境;其他干扰因素;被试者的影响因素。三、样本团体的性质(一)样本团体的异质性如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低。(二)干涉变量样本团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征。由于这些特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量。美国心理学家吉赛利(E.E.Ghiselli)提出了如何找出干涉变量的一套方法,它们是: 用回归方程求得每个人的预测效标分数,将该分数与实际效标分数相比较,获得差异分数D。如果D的绝对值很大,说明测验中可能存在干涉变量; 根据样本团体的组成分析,找出对照组,分别计算效度,从而找出干涉变量; 对于欲测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体,获得的测验效度会有所提高。四、效标的性质效标与测验分数之间的相关,用皮尔逊积差相关系数的前提是假设两个变量的关系是线性的分布。效标测量本身的可靠性如何亦是值得考虑的一个问题。效标测量的可靠性即效标测量的信度。第五节 项目分析第一单元 项目的难度一、定义难度是指项目的难易程度。用P代表。P值越大,难度越低。在能力测验中通常反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标称通俗性。在200个学生中,答对某项目的人数为120人,则该项目的难度为0.6。二、计算方法(一)二分法记分的项目计算项目难度的公式如下:PR/N×100;P(PHPL)/2;PX/Xmax×100。在370名被试者中,选为高分组和低分组的被试者各有100人,其中高分组有70人答对第1题,低分组有40人答对第1题,则第1题的难度为0.55。吉尔福特为了平衡机遇对难度的影响,提出的难度校正公式是Cp(KP-1)/(K-1)。(二)非二分记分的项目数学测验的第7题满分为15分,该题考生的平均得分为9.6分,则该题的难度为0.64。三、难度水平的确定(一)项目的难度难度P值越接近于0或接近于1,越无法区分被试者之间能力的差异。相反,P值越接近于0.50,区别力越高。为了使测验具有更大的区别力,应选择难度在0.50左右的试题比较合适,各题难度应在0.50±0.20之间。(二)测验的难度1.受测者样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分布。2.最好使测验中所包含的试题的难度在0.50±0.20之间,平均难度接近0.50.第二单元 项目的区分度一、定义项目区分度也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。二、计算方法(一)鉴别指数鉴别指数的计算步骤为(2-1-3-4):(1)确定高分组与低分组,每一组取答卷总数的27;(2)按测验总分高低排列答卷;(3)分别计算高分组与低分组在该项目上的通过率或得分率;(4)按下列公式估计出项目的鉴别指数:DPHPL。1965年,美国测验专家伊贝尔(L.Ebel)根据长期的经验提出用鉴别指数评价项目性能的标准,鉴别指数D为0.19以下,说明该项目差,必须淘汰。(二)相关法计算区分度最常用的方法是相关法,常用的相关法有:点二列相关;二列相关;相关;积差相关。1点二列相关:点二列相关适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。2二列相关:二列相关适用于两个连续变量,但其中一个变量被人为分成两类的相关计算。3相关法:相关适用于两个变量均为二分称名变量的相关计算。三、区分度与难度的关系难度与区分度的关系,一般来说,较难的项目对高水平的被试者区分度高,中等难度的项目对中等水平的被试者区分度高。项目难度的分布一般以常态分布为好,这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试者具有较高的区分能力。第六节 测验编制的一般程序第一单元 测验的目标分析一、测验的对象在编制测验前首先要明确测量的对象,也就是该测验编成后要用于哪些团体。只有对受测者的如下几方面心中有数,编制测验时才能有的放矢:年龄;受教育程度;社会经济水平;阅读水平。二、测验的用途测验用途不同,编制测验时的取材范围以及试题难度等也不尽相同。在测验编制前就应明确所编出的测验是要对被试者做:描述;诊断;选拔;预测。(一)显示性测验显示性测验是指测验题目和所要测量的心理特征相似的测验。古德纳夫曾经将其分为样本测验和标记测验。(二)预测性测验三、测验的目标心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。心理测验的目标分析以测验不同而异,一般可分为:工作分析;对特定概念下定义;确定测验的具体内容。对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体分析,我们称之为任务分析或工作分析(job analysis)。这种分析包括如下步骤:确定哪些心理特征和行为可以使要预测的活动达到成功;建立衡量被试者是否成功的标准,这个标准我们称之为效标。第二单元 测题的编写一、搜集资料心理测验题目的来源应该排除直接翻译国外测验的题目。题目来源分为三方面:已出版的标准测验;理论和专家的经验;临床观察和记录。二、命题的一般原则心理测验命题的一般原则可以从几方面来考虑:内容;文字;理解;社会敏感性。(一)内容方面心理测验命题在内容方面的主要要求是:内容符合测验的目的;避免贪多而乱出题;内容取样要有代表性;题目间内容相互独立。(二)文字方面心理测验命题在文字方面的主要要求是:使用准确的当代语言;语句简明扼要;排除与答案无关的因素;最好是一句话说明一个概念。(三)理解方面心理测验命题在理解方面的主要要求是:有确切的答案;除创造力测验和人格测验外不应具有引起争议的可能;内容不要超出受测团体的知识水平和理解能力;格式要不被人误解。(四)社会敏感性方面有些测验必须涉及一些社会敏感性问题,菲力普(Phillips,D.L)列举了值得参考的几个策略:命题时假定被试者具有某种行为;命题时假定规范不一致;指出该行为是常见的,虽然是违规的。三、测题的编制要领(一)选择题选择题要编好题干,也要编好选项,必须注意:题干问题明确,避免与选项用词一致;选项简明扼要,长度相等;每题只给一个正确答案;选项最好用同一形式。(二)是非题编制是非题应注意:内容以有意义的概念、事实或基本原则为基础;每道题只能包舍一个概念;尽量避兔否定的叙述,尤其是双重否定;“是”、“非”题的数目应基本相等,随机排列。(三)简答题编制简答题的原则包括:宜用问句形式;填充形式的空格不宜太多;每题应只有一个正确答案。编制简答题的原则不包括将其操作化。(四)操作题编制操作测验的原则有:明确所要测量的目标,并将其操作化;尽量选择真实性程度较高的项目;指导语要简明扼要;制订评分标准,确定计分方法。第三单元 测验的编排和组织一、合成测验(一)选择与审定试题1选择试题的形式在选择题目形式时,需要考虑:测验的目的;材料的性质;接受测验的团体的特点;各种实际因素。2审定题目审定试题要注意题目的:范围应与测验计划的双向细目表相一致;数量要比最后所需的数目多一倍至几倍;难度必须符合测验目的的需要;说明必须清楚明白。(二)测题的编排测验编排的一般原则应排除答案混合排列。测验编排的一般原则包括:难度逐步上升,先易后难;将同类型的测题组合在一起;依各种类型测题本身的特点编排题目与选项。测题常见的排列方式有:并列直进式;混合螺旋式。二、预测与项目分析预测应注意:对象应取自将来正式测验准备应用的群体;实施过程与情境应力求与将来正式测验时的情况相近似;时限可稍宽一些,最好使每个被试者都能将题目做完;预测过程中,随时记录被试者的反应情形。三、信度和效度考察(一)信度 衡量测验质量最基本的指标,获得交稿的信度,是迈向目标的第一步。(二)效度 效度低,说明所测的东西不是它所要测的。四、常模制订 建立常模的方法是,在将来要使用测验的全体对象中,选择有代表性的一部分人(称标准化样本),对此样本施测并将所得的分数加以统计和整理,得出一个具有代表性的分数分布,即为该测验的常模。五、编写指导手册测验指导手册的内容有:第一,测验的目的和功用。第二,测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的。第三,如何实施测验的说明。第四,测验的标准答案或记分标准。第五,常模资料。第六,测验的基本特征。第七节 心理测验的使用第一单元 主测者的资格一、知识结构主试者的知识结构是指开展心理测验工作所必须具备的:心理学基础知识;心理学专业理论知识;本行业的专业知识;心理测验专业技能。二、专业理论知识和专业技能(一)专业理论知识主试者的心理测验专业理论知识,具体言之,包括:对心理测验的特点、性质和作用的认识;对心理测验局限性的认识;了解测验的基本特征;熟悉保证心理测验标准化的必要性。(二)专业技能主试者必须具有实际操作心理测验的专业技能和经验,接受严格、系统的心理测验专业训练,熟悉有关测验的如下方面:内容;适用范围;测验程序;记分方法。三、职业道德主试者的职业道德包括:测验的保密;测验的控制使用;测验中个人隐私的保护。心理测验的保密涉及到:测验内容;测验结果;个人隐私。第二单元 测验的选择选择测验必须注意,所选测验必须:适合测量的目的;符合心理测量学的要求。一、所选测验必须适合测量的目的二、所选测验必须符合心理测量学的要求第三单元 测验前的准备及注意事顶一、测验的准备工作测验前的准备工作主要包括:预告测验;准备测验材料;熟悉测验指导语;熟悉测验的具体程序。二、测验中主试的职责测验中主试者的职责是指:应按照指导语的要求实施测验;测验前不讲太多无关的话;主