《心理测量与评估.doc》由会员分享,可在线阅读,更多相关《心理测量与评估.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章 绪论第一节 心理测量与评估的基本概念1. 测量是按一定规则,给所考察对象在某种性质的量度系统上指定值的活动;或者说,测量就是按一定规则,用某种性质的量度系统上的数值来描述所考察对象特性的活动2. 量度系统:一叫名义量表;二叫顺序量表;三叫等距量表;四叫比例量表。3. 测量的要素有二:一是测量参照点,它或是绝对零点,或是相对零点;二是测量单位4. 在心理测量中,我们使用的却是测量的广义概念。5. 心理测量就是按规则给所考察对象的心理特性,在一定性质的量度系统,即量表上指定值的活动。6. 对人的心理特征的测量,大体可通过如下三条途径来进行:一是测量者的观察,在自然条件下或特定情境下的观察;
2、二是有被测量者自陈报告,在测量过程中的一边活动一边报告;三是借助周围人的观察,有这些人向主测者报告。7. 心理测量具有佳节性、相对性和主体间交往性的突出特点。间接性:首先,被测量对象得到心理活动,无论是他的感觉知觉,还是他的感情态度,都不是测量活动的主持者、施测者所能直接观察与了解的。其次,人的心里是世界物质发展到最高阶段的产物,个体的心理特征性既是相对稳定的,又是对人的行为活动起支配作用的,因而会在人的行为的各个方面不断表现出来。 相对性:心理测量的相对性是说,测量结果不能绝对化,要相对地来看待。这里有两层意思:一是内部心理特性与外显行为间不存在确定性函数关系,所以测量结果只有相对意义。二是
3、按心理测量对象本身的特性,测量结果大都只能在顺序量表上取值。交往性:首先,作为心理测量活动对象的受测者并非静止消极的,只单纯接受施测;相反,他要积极作用于测量活动本身。其次,测量活动所测的对象,是受测主体的心理特性,而主体具有能动性,所以应定要重视受测者在测量过程中的学习和迁移能力。第三,由于施受双方都是能动主题,处在同一发展层级上,因而,有时其施、受地位也可以互换,并非绝对固定。8. 心理测验是心理测量的一种,一般认为是行为样本的客观而标准化的测量。9. 心理测验定义所说的“行为样本”的意思有三:测验所直接测察的是个体的外部行为;这些外部行为应是所要测察的内部心理结构的代表性“行为样本”;所
4、测行为是否能够成代表性“行为样本”,要经实际检验由客观事实资料来确证。10. 标准化:标准化使所有测量活动走向科学化的共同要求 。就心理测量来说,标准化包括整个测验编制、施测与评分、分数解释等全部工作的标准化。首先,要求测验编制,即测量工具的标准化。是否经过项目分析和进行了信度、效度检验,是标准化区别于非标准化心理测量的重要标志。是否用检验指导书或测验手册来载明施测与评分时必须遵循的明确而规范的要求,也是标准化测验区别于非标准化心理测量的重要标志。总之,标准参照测验是否建立了“各等级能做什么”的说明书或表,长模参照测验是否建立了常模表,这是标准化测验与非标准化测量相互区别的又一重要标志。11.
5、 心理评估也是收集和整合有关人的心理特性、状况资料的活动。12. 总之,心理评估是通过多种途径与方法,使用多种工具来收集和整合资料的,而心理测量是只通过量化的方法,常在严格控制条件下使用标准化工具来收集资料的。因此,心理评估与心理测量是有区别的。从收集资料方法角度看,心理评估包括了测量与测验在内,但不限于测量和测验;它强调多种方法的综合运用,并强调不能把任何一种方法收集到的资料绝对化,虽然这种方法本身显得相当科学有据。心理评估要完成的根本任务,就是要“作出深入浅出的心理评价”。心理测量和测验只要求对人的心理现象得出量化的认识,而心理评估是要在量化与质性资料认识的基础上,进一步作出北平对象的心理
6、客观实况跟主体需要关系的适应情况到底如何、即揭示出其价值意义的活动。要不要进一步揭示价值意义、作出价值判断,也是心理评估与心理测量和测验的区别之一。心理评估的目的,在于为决策服务;即为诊断决策,为职业选择、治疗建议、教育计划的决策,乃至为司法决策(如儿童监护人确定,处罚刑量) 评估的区别13. 科学心理测验的诞生:现代科学的心理测验,是为满足现代工业生产、现代经济和社会发展学需要,在现代实验自然科学推动下,在科学的心理学思想指导下发展起来的。19世纪,欧美国家对智力落后者和精神病人开始尝到实行人道主义,随着社会日益关注智力有问题的个体,就需要某些统一标准来对其进行鉴定与分类,第一次错除了精神病
7、与智力落后的区分。另一位法国医生塞戈因的贡献也很重要,他是训练智力落后个体的先驱。这些对智力落后分类和训练的早期关注,为第一个科学的标准化测验,即比纳智力测验的诞生,奠定了重要基础。1879年冯特在莱比锡大学建立了第一个心理学实验室。但是,实验心理学要求严格控制实验条件以减少测量误差和尊重与强调客观性原则的做法,却促进了标准化心理测量的产生。英国生物学家高尔顿之中是个体差异和倡导心理测量运动的重要人物,他亲自设计了血多简单测验工具,如用于视觉长度辨别的高尔顿棒用于确定听觉的最高音频的高尔顿笛,用于测量动觉辨别的刻度砝码系列等。另外,他还是应用等级评定表、问卷法及自由联想技术的先驱,他发展了分析
8、个体差异资料的统计方法,在数理统计统计应用方面起了极大的推动作用。比高尔顿略晚的美国心理学家卡特尔是早期倡导心理测量的运动的又一重要人物。1890年,他在“心理”杂志上发表了心理测验与测量一文,使“心理测验”一词首次出现在心理学专业文献中。19世纪80年代是“高尔顿的十年”90年代是“卡特尔的十年”,那么进入20世纪后这头十年就属于比纳了,法国心理学家比纳多年来积极从事智力测量的研究,使用过包括测量头盖骨、手相等多种方法。比纳与其助手西蒙合作,编制成功了实际上第一个智力测验,即“比纳西蒙量表(1905)”14. 比纳西蒙量表的编制发行,标志了人类历史上科学的标准化心理测验的诞生的原因;第一,它
9、采用试验性测试办法,的到了项目(以及测验)的经实证检验的难度;第二,它在代表性被试验组基础上求取了常模(这里是年龄常模),这更是人类历史上所没有过的崭新科学概念;第三,在智力水平的测察上,它不再局限于只测感觉、知觉等低级心理过程,所以比纳蒙西量表是心理测验的基本要素的已确立,科学的测验开发编制过程有了范例。故而以此为典范,20世纪中大量标准化的智力、人格和学业成绩测验纷纷涌现,心理测量也就作为现代心理学的分支学科,由此得以建立。15. 按测验分数解释参照体系分类常模参照测验。参照体系是常模,即所测试被试团体在所测特性上实有水平的分布状态。标准参照测验。参照体系是社会的应有要求,即所设置的标准,
10、学业成就测验常属此类型投射测验。测验刺激无组织(如墨迹图),没有明确意义,问题模糊,对被试的作答内容要求并无明确规定;部分人格测验属此类型。16. 心理测验的最基本的功能,就是认识与鉴定人的心理的个别差异;其它功能都是由此而衍生出来的。(1)总之,心理测验的基本功能大体有:认识和鉴定个别差异的功能、描述的功能、诊断的功能、预测的功能以及评价功能。(2)就心理咨询辅导领域说,就会发挥出收集资料、作出评估与诊断、协助决策、对干预措施或指导建议作评价的等功能与作用。(3)至于教育领域,读者一般都比较熟悉,测验的运动和功能作用,建议自行做些分析。在科研领域中,测验可以发挥收集资料、实验分组、提出与检验
11、假设等作用17.对心理测验应有的正确看法,一是要认识到测验是心理学的重要研究方法,是决策的辅助工具。二是要认识到测验作为研究方法与测量工具尚不完善。18.如何正确使用测验要搞好测验工作,首先就要有合格的主试。主试是否合格时做好测验工作的关键所在。主试应该根据要解决的问题来选用合适的测验。他应该对拟选用的测验的效度、信度、难度水平以及常模的性质等有足够的了解,分析测验对特定目的的合适性,评估是有测验的技术优劣程度。主试不仅应该有较强的业务能力,还必须有良好的职业道德。介绍测验效能与测验结果时,必须提供真实和准确的信息,避免感情用事、虚假的断言和曲解。要尊重被试的人格和合法权益,对测量中获得的个人
12、信息要加以保密。要防止心理测验的误用与滥用,使其能正常地发挥出应有的功能,还有一个重要条件就是要切实对测验内容保密。第二章 心理测量中的统计技术1.按数据是否具有连续性,还可将数据分为离散性变量和连续性变量。称名变量和顺序变量都属于离散性变量。等距变量和比率变量都属于连续性变量。2.总体中所含个体的多少称为总体的规模,用N表示。样本中所含个体的多少称为样本容量,用n表示。个体数目超过30的样本称为大样本,等于或小于30的样本称为小样本。3.一组数据如测验分数的次数分布,至少有两个方面的特征:一是该组数据的中心位置在何处,二是改组数据的离散程度如何。一般来数,确定了这两个特征,就确定了一组数据的
13、分布形态。用来描述数据的集中趋势的特征量数称为集中量数;用来描述数据的离散程度的特征量数称为差异量数。集中量数包括算数平均数、中数、众数等。4.方差与标准差(1)方差,还可以求离差的平方(2)标准差5.集中量数和差异量数对数据分布形态的影响集中量数影响数据分布的位置:集中量数越小,则数据在数轴上的分布越靠左;集中量数越大,则数据在数轴上的分布越靠右。差异量数影响到数据分布曲线的“展形”或者说“胖瘦”:差异量数越小,则数据分布曲线越高瘦,分布的覆盖范围越窄;差异量数越大,则数据分布越矮胖,覆盖范围越宽。6.正态分布有以下性质:(1) 正态分布曲线是单峰对称的,以过平均数点的垂线为对称轴。(2)
14、正态分布曲线上平均数对应点最高,然后向两侧逐渐下降,不断靠近基线而无限延伸,但始终不与基线相交。(3) 正态分布曲线下的总面积为1,过平均数点的垂线将正态曲线下的面积划分为各是0.5的相等的两部分。服从正态分布的随机变量,在两个取值点之间变化的概率,就是通过这两个取值点的垂线之间曲线下的面积。(4) 正态分布曲线,根据其平均数、标准差的不同而有不同的分布形态。平均数决定曲线位置,标准差决定曲线的展形。标准差越大,曲线下部越宽广,看起来曲线形态就越矮胖;标准差越小,曲线下部的分布越向平均数靠近,曲线形态看起来就越高瘦。平均数为0,标准差为1的分布称为标准正态分布。(5) 正态分布曲线下,随机变量
15、在离开平均数多少标查距离内取值的概率,有一定的规律。7. 地位量数与标准分数反应次数分布中各数据所处地位的量,就叫地位量数。标准分数是一种重要的、在心理测量中用途极广的地位量数。标准分数又称Z分数,是原始分数。8.标准分数有如下性质(1) 标准分数的平均数为0,标准差为1.(2) 标准分数是原始分数的线性转换结果,其分布形态和原始分数分布形态完全相似。(3) 标准分数有正、负号与绝对值;正、负号表示原始分数大于还是小于平均数,绝对值表示原始分数对平均数的距离。(4) 如果原始分数呈正态分布或近似呈正态分布,查正态分布表可知,在正负3个标准差之间取值的概率即可能性为99.73;这就意味着原始分数
16、的绝大多数取值都在正负3个标准差之间。8.标准分数的应用(1) 明确每个原始分数在分布中的相对地位。(2) 比较两种测验成绩的优劣。(3) 计算被试接受不同测验后的总分数和平均数9.按数值变化的总趋势,相关关系又可分为正相关和负相关。正相关表现为当一个变量增大或减小时,另一个变量在总趋势上也增大或减小,两个变量变化方向的趋势相同。10.按两个变量联系的紧密程度,相关关系还可分为完全相关、高度相关、低度相关和零相关。11.差积相关系数是心理学研究中常用的相关系数之一。是英国统计学家皮尔逊提出的。12.分别用(总体相关系数)和r(样本相关系数)表示。相关系数的取值范围在+1和1之间。相关系数的正负
17、号表示相关的方向,正号表示正相关,负号表示负相关。第三章 测验的编制、实施与评分1.测验编制的一般程序(1) 确定测验目的。(2) 拟定测验编制计划。(3) 开发测验项目。(4) 预测与项目分析。(5) 合成测验。(6) 测验标准化。 测验内容标准化 实施过程标准化 相同的方法步骤a 相同的指导语b 相同的测验时间。测验时间限制是测验程序中的重要方面。(7) 测验质量的检验。(8) 编写测验手册。2.为了提高选择型项目的命题质量,需要注意以下几点:(1) 要根据测验目的和内容,选择最适当的题型。(2) 起干扰作用的错误备选项要编拟得“似是而非”错要错的合理,不要太过明显甚至离奇,这样才对被试具
18、有迷惑性。(3) 备选答案之间应避免相互重叠。(4) 备选答案要简明,必要的陈述应放在题干中。(5) 各个备选项在性质和形式上应该相互类同。(6) 不应将选项夹在题干中间,以免影响题干本身表述意义的完整性。(7) 各题的应选项位置应随机化,以免形成规律,为被试察觉。(8) 在一个选择型项目中,提供的选项愈多,猜对的可能性愈小,一般以四至五个备选项为宜。3.在编制判断项目时应注意以下几点(1) 在教育测验中,测试项目考核的应该是重要的概念或原理,避免无关或琐碎的细节;编写项目时,最好不要照抄原文。(2) 每个项目只包含一个重要观念,避免两个以上的观念出现在同一项目中,造成“无所适从”的情况。如果
19、两个观念都需测查,最好是改为两个项目。(3) 在人格、态度等测验中,避免食用作为解释理由的句子。(4) 不要用所有人都同意或都不同意的句子要求被试作出判断。(5) 每个项目的句子不要太长。(6) 避免使用可能导致歧义的词。(7) 避免使用未曾经过界定的限定词。(8) 最好使用肯定和否定的句子大致相同。4.主试需满足三个方面的要求才能较好的从事心理测验工作(1)心理测验的理论知识心理测量学的理论知识的掌握包括:对心理测量和测验的特点、性质、作用和局限性有充分认识;熟悉测验编制原理和测验标准化的要求与过程;懂得各种题型的基本功能,理解醒目分析的指标与技术原理;领会测验施测原则和控制误差的重要作用;
20、理解常模的含义和分数解释的应有要求;了解测验质量的基本要求,能把握测量信度、效度等心理测量学指标的含义等。(2)心理测验的专业技能心理测量是一门科学性和实践性很强的学科,所以光有理论知识还不能保证做好。(3)测验工作者的职业道德心理测验工作者的职业道德和医生的医德一样神圣,因为他们的工作对象都是人,与人的健康、工作、生活以及成长发展相关,影响到服务对象的切身利益。5.测验的准备(1)预告检测(2)准备好测验材料(3)熟悉测验的具体程序(4)确保满意合适的测验情况(5)协助被试做好准备6.影响被试作答反应的因素1)测验技巧.2)练习效应.3)教练测验4)应试动机5)测验焦虑6)反应定势7.如何看
21、待测验分数的意义1)主试应充分了解测验性质与功能2)对导致测验结果的原因,解释应慎重,谨防片面极端3)必须充分考察测验得效度和局限4)解释分数应参考其它相关资料5)对测验分数应以“一个区间分数”来对待,而不应以“特定的数值”来解释。6)对来自不同测验的分数不能直接比较。8如何向被试和有关人员报告测验分数1)使用当事人所理解的语言2)要保证当事人知道这个测验测量或预测了什么3)如果分数是以常模为参照的,就要是被试知道他是和什么团体进行比较。4)要是当事人认识到分数只是一个估计。5)要使被试知道分数将被如何运用。6)要考虑测验分数将给被试带来什么心理影响7)测验结果应向无关人员保密8)对低分者的解
22、释应谨慎小心9)报告测验分数时应设法了解被试心里的感受。第四章 项目分析与常模1.项目分析就是要对测验中每个项目的质量,都进行质和量两方面的分析评价,从而为筛选修改项目提供依据,为确保和改进整个测验质量服务。2. 二值积分项目的难度,通过率 P=RN P:表示该项目的难度值 R:表示答对该项目的人数 N:表示所测被试的总人数 高-低分组估计法 非二值积分项目的难度 3.项目难度对测验的影响:测验难度过大或过小,都会造成测验分数偏离正态分布;因此测验难度适中,一般来说是比较理想的状况。同时,测验难度也会影响测验的信度。过难或过易的测验,会使测验分数相对地集中在低分数端或高分数端,从而使分数分布的
23、全距缩小。由于信度系数实质上是相关系数,而第二章已经指出,相关系数的求取要受到分数分布范围的影响。分数分布范围较广,测验分数方差大,求出的相关之可能大,测验信度就会高;分数分布范围狭窄,测验分数方差变小,求出的相关值可能小,信度值就会低。4.区分度,又称项目鉴别力指数,一般用D表示。它是指项目得分对被试心理特质水平高低的区分鉴别性能,也即项目得分的高低与被试实际能力或特质水平高低的一致性程度。5.(!)根据难度筛选项目:项目难度为0.50左右时,测验的信度和区分能力都有可能达到高的水平。但这并不是说,组成测验的所有项目的难度都必须是0.50.一般要求测验项目的难度值可位于0.200.80或0.
24、300.70之间;同时,所有项目的平均难度则要求在0.50左右。另一方面,选择项目是还要考虑测验目的。(2)根据区分度筛选项目:项目区分度的提高会显著地提高测验的信度和效度。可见,区分度在0.30以上就比较理想了。但有些区分度在0.200.30之间的项目,如果能很好地体现测验目的,也用酌情予以保留。6.测验常模,简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态;但实际操作中则是指代表性被试样组在测验上得分的分布状态或分布形态。常模就可划分为发展常模和团体内常模两大类型。常用的发展常模有年龄常模、年级常模和顺序常模等;常用的团体内常模有百分等级常模与标准分数常模等。
25、7建立常模的一般步骤:1)确定有关的测试团体,并从中抽取有代表性的被试样组。2)对代表性被试样组进行合于标准化要求的测试,获得该被试团体成员在所测特质上足够而真实可靠的数据与测验分数。3)把原始分数转化为某种形式的导出分数,制作常模表,并给出使用说明。8.发展常模的种类:使测验分数具有意义的一种可能的方法,是通过对原始分数的变换来表明个体在正常发展途径上达到了怎样的发展水平。人的智力、技能等许多心理特质的发展都是和个体成长时间的延续有关的。因此,我们可以把个人的成绩和各类发展水平的人的成绩比较而制成的发展量表。9团体内常模的含义:常模有发展常模和团体内常模之分。团体内常模也称作组内常模,通常是
26、根据标准化被试样组的测验分数、经过统计处理而建立起来的、具有参照点和单位的测验量表。10.百分等级量表常模是一种说明被试测验分数在常模团体中相对低位的参照系统。这里,被试在测验上的实际得分是原始分数,原始分数所对应的百分等级是导出分数。11.百分等级常模的评价:(1)百分等级常模优点百分等级量表上的等级是一种相对地位量数,计算简单,具有可比性,也容易向被试作出解释,因而应用比较广泛。不同被试在同一测验上的百分等级可以相互比较其次,百分等级不受原始分数分布状态的影响再次,在较高侧词的被试团体中,当年龄或年级量表不适用时,可采用百分等级量表。(2)百分等级量表的缺点:首先,百分等级是一种顺序量数,
27、它的单位不等。所以,我们对它只能作相互之间的比较。其次,百分等级是相对于特定的被试团体而言的,所以,解释时不能离开特定的参照团体。两个不同样本中的百分等级不能相互比较。12.标准分数是一种具有相等单位的地位量数,又称Z分数。13.标准分数常模:标准分数常模就是用被试所得测验分数转换成标准分数来揭示其在常模团体中的相对地位的组内常模。14.常见的线性变换分数还有以下几种:(1)韦氏智力量表总各分测验的量表分:T=10+3Z(2)韦氏智力量表智商(离差智商):IQ=100+15Z(3)美国大学入学考试报告分数:CEEB=500+100Z(4)我国大学英语四级、六级考试分数:T=500+70Z15.
28、(1)全国常模:常模的建立是根据标准化被试样组实测结果计算而成,根据样本的大小和来源,通常有全国常模、区域常模和特殊常模。区域常模是全国常模必要的、有一段补充。(2)对于不少测验来说,通常还需要建立针对某一特殊群里的常模。第五章 测验的信度与效度1.信度就是测验抗干扰能力或者说所得结果一致性的指标。2.信度是衡量一个测验质量高低的重要指标之一。它的作用表现在:第一,反应测量过程中所存在的随机误差的大小,能有效的评价一份测验的可靠性程度。第二,用来解释个体测验分数的意义。第三,用来解释不同测验间的分数差异。3.重测信度指的是,用同一个测验对同一组被试施测两次时所得结果的一致性程度。4.复本信度指
29、的是,两个平行的测验测量同一批被试所得结果的一致性程度。5.同质性信度试纸测验内部所有项目间的一致性程度。项目间的一致性程度有两层意思:一是所有项目测的是同一种特质;而是指所有项目得分之间都具有较高的正相关。6.半分信度是指将一个测验分成平行对等的两半后,被试在这两半上所得分数的一致性程度。7.评分者信度指多个评分者给同一批被试的作答反应进行评分的一致性程度。8.对于一份测验,如果要求你评价测验的信度,你该怎么办?当我们要评价测验的信度时,首先要结合测验自身特点和评价目的来选择某一种或某几种信度系数。重测信度要求测验所测心理特性是稳定的,重测信度衡量的是测验跨时间的一致性,半分信度衡量的是测验
30、所测内容的一致性,评分者信度自然衡量的就是评分者间的一致性了。选定好了某一种或某几种信度系数后,就必选相应要求收集和整理数据。9.测量标准误是被试个体在大批平行测验上所得误差分数的标准差。10.对测验信度系数值的一般要求:一般原则是:当r0.70时,测验不能用于对个人作出评价或预测,而且不能作出团体间比较;当0.70r0.85时,可用于团体比较;当r0.85时,一般才可以用来鉴别或预测个人的成绩水平。对标准化的智力测验和学业成绩测验,常常要求其测验信度系数值大于0.90.11.影响测验信度的主要因素:(1)抽样误差对测验信度的影响:如果被试样本并不来自所测团体特质水平分布的整个全区域,而是来自
31、中部或高低两端一个很窄的区间,这样,作为基础数据的样本的测验分数,其全距和方差就会变小,求出的测验信度值就会低。因而,求取测验信度时,就要力求才、在被试团体的全距中取样。测验分数全距越宽,方差越大,测验信度系数值就有可能高。(2)随机误差对测验信度的影响:随机误差是由于测验编制、实施、评分中各种偶然因素所造成,其特点是它的出现是随机的,其正负与大小也是随机的。各种随机误差的存在使得测验结果的一致性受到影响,是影响测验信度的主要因素。导致随机误差产生的因素包括测验的长度、难度、区分度、测验内容、施测环境、评分者偏好、被试的状态等。12.提高测验信度的常用方法:(1)延长测验的长度。测验长度的增加
32、和测验信度的提高不是等比例的。在信度系数较小时,增加测验长度,信度系数增长较多;信度系数较大时,增加测验长度,信度系数增长较少。我们应当增加测验长度,使信度系数达到预期水准即可。新增加的项目要与原测验项目是同质的,且有相同难度。另外,增加测验长度不应使被试疲劳生厌而影响作答(2)控制测验的难度,提高测验的区分度。测验的难度影响测验分数分布的范围,当分数分布范围缩小时,信度也要降低。测验难度偏高或偏低,分数分布范围都会变小,只有当测验难度适中(0.5左右)时,分数分布范围才会大;此时,测验的信度也才可能高。测验信度随区分度的提高而增长,且信度增长的速度较区分度增长的速度更快。提高项目的区分度是提
33、高测验信度的一个好方法。(3)同质性高的测验信度高于同时测查多个不同特质的测验。(4)测验实施时严格按要求施测,努力争取被试的积极配合,测验评分严格按标准客观评定。13.效度:就是测验到它打算要测得心理特征的程度。14.效度与信度的关系:信度高效度未必好,效度好信度必定要高。高信度时高效度的必要条件,但不是充分条件;信度高的测验不一定效度高,但是效度高的测验信度一定要高。两者的关系式是:效度系数小于等于根号下信度系数15.内容描述的效度验证分析法:系统检查实际测到的内容与所要测量的内容之间的吻合程度;所验证分析出的有关效度的结论,通常称为内容效度.内容效度的验证分析方法,如前面第三章所述,常用
34、逻辑分析法.即依靠有关专家,对测验项目和测验结构作深入、系统、全面、严格的分析检查,对测验题目与应侧内容范围的吻合程度做出判断。判断内容效度的第二种方法是再测法。具体操作时,在传授某种知识之前对被试进行一次测验。判断内容效度的第三种方法是复本法。判断内容效度的最后一种方法是经验法。16.结构鉴别的效度验证分析法:结构鉴别的效度验证分析法是,分析和证实测验能够说明心理学上的理论结构或特质的程度;分析所得的有关效度的结论,通常称为结构效度。(1)逻辑分析法(2)发展水平的变化(3)与另一有较高结构效度的测验比较(4)与另一测验不同结构的测验相比较。(5)实验操作法(6)因素分析法17.效标预测的效
35、度验证分析法:校标预测的效度验证分析是,分析测验分数与作为校标的另一独立测量结果之间的一致性程度;分析所得的有关效度的结论,通常称为校标关联效度。测验外变量的取值就被称为校标,因为它是用来判断测验是否有效的标准。根据校标资料搜集时间的差异,校标关联效度又分为同时效度和预测效度两种。同时效度是指,所要验证效度的测验,其实测结果,与另一校标测量的数据资料,是大约同时获得的。预测效度是指,测验结果是用来对未来的行为或校标测量作出预测的,测验分数本身跟校标测量资料是一先一后获得的。18.效度系数:用来描述校标关联效度高低的相关系数。19.估计标准误:估计标准误指依据测验分数来估计校标测量值时的误差;即
36、具有同一预测源(x)值的所有被试所被估出的校标测量(y)值的标准差。20.影响测量效度的因素:(1)测验信度。信度是效度的必要而非充分条件;一个测验要想效度高,测验的信度必须高。因此,测验信度以及影响测验信度的种种因素,最后都能影响测验效度。测验的信度和效度,在对测验同质性的要求上却是不同的。同质性测验能获得较高的信度,但它的预测效度却可能会低。非同质性测验能获得较高的预测效度,但它的同质性信度又可能会不理想。(2)测验的构成。内容效度和结构效度要求组成测验的项目,要能较好地代表测验要册的内容和结构,测验中的项目数量也会影响到效度。(3)接受测验的被试。首先,被试的生理状态(如感冒、头晕等)以
37、及心理状态(如疲惫、焦虑、厌烦等)。都会影响到被试发挥正常水平,使测验分数有很大的随机误差,影响测验的效度。其次,同样的一个测验,对不同的被试团体,常具有不同的测量效度。被试团体的特征,如年龄(4)所选校标的性质。同一个测验可以有不同的校标,因此选择到合适的校标对于评价测验效度是非常重要的。第八章 心理卫生评定量表论述题1.提高测量效度的方法:(1)精心编制测验,避免出现较大的系统误差。(2)创设规范化的测试情景,妥善组织测验,控制随机误差。(3)选好正确的校标,准确地进行校标测量,力避校标污染,并正确地使用有关的统计方法进行分析。 22.心理卫生评估的任务、手段和作用(1)心理卫生评估的任务。心理卫生评估对象是人,包括病人和健康人,故评估的范围既涉及疾病,又涉及健康,而且更重视健康的评估。(2)心理卫生评估的手段。心理卫生评估方法众多,有传统医学检查方法,也有心理测量学技术,还有社会学及其他学科检测手段。(3)心理卫生评估的作用。心理卫生评估在不同领域的作用大同小异,概括起来有如下三方面:做决定、形成印象、核实假说。
限制150内