《《心理测量学》复习提纲整理(共10页).doc》由会员分享,可在线阅读,更多相关《《心理测量学》复习提纲整理(共10页).doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上一、测量与心理测量 n 重要概念1. 测量:测量是根据法则给予事物分派数字(Stevens S S,实验心理学手册,1951)亦即依据一定的法则使用量对事物的特征进行定量描述的过程。2. 测量的三要素事物的属性(测什么?)、法则、规则(如何测?即测量原理)、数字(测量结果)3. 心理测量(1)一般的定义:对心理特点(或心理学概念)的测量;(依据一定的心理学和教育学理论,使用测验对人的心理特质和教育成就进行定量描述的过程)(2)课本:根据一定的心理学理论,使用测验对人的心理特质进行定量描述的过程;(3)心理测量学的定义:布朗的定义:是指对一个行为样本进行测量的系统程序;
2、安娜斯塔西的定义:实质是对行为样本的客观可标准化的测量;(4)一种动作、过程;或是实施一组项目。心理测量就是根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。4. 心理测验: 进行心理测量的工具,其形式一般为一组题目与相应的评分标准。工具,包括问卷、测验、面试、评价中心等;或是一组项目 心理测验就是通过观察人的少数有代表性的行为,对贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段,是心理测量的一种工具和手段,是根据一定法则对人的行为用数字加以确定的方法。5. 心理评估: 更全面的测量,包括使用观察、访谈的方
3、法获得有关信息。6. 行为样本:心理测量的理论取向,即认为心理测量是对有代表性的部分行为进行测量。课本定义:从大量行为中抽取与欲测量的心理特质直接相关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质。这一组被抽取出来的、作为直接的测量对象的行为就是行为样本。内在要求:在测量和界定特定属性的行为时,心理测验并非要测量所有可能出现的行为;一个测验的质量主要是由样本的代表性所决定。7.标准化,即统一化,统一规格,一般指产品设计的各个方面测量标准化,主要指测验使用时的统一化,包括4个方面,可以考试为例;而测验(测量工具,主要是问卷)本身由于比较简单,因而无所谓标准化8.个别测验:同一主试
4、在同一时间内只能测量一个被试的测验p149.团体测验:同一被试在同一时间能够测量许多被试的测验p14n 思考题:1. 试述心理测量的特点?P8(1) 首先,心理测量依据的法则在相当一定程度上是一种理论,很难达到如同物理测量依据的法则那样普遍被研究者共同接受的科学水平;(2) 其次,心理测量的对象是人的心理特质和教育成就;(3) 再次,心理测量的量尺是由有关领域的专家经过长期的编制、试用、修订、完善而逐渐形成的标准化测验,它的编制是一项高度专门化的系统工作,要达到科学所要求的水平绝非易事;(4) 最后,心理测量的目标虽然是人的心理特质和教育成就进行定量分析,但这种定量分析的精确度远不及物理测量的
5、精确度。2. 试述心理测量的路线(取向)?心理测量的路线(取向):行为样本,即认为心理测量是对有代表性的部分行为进行测量3. 试述心理测量在科学研究中的重要性?实际生活中:社会生活的各个方面需要测量,我们处于一个数字化的科学研究上:一个概念若不能加以测量,就不是科学的概念;测量用于研究: 一个概念:现状研究;两个或两个以上概念:相关研究与实验研究4. 试述心理测验的一些重要分类?(1)按测验对象:认知测验(智力、能力倾向、成就)与人格测验;(2)按测验方式:A:个别测验与团体测验B:纸笔(电脑)、操作、口头C:自评,他评(3)按测验内容形式分A.文字与非文字 B.难度测验与速度测验、态度测验(
6、4)按测验功能(目的)分A.描述性测验(与现在状态相关联)B.诊断性测验C.预测性测验(5)按参照体系分A.标准参照测验(有个标准-可高可低)B.常模参照测验- (有个正常范围-平均水平 )二、心理测验编制心理测验原理之一 n 重要概念1、 概念界定:对待测的心理特点(或概念)进行定义,或界定(确定内容范围)清晰或科学地界定概念,防止伪概念;不同的概念界定就有不同的测量。2、 理论建构:即明确待编制量表的内容结构;不同理论就有不同的测量;3、 理论:理论有时也叫结构或模型。人们关于事物知识的理解和论述(百度百科)4、 量尺:测量学中把定有参照点和单位的数量连续体叫做量尺,一般叫量表,为避免混淆
7、,我们这里叫量尺。通俗题讲就是刻度。5、 特质论是心理测量的最基本理论,区别于认知心理学中的信息加工理论(过程论)补充:心理特质,表现在一个人身上所特有的稳定的行为方式n 思考题:1、 心理测验编制在制定编题计划(内容构思)上应该考虑哪些方面? 界定概念:清晰或科学地界定概念,防止伪概念。注意:不同的概念界定就有不同的测量理论建构:即明确待编制量表的内容结构。注意:不同理论就有不同的测量A.几个方面就是几个维度;举例:学生生活满意感量表、主观社会支持量表B.内容建构也即是理论建构:结构式理论C.要编一个新的量表,需要内容创新或理论创新 做好总体构思:A.做好理论研究工作;B.思考与见识;C.通
8、过观察、访谈完善有关理论(自下而上) 2、 心理测验编制在设计测试题目(题目编制)上应该考虑哪些方面?(1)透彻理解相关的心理概念(2)熟悉抽象概念的具体行为表现A.通过观察或访谈获得素材B.阅读,多参考别人的量表获得素材书本P134-135(1)收集测验资料资料要有普遍性。一是当编写智力类测验时,所收集的数据对于不同文化背景、不同经济地位、不同地区的个人能够或者团体应当是公平的,尽可能避免特殊知识经验对测验结果的影响;而当编制人格测验时,资料应当能够全面反映某一文化背景中的团体的基本人格特征。资料具有趣味性。减少受试者由于缺乏足够动机而引起的测量误差。资料全面。无论是能力或是人格,都是复杂的
9、复合性心理结构,必须包含许多不同类型的题目去测量。(2)选择项目形式选择项目形式时,要考虑受测者的年龄、测量的目的、题目的性质等因素。原则:受测者容易明白的测验方法使受测者不会因为题目形式不当而做错测验过程省时计分省时 经济(3)编写测验项目题目的取样应当对想要测的心理品质具有代表性,即题目能够真正反映测量对象的特征题目的取材范围要和编题计划所列项目的范围一致题目的难度应有一定的分布范围题目的用语要力求简练简短,浅显明了初编题目的数量要多于最终所需要的数量,以便筛选或者编制副本测验项目的说明必须简明3、 试述量尺的概念与组成要素?(1)测量学中把定有参照点和单位的数量连续体叫做量尺。与测量要素
10、中的法则有关。(2)量尺的要素:参照点(零点)和单位理想的量尺:有绝对的零点和相等的单位心理测验中量表没有绝对的零点,单位也可能不等 4、 试述量尺的分类?1) 按以数据的测量水平分A. 类别量表:仅区分类别B. 等级量表:同时区分等级、位次C. 等距量表:数量之间有相等的单位,但零点为相对零点,非绝对零点D. 等比量表:数量之间具有比例关系2) 按连续体的形式分A. 迫选量表(ForceChoice Scale): 如EPQB. Likert量表(总加量表):一种单维量表,假定所有项目同样重要,最后得分相加。C. Guttman(格特曼)量表(累加量表)D. Thurstone量表 (沙氏通
11、量表:最不赞同到最赞同方向分为若干类,譬如11类。)E. 语义区分量表(semantic differential scale):一种多维度量表(自信1-5不自信)F. 程度量表(临床)三、项目分析 心理测量原理之二 (1)n 重要概念1、难度:被试完成测验项目任务时所遇到的困难程度。2、区分度:测验对被试心理品质水平差异的区分能力(好的题目应该有不同答案,即反映被试的个体差异性)3、客观题:让考生从事先拟定的答案中辨认出正确答案的题目。(二分法,分类数据)P=R(答对项目的总人数)/N(全体被试数)4、主观题:是指那些能更好地考查学生具体情况或个性的试题。(非二分法,连续数据)P= X(平均
12、分)/Xmax(满分)l P值在01之间,靠近1越容易,靠近0越难;l 仅限于认知测验(智力测验、考试等);l 主观题的公式可以涵盖客观题。5、27%:极端组的划分方法-从样本中区分出高分组(top 27%)与低分组(down 27%)6、相关法:计算量表(或量表维度)的总分,然后计算每个题目与总分的相关系数;以项目分数与效标分数或测验总分的相关作为项目区分度分指标。D:当校标成绩是连续变量时,可以从分数分布的两端各选择27%的被试,分别计算出每道题目上各自的通过率,两者之差就是鉴别度指数(D),即D=PH-PL(高分组通过率-低分组通过率)说明:D值鉴别项目测量有效性的指标,D值越高,项目越
13、有效。D值大于 0.19的题目保留n 思考题:1、 项目分析的目的是什么? 通过施测,在实际数据基础上对测验中每个项目(题目)进行分析,删去不好的项目,使余下来的项目组(合)成的测验具有较好的质量。2、 项目分析的步骤是什么?1)选取样本,并施测,获得数据样本的代表性、样本的容量?P853) 指标计算项目分析难度仅用于认知测验(智力测验、考试等)、区分度3)确定哪些项目被删除(保留)4) 如何根据难度分析确定哪些项目须删去?单题:太难或太容易的题目去掉整卷:1 平均难度:p=0.52 正态分布(奥数等的竞赛题目不符合正态分布)5) 如何根据区分度分析确定哪些项目须删去?1) 相关法A. 计算量
14、表(或量表维度)的总分B. 计算每个题目与总分的相关系数C. 确定是否删除题目:相关系数较小者(一般是r小于0.3者)2)高分组低分组比较法(鉴别指数法)A. 从样本中区分出高分组(top 27%)与低分组(down 27%)B. 每个题目做t检验,差异显著且高分组得分大于低分组的题目可保留C. 或计算鉴别指数法D(D=PH-PL),D值大于 0.19的题目保留3)因素分析法:因素荷重(loading)小于0.3四、CTT与信度心理测量原理之二 (2)重要概念1、 系统误差(大小、方向确定,可加以控制)由与实验目的无关的变因而引起的一种恒定的而有规律的效应。往往是由测量工具的问题、研究人员的问
15、题等造成,永远往一个方向偏差,样本再大(甚至测总体)都无法解决。 2、 随机误差 (大小、方向不确定,难以控制控制,可想办法减少)由与测量目的无关的、偶然因素引起的而又不容易控制的误差。随机误差无规律,会影响测量的reliability(即不够精确),可以通过加大样本来减小随机误差,如样本大到与总体一样,random error=0,即所有随机误差互相抵消。 3、 真分数理论真分数(T):反应被试某种心理特质真正水平的数值(包含系统误差)观察分数:实测的分数由于测量误差的存在,实际测得的数值往往难以和该特质的真正水平值完全一致,它总会高于或略低于其真实水平值4、 信度:测量(工具)的可靠性或稳
16、定性程度,也是不受各种误差(随机误差)影响的程度5、 重测信度:用同一个量表对同一组被试施测两次所得结果的一致程度(同一测验先后测试两次 );其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数6、 内在一致性信度(同质性信度):测验内部所有题目间的一致性程度(一个测验所测内容或者特质的相同程度)两层含义:A. 所有题目测的是同一种心理特质B. 所有题目得分之间都具有较高的正相关7、 评分者信度:多个评分者给同一批人的答卷进行评分的一致性程度8、 测量的标准误SE:对一个团体(人数足够多)两次施测的结果以估计测量误差的变异数,每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准
17、差就是测量的标准误。补充:测量误差:在测量过程中,由那些与测量目的无关的变化因素所产生的一种不准确或者不一致的测量效应(即测量过程中,由于种种原因,测量结果与真实值之间的不同)思考题:1、 试述CTT理论的基本思想? 假设:观察分数(X)和真分数(T)之间是一种线性关系,并只相差一个随机误差(E)数学模型:X=T+E(X为观察值 ;T为真分数 ; E为随机误差)认为E是个随机误差,没有包含系统误差,是个服从均值为零的正态分布的随机变量。推论:S2X =S2T + S2ES2T =S2v + S2I (考虑到系统误差I)S2X =S2v + S2I+ S2E相关联的假设公理:(1) 多次测量的误
18、差平均数为零(若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数)(为了说明E为是个服从均值为零的正太分布的随机变量。)(2) 真分数与误差分数之间的相关为零(为了说明E为随机误差)(3) 各个平行测验上的误差分数之间的相关为零(为了说明E为随机误差)补充:平行测验:如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体所得出的分布都是一致的,则这两个测验被称作彼此平行的测验。而实际操作中,是用一个测验来测查许多被试,当被试团体足够大时,团体内部的各种随机误差会相互抵消,整个团体的观察分数的均值会趋近于该团体真分数的真是,
19、那么多个被试接受同一个测验相当于多个平行测验反复测查一个具有团体真分数均值的一个个体。2、 试述两类测量误差的特点?(1) 随机误差的特点:大小和方向都不固定,也无法测量或校正。随机误差的性质是:随着测定次数的增加,正负误差可以相互低偿,误差的平均值将逐渐趋向于零。由与测量目的无关的,偶然因素引起的而又不易控制的误差。(2) 系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化,具有重复性、单向性。我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。大小、方向固定,可加以控制。系统误差只影响测量的准确性,不影响稳定性。而随机误差既影响稳定性又
20、影响准确性。3、 试述重测信度(或内在一致性信度)的含义、评估步骤?重测信度含义:用同一个量表对同一组被试施测两次所得结果的一致程度(同一测验先后测试两次 ),其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。(此信度的使用前提-所测的心理特质是稳定的。)评估步骤:A. 用同一测验对同一组被试先后测试两次(选取样本具有代表性,两次测量时间间隔最好相差至少7天)B. 得出同一组被试两次测验的分数C. 进行皮尔逊积差相关系数的分析,当相关系数较大时,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。量表测验被试间隔一段时间同一量表第二次测验
21、相同被试两次测验结果一致性比较内在一致性信度(同质性信度)含义:测验内部所有题目间的一致性程度(一个测验所测内容或者特质的相同程度)评估步骤:A. 同一个测验测一次B. 用系数进行评估,系数越高,一致性越好4、试述提高测量信度的方法?减少误差角度(或误差的来源)来看三个误差来源:(1) 测验本身:可以增加项目(测验长度);项目难度接近正态;提高项目的区分度;取样:根据测验目的选择被试A. 重测信度:题目简单明了,有确定的含义(没有歧义)。时间间隔不要太长B. 内在一致性信度:注意项目在反映内在概念上的一致性(2) 测验情境、主试,过程是否规范(3) 被试状态第四个因素:样本(测量):有代表性,
22、即能反映总体;有足够的样本容量五、效度心理测量原理之二 (3)n 重要概念1. 效度:指测量工具的有效性、准确性,或反映真实值的程度2. 内容效度:指一个测验内容是否合适,一般相对于教材或大纲,一般用来判断范围和题目是否恰当(仅限于成就测验,或知识与技能测验)课本:一个测验实际测到的内容与所要测量的内容之间的吻合程度3. 表面效度:外行人从表面上看,认为某个测验测得某种心理特质的有效程度 4. 效标关联效度(实证效度)课本:一个测验对于处于特定情境中的个体的行为进行估计的有效性。(即用实践效果作为测验是否有效的检验标准)老师:as instrumental validity, is used
23、to demonstrate the accuracy of a measure or procedure by comparing it with another measure or procedure which has been demonstrated to be valid.(自己翻译的:与其他已经被证明有效的测量工具或者测量过程相比,测验的关联程度。)5. 预测效度:根据有关理论(或研究成果,或一般推理)所选效标与待研究的测验(特质)有联系,如IQ与学习成绩,个性与心理健康6. 同时效度:所选效标与待研究的测验(特质)内涵相同或相似7. 结构效度:指通过对实证数据分析(因素分析)
24、得到的一个测验(或问卷)实际结构是否清晰。或者说,一个测验的实证结构与理论预期的结构是否相符合的程度。n 思考题: 1. 试述效度与测量误差的关系?效度是测量的随机误差和系统误差的综合反映P60(1) 当一个实验随机误差较大时,实测结果当然会偏离真值,造成结果的不准确。(2) 如果测量中还存在系统误差,则系统误差也会加大测量误差。(3) 无论出现哪种情况,也无论是否两种误差都存在,只要出现测量误差,测量的效度必受影响。 相关计算公式:q S2X =S2v + S2I+ S2E(S2I为系统误差, S2E为随机误差)q r2xy= S2v/S2X (r2xy为效度)2. 试述度效标关联效度(实证
25、效度)的含义?也被称为工具的有效性,是用来表现出比较另一项措施或程序,已被证明是有效的资讯科技的一项措施或程序的准确性。3. 试述效标关联效度(实证效度)的评估步骤?三种研究设计:都是相关法,本质上是一致的其实是分类、连续的数据的相关(参考区分度)(1)相关法找一个效标(测验),对同一批被试,同时施测,得到两组数据;求相关系数r,相关系数较大(0.3)且显著为效度较好。(2)比较法其中一个变量为类型(0、1)变量;找一个效标,根据经验进行分组,如高分组与低分组;对新编制的测验进行测定,获得两组被试的平均数与标准差;进行平均数差异比较(t检验或F检验),差异显著为效度较好;也可直接求相关r。(3
26、)命中率只是两个变量均为(0、1)类型变量,其中另一个变量是效标;可用X2检验,也可用一般相关;还可用ROC曲线法。4. 结合测验编制,谈谈结构效度对于一个测验的意义?1)结构效度的含义:结构的两重含义:a) 结构:即变量结构效度1b) 结构:即理论结构效度22)结构效度的含义:a) 结构效度1:新编制的测验能不能测某一结构(或特质)(实际上是效标关联效度,参前面的聚合效度与区分效度)-实质上是校标关联效度b) 结构效度2:测验的结构与理论预期的结构是否符合3)结构效度主要用于智力测验、人格测验等心理测验方面4)心理测验编制在制定编题计划(内容构思)要进行理论建构:即明确待编制量表的内容结构六
27、、测验研究中研究设计n 重要概念1、 正规化:测验研究,即量表的正规化,是指在量表编制完成后,对量表进行结构、效度、信度检验,确保量表结构清晰、有效、且稳定(不受无关因素影响)。2、 标准化:测验标准化特指测试实施过程中的标准化,包括测验指导语、实施环境与时限,评分标准的统一化。3、 随机分层抽样:它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。4、随机整群抽样:将总体按一定标准划分成群或集体,以群或集体为单位按随机的原则从总体中抽取若干群或集体,作为总体的样本,并对抽中的各群中每一个单位都进行实际调查。n 思考题: 1. 试述测验标准化的内
28、容1) 内容标准化:即对所有被试施测相同的题目。测验的内容不同,所得的测验分数是无法相互比较的。2)施测过程标准化:首先,无论在何时何地给何人施测,主考官宣读的测验指导语必须完全一致。第二,测验的时间要统一、严格控制,这一点对能力测验尤为重要。在本章稍后给出的案例中,对施测过程的标准化将有更加具体、详细的介绍。3)评分标准化:即客观评分。对于那些需要主观评分的测验,要求至少有两个以上受过专业训练的评分者同时评分,而且他们的分数必须具有一致性。2.试述人格问卷正规化的研究设计1)研究量表准备就绪:明确测验编制目的、概念定义、理论构建、项目编制、量尺选择2)探讨新编问卷的因子结构与项目分析n 方法
29、q 被试:被试约300人左右q 工具:新编问卷测试版q 程序:抽样(随机分层、随机整群)、问卷实施、数据输入与分析n 结果与分析:q 因素分析和各种项目分析方法结合。主要是探索量表的因素结构(结构效度)。 q 理想的结果是当删除若干项目后,获得比较清晰的量表结构。n 这时量表可定稿为正式版(当然最好在验证性因素分析也通过的时候)n 可继续分析量表的信度即内在一致性系数。n 可继续分析量表维度之间的相关(结构效度)q 若量表结构不清晰,这一次研究当作试测,须重新修改或编制问卷,重新收集数据,并进行分析,直到量表结构清晰为止3)分析新编问卷的重测信度n 方法q 被试:约5060人q 工具:新编问卷
30、正式版q 程序:分两次测定,间隔7天3月不等,须记名n 结果:q 对同一组被试测试获得的两组数据,计算r。n 讨论:若r0.8以上表示重测信度较好,新编测验比较稳定,不受被试状态与环境变化影响。4)分析新编问卷的效标关联效度n 方法q 被试:约5060人。(n越大越好)q 工具:新编问卷正式版与校标问卷q 程序:n 结果:q 计算新编问卷与校标之间的相关系数r。n 讨论:若r0.2以上表示测验的效度较好,新编测验能测想测的心理特质。5)目的:验证研究一发现的新编量表的因子结构n 方法q 被试:约300人(与研究一不同)q 工具:新编问卷正式版q 程序:n 结果与分析:q 模型建构;q 验证性因
31、素分析,可采用LISREL或AMOS 等软件,进一步研究一确定量表的结构效度。结果好坏看有关指标。若结果不理想,尚须修订正式版七、测验研究中的数据分析n 重要概念1. 因子荷重以变量(题目)为因变量以各抽取因子为自变量进行回归分析,每个系数即为loading2. 公因子方差h2hi2=ai12+ai22+aim2,为因子载荷矩阵中第i行元素的平方和,称为共同度。公因子的方差的意义在于说明当由原始变量空间转化为因子空间后,保留原来各变量的信息有多少,当hi2越接近1时,说明空间转化性质越好。n 思考题:因素分析的步骤1. 因素分析的一般哪些步骤?第一步:数据适合性检验与抽取因子数目的确定(1)
32、数据适合性检验(2) 确定抽取因子的数目第二步:因子数目确定后,获得清晰地的结构,同时确定哪些项目删除(1) 确定哪些项目删除(2) 因子旋转:以获得更清晰地结构2. 因素分析中如何确定因子的个数?(1) 潜根值(Eigenvalalue)准则,即潜根值大于1。(2) 碎石图(Scree test)准则,取曲线开始转折前的因子个数。(3) 有些情况下,分析人员事先确定因子的个数(number of factors)。这种做法适合检验因子的理论或重复某些工作。总之,采取最容易解释且最简单的因子结构为好。3. 如何运用因素分析的结果进行项目分析(删除项目)?确定抽取因子的数目进行因子旋转(正交旋转
33、法或者斜交旋转)a) 在所有因子因子荷重(lodging)均小于0.3的项目;b) 两个因子上因子荷重(lodging) 差不多大小c) 根据实际需要,从大到小排列,删除后面不需要的4. 因子旋转的目的是什么?一般采用哪种旋转方法?因子旋转的目的:以获得更清晰地结构一般采用一般选Varimax(正交旋转法),为更容易解释,也会使用斜交旋转法八、常模n 重要概念1. 常模:经常(或一般水平)的标准书上:根据标准化样本的测验分数经过统计处理而建立起来的具有参考点和单位的测验量表2. 团体内常模:能够代表团体(标准化样本)的测验分数3. 相对位置分数:某一个体测量分数在常模中的相对位置4. 标准分数
34、:是一种具有相等单位的量数,又称作Z分数5. T分数:T=A+BZ (由标准分数Z扩大B倍(消除小数)再加上A(消除负号)转换后的分数);由标准分数Z扩大10倍(消除小数)再加上50(消除负号)转换后的分数6. 百分等级P: :在一个群体的测验分数中,得分低于这个分数的人数的百分比7. 标准 标准,从定性方面讲,指的是测试的内容或行为的范围,它将通过“内容领域规范”得到明确。 n 思考题:1、 试述常模的概念与作用。作用:用于测验分数的解释,提供一个一般的标准来解释测验分数。2、 试述两类常模的异同。根据参照的是已达到的发展水平还是某团体中的相对位置,常模就可划分为发展常模和团体内常模两大类型
35、。常模类型作用是否用到现代统计学知识描述结果最经典例子其他例子发展性常模用以描述个体达到的发展水平否笼统、模糊比率智商如智力年龄、年级当量、顺序量表、发展商数和比率智商等团体性常模(离差常模):用以描述个体在某一特殊团体中的相对位置比较精确是(标准分数)离差智商如百分位常模(P),标准分常模(Z,T)(1)发展性常模:比率智商1.如智力年龄、年级当量、顺序量表、发展商数和比率智商等,用以.描述个体达到的发展水平。2.常模分数的计算没有运用了现代统计学的知识3.笼统、模糊(2)团体内常模:离差智商1.如百分位常模(P),标准分常模(Z,T),用以描述和体在某一特殊团体中的相对位置。2.常模分数的
36、计算运用了现代统计学的知识:标准分数3.比较精确3、 试述团体内的思路及其优越性。思路:将个体分数与团体比较优越性:有一个统一而清楚地定义好的数量关系,能运用大多数统计分析技术4、 如何编制测验常模?常模的编制(1) 常模的抽样方面:抽样方法:一般采用随机分层的方法,有代表性即可抽样容量:子样本数300(2) 常模的统计方面:如何编制测验常模?a) 提供一般水平:XSD,b) 计算相对位置:Z,P,T等常模样本(团体、样组)的总体信息: XSD相对位置分数:个体分数与总体分数的结合:Z,T,P补充:标准参照测验与常模参照测验的区别定义目的评估结果的变化常模参照测验把被评估者所得的分数与常模进行
37、比较,从而判断被评估者在团体中的相对地位实施常模参照评估的目的主要是将个人的表现与其他人的表现进行比较,重点放在个体所处的相对地位上这类评估的结果直接与常模团体的水平有关,会随着常模团体的变化而变化。标准参照测验指将被评估者所得的分数与某个标准进行比较,从而判断他是否通过了这个标准(标准:评估前预先设定的某个学习内容的掌握标准)它按绝对掌握水平来测量个人的某些技能的发展,即相对于一定的标准个人所达到的水平。标准参照评估中的标准常常直接来自教学目标,常常又是比较固定的九、编写测验说明书概念:1、 测验说明书(测验手册):向测验使用者说明如何使用该测验,以此才能保证测验的信度和效度思考:1、测验说
38、明书(测验手册)一般包括哪些内容? n 测验的目的与用途n 测验的理论依据n 测验的具体内容n 测验的实施n 测验的答案与评分n 测验的信度与效度n 测验常模十、测验实施与测验分数解释概念:1、 测验实施:派问卷、Test Administration 2、 测验焦虑:指被试因接受测验而产生的一种忧虑和紧张情绪,它会影响测验结果的真实性3、 反应倾向:4、 测验分数解释:如何看待测验分数的意义以及如何将测验分数的意义告诉受测者思考:1、 试述测验实施的注意事项。(1) 抽样:非个别测试,如调查或研究(2) 主试:熟悉测验内容、测验步骤、计分与分数解释熟悉指导语,并流利说出来必要时,主试(考官)
39、须经培训,甚至持证上岗(3) 指导语:说明测验目的与如何作答 说明测验的用途,或保密情况,国外一般要Informed Consent (4) 测试环境:指测验场地的温度、噪音、通风等物理环境,如有几次测试,应尽量保持相同或合格(5) 测验工具:卷面正规化,表面效度;防止各种反应倾向;最好匿名测试(6) 被试:被试疲劳、不舒服、动机水平、测验焦虑等均可能测验结果主试的职责,与被试建立良好关系,让被试信任主试对待儿童被试2、 试述测验分数解释的类型。描述:描述个人的心理特征状态溯因:追溯过去以解释个人目前发展的情况预测:推估个人未来可能发展的情形决策:作价值的判断或决定3、 试述测验分数解释的基本原则。(1)充分了解测验的性质与功能,注意测验理论的局限性(2)充分了解测验信度与效度的局限性(3)充分了解测验常模的局限性a) 测验分数和离不开相应的测验;b) 注意常模的标准化团体;c) 最好采用地方常模。地方常模与全国常模。d) 注意常模的时效性(4)充分了解测验标准的局限性(5)应以“一段分数”来解释(6)可能有各种因素影响,参考各种有关资料专心-专注-专业
限制150内