王建心理测量学知识(咨询师).ppt
《王建心理测量学知识(咨询师).ppt》由会员分享,可在线阅读,更多相关《王建心理测量学知识(咨询师).ppt(136页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理测量学心理学的重要研究方法之一第一节概述o一、测量的基本概念o(一)测量的定义o测量:依据一定的法则,使用量具对事物的特征进行定量描述的过程。一定的法则事物的特征量具定量描述(二)测量的基本要素o1、参照点o绝对参照点(绝对零点)o相对参照点o2、单位o好的单位须符合两个条件:意义明确:同一单位对所有人来说意义相同。等价:第一单位与第二单位之间的距离第二单位与第三单位之间的距离。(三)测量的量表o量表(scale):使事物的特征数量化的数字的连续体。oStevens:将量表从低到高分为4个等级。1、命名量表(NominalScale)2、顺序量表(OrderScale)3、等距量表(Int
2、ervalScale)4、比率量表(RatioScale)1、命名量表(NominalScale)用数字来代表事物或对事物进行分类。代号类别数字只是一种名称的替代物。不同的个体用不同的数字标志。如球员的号码,各种分类标志(男或女;正常或异常,等)2、顺序量表(OrderScale)给个体赋值,使数值的大小次序与个体在所测量的心理特性上的多少、大小、高低等的次序相符合。顺序量表在心理和教育中十分常见(如竞赛成绩排名等)。o3、等距量表(IntervalScale)o给个体赋值,使数值间的差不仅能够反映出对应个体在所测量心理特性上的排序,而且能够反映出对应个体在该特性上的差异程度。(如温度计,偏爱
3、程度等)o但建构间距量表不是容易的事,常常只能做到顺序量表。4、比率量表(RatioScale)给个体赋值,使数值间的比率能够反映对应个体在测量心理特性上比率。(如身高、体重、速度等)。但在心理学中是极少见的。心理测量通常都是顺序量表,为方便比较,通常把顺序量表转换为等距量表。二、二、心理测验的基本概念心理测验的基本概念o(一)定义o心理测验:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。o1、心理心理测验测量的是人的行为o2、行为样本:从总体行为中抽取出来的、能够反映个人特定心理特质的一组行为,作
4、为直接的测量对象。o3、测验条件对所有被试必须是相同的。o4、原始分数的解释只有与其他人的分数或常模比较才有意义。(二)心理测量的性质o1心理测验的间接性通过测量外显行为来推断内隐的心理特质o2心理测验的相对性没有绝对的标准o3心理测验的客观性测验的客观性实际上就是测验的标准化问题三心理测验的种类o一、心理测验的种类o(一)按测验的功能分类o1能力测验o智力测验、特殊能力测验、能力倾向测验o2学绩测验o已获得的学业成就o3人格测验o兴趣、态度、动机、气质、性格(二)按测验的方式分类1个别测验优点:获得的信息多;容易建立融洽的合作关系;特殊被试(幼儿、盲人)缺点:费时、复杂、对主试要求高。2团体
5、测验优点:缺点:(三)按测验材料性质分类1文字(纸笔)测验2非文字(操作)测验文化公平测验(四)按测验材料的严谨程度分类1构造性测验 2投射性测验(五)按测验的要求分类1最高行为测验2典型行为测验四、对心理测验的科学态度(一)错误观念o1、万能论o2、无用论o3、心理测验就是智力测验(心理测验=智力测验=智商=遗传决定论)(二)对待测验的正确态度1、心理测验是研究心理学的重要方法之一,是决策的辅助工具;2、心理测验作为研究方法和测量工具尚不完善;3、防止乱编和滥用心理测验。第二节测验的常模o一、常模团体o(一)常模团体的性质o由具有共同特征的人所组成的一组群体,或是该群体的一个样本。o任何一个
6、测验,都有许多可能的常模团体。o在制定常模时,首先要确定常模团体。o在对常模参照分数做解释时,也必须首先考虑常模团体的组成。二、确定常模团体的注意事项o常模团体的四个条件:o1、群体构成的界限必须明确对每个常模团体的性质和特征的简短且明确的描述。o2、常模团体必须是所测群体的代表性样本克服取样偏差,采用正确的取样方法:随机取样,系统抽样,分层取样。o3、样本大小要适当o从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。o样本大小可以根据以下几方面来确定:常模总体的数目。总体数目小,则样本数目也小;总体数目大,样本数目也应大。一般来说,样本最好应有30100人;如果是
7、全国性常模,一般应有20003000人为宜。总体性质。总体性质越复杂,样本容量就越大。测验结果的精确度。精确度要求越高,样本量就越大。o4、常模团体必须是近时的。三、取样的方法o取样:从目标人群中选择有代表性的样本上。o统计学分类:随机抽样、非随机抽样o随机原则:从总体中取样时,每个个案被抽取的机会是均等的。o1、简单随机抽样o按随机表顺序抽样。o每个人或抽样单位有相同的机会成为常模中的一部分。2、系统抽样是介于随机抽样和和非随机抽样之间的一种抽样方法。其第一种样本可以依立意抽样法抽取;亦可用随机方式抽取。具体抽样流程为:抽样前,须将母体的每一个单位编号,先计算样本区间(即N/n,N表示母体的
8、数目,n表示样本的大小),如果样本区间为分数,可四舍五入化为整数。然后从1到N/n号中随机抽出一个号码作为第一个样本单位,将第一个样本单位的号码加下样本区间即得第二个样本单位,依此类推,直到样本数抽够为止。3、分组抽样先将总体依照一种或几种特征分为几个子总体(类群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本比如某中学有1000名学生装,其中男600人,女有400人,欲采用分层抽样从中抽取100人的一个样本,则其中男应有60人,女应有40人样本的精确度还与分层数目及样本大小密切相关,分层越细,样本越大,则样本的代表性越好。o4、分层抽样
9、o是将总体按照某种标准(年龄、文化程度)划分为一些子群体。每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。四、常模分数与常模o1、常模分数:对常模样本施测后,将被试的原始分数按一定规则转换出来的导出分数。o2、常模o常模分数构成的分布是。它是解释心理测验分数的基础。o种类:一般常模、特殊常模o常模分数和常模均会随时间的变化而改变,因此常模必须经常修订。五、常模的类型o类型:1、发展量表2、商数3、百分位4、标准分数(一)发展量表o1心理年龄(mentalage)(智力年龄)o指被试智力发展水平的年龄。单位是年(或岁)和12个等距的月。o年龄量表
10、最基本的假设是,随年龄的增长,所测量的特质有系统的改变。因此,不适用于成人。o年龄量表的基本要素:o(1)题目:可区分不同年龄组;o(2)常模团体:由各个年龄被试组成的有代表性样本;o(3)常模表2年级当量(gradeequivalents)o即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。o年级常模的单位通常为10个月间隔。如5年级的分布为5-0到5-9。o年级当量只适用于一般课程,不适合只学12年的课程。o年级当量只适用于解释本学年的水平,不适用于跨学年的。如一个五年级学生的年级当量为8,并不能说他已经掌握了8年级的课程。3.发展顺序量表(
11、ordinalscales)o格塞尔发展顺序量表o格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。4周16周28周40周52周不能控制头部,仰卧姿势左右不对称颈可竖直,头微摇动,仰卧姿势左右对称扶起独坐,身体前倾可独坐,爬行,扶着物件站立搀一手行走,摇摆o皮亚杰量表o用特定的任务来揭示儿童发展处于哪个阶段。o5岁:质量守恒o6岁:重量守恒o7岁:容量守恒(二)商数(quotient)o1比率智商oIQ=100(MA/CA)o缺点:o实龄是等距的,而智龄不等距(智力发展不是直线的)o计算成人智商时,以
12、多大实龄作为除数?智力生长何时达到顶点?o不同年龄组,比率智商分数具有不同的标准差,因而相同的比率智商对于不同年龄具有不同的意义。o2、离差智商:IQ100+15Z(三)百分位o1、百分等级(percentilerank)o概念:某个分数的百分等级就是得分低于这个分数的人数的百分比。o百分等级指示个体在常模团体中的相对位置。o百分等级越低,个体所处的地位越低。o2百分点o相对于某一百分等级的分数点叫百分点或百分位数。o3十分位o百分点将分数分布分成100个等份。o十分位是将分数分成10个等份。十分位提供一个10级的等级量表,每一级包括10%的分数。q百分位的评价优点:(1)容易计算,容易解释。
13、(2)对于各种被试和各种测验普遍适用。缺点:(1)缺少相等单位,属于顺序量表,不能做加减乘除运算。(2)分布与分数分布不一致(四)标准分数(standardscore)1 Z分数。X-XZ=S不仅具有可比性,还具有可加性。Z=0SZ=1,-3+3约占总体的99.73%。o除了Z分数外,还可以把Z分数转换成T分数、标准九、离差智商等。o转换方法:o线性转换:从正态到正态o非线性转换:从偏态到正态(通过百分等级)2 T分数(非线性转换,常态化)纪念Terman和Thorndike。T=10Z+50平均数为50,标准差为103 标准九(stanine)标准化九级分制标准九=5+2Z,即平均数为5,标
14、准差为2标准九分本段面积(%)累加面积(%)段中值与平均数的距离()941002.087961.5712891.0617770.5520600417400.5312231.027111.51442.0o4离差智商(deviationIQ)oIQ=100+15Z六、常模分数的表示方法o(一)转化表o转化表的3个基本要素:原始分、导出分、常模团体的特征描述。o1简单转化表oo2复杂转化表(二)剖析图第三节测验的信度o测量误差及其来源o一、测量误差的含义:测量值与实际值的差异o二、测量误差的种类o系统误差:测量工具本身引起的误差(稳定);o随机误差:由不稳定因素引起的误差(不稳定)。真分数及其有关的
15、假设o真分数(TrueScore):一个测量工具在没有测量误差时,所得到的纯正值。o操作定义:无数次测量结果的平均值。o观察分数(ObservedScore):测验分数o真分数的数学模型及其假设oX=T+EoX:测验分数oT:真分数oE:误差o测量误差的假设:o(X)=T或(E)=0oSX2=ST2+SE2实得分数的变异数真分数的变异数误差变异数(随机误差)ST2=SV2+SI2真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数(系统误差)SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2一信度概述o(一)什么是信度?o信度(reliability)是指测量结果的稳定性程度,
16、也叫测量的可靠性。o操作定义:一组测量分数的真变异数与总变异数(实得变异数)的比率。orxx=ST2/Sx2orxx:信度系数o注意:o(1)信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性;o(2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。(二)信度的作用1评价测验:信度是测量过程中所存在的随机误差大小的反映2解释个人测验分数的意义SE=SX1-RxxSE:标准误Sx:所得分数的标准差rxx:测验的信度真分数的置信区间(95%)=X1.96SE3不同测验分数的比较二信度的估计方法o(一)重测信度o1含义和计算o重测信度(tes
17、t-retestreliability):用同一量表对同一组被试施测两次所得结果的一致性程度。rxx=X1X2/N-X1X2S1S2o2使用的前提条件所测量的心理特质必须是稳定的;练习和遗忘的效果基本上相互抵消;在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。(二)复本信度o1含义和计算o复本信度(Alternate-formreliability)是指两个平行(等值)的测验测量同一批被试所得结果的一致性程度。计算方法与重测法相同。oo施测的安排:o等值性系数:两个复本测验是同时连续施测的o稳定等值系数(重测复本信度):两个复本测验是相距一段时间分两次施测的。o2
18、使用的前提条件o两测验真正平行:项目的内容、形式、数量、难易、时限、指导语等o被试要有条件接受两个测验。注意:时间间隔要适当。o3、局限只能减少而不能排除练习和记忆的影响。许多测验建立复本相当困难。(三)分半信度o1含义和计算o分半信度(split-halfreliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。o假设:两半测验等值。常见的分半方法是按测题序号奇偶分半:l测验题目按某种顺序(如难度)排列;l如果是随机排列的题目,则必须是所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的);l如果测验有多个分量表,应在分量表内部排好顺序,再
19、把各分量表的两半组合起来求相关。奇偶分半法作用注意事项o如果有相互有牵连的项目或一组解决同一问题的项目时,这些项目要放在同一半中。o如果试卷中存在任选题或试卷为速度测验时,不宜使用分办信度。o分半法是按正常的程序实施测验,然后将全部项目分成相等的两半,根据各人在这两半测验的分数计算其相关。然后进行修正(?)o校正公式:斯皮尔曼-布郎公式orxx=2rhh/(1+rhh)orhh是两半测验分数之间的相关系数。p当假定“两半测验等值(具有相同的平均数和标准差”)不成立时,用弗朗那根公式或卢仑公式来估计信度。p弗朗那根公式:orxx=21-(Sa2+Sb2)/Sx2oSa2、Sb2是两半测验分数的变
20、异数,oSx2是测验总分的变异数o卢仑公式:orxx=1-Sd2/Sx2oSd2:两半测验分数之差的变异数oSx2:测验总分的变异数(四)同质性信度1含义同质性信度(homogeneityreliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。可弥补分半法的不足。2计算及适用范围基本公式:rkk=Krij/1+(K-1)rijK为测验项目数r ij是项目间相关系数的平均数。o库德理查逊公式oKR20公式:orxx=K/(K-1)1-(piqi)/Sx2opi为答对第i题的人数的比例;qi为答错第i题的人数的比例;K为题目数,Sx2为测验总分的变异。o适用于:已知各项目
21、的难度(五)评分者信度1含义和计算评分者信度(scorerreliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。2人时:相关系数(积差相关).90多人时:肯德尔和谐系数W=12Ri2-(Ri)2/N/K2(N3-N)(K=320;N=37时,查W表检验)RI为第i个被试被评的水平等级之和七、影响测量信度的主要因素o(一)被试方面o被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。o被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。o(二)主试方面o指导语、态度、期望等o(三)施测情境o(四)测量工具o测验长度:测验越长,信度越高。o测验难度:过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 知识 咨询
限制150内