欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    王建心理测量学知识(咨询师).ppt

    • 资源ID:82712904       资源大小:267KB        全文页数:136页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    王建心理测量学知识(咨询师).ppt

    心理测量学心理学的重要研究方法之一第一节概述o一、测量的基本概念o(一)测量的定义o测量:依据一定的法则,使用量具对事物的特征进行定量描述的过程。一定的法则事物的特征量具定量描述(二)测量的基本要素o1、参照点o绝对参照点(绝对零点)o相对参照点o2、单位o好的单位须符合两个条件:意义明确:同一单位对所有人来说意义相同。等价:第一单位与第二单位之间的距离第二单位与第三单位之间的距离。(三)测量的量表o量表(scale):使事物的特征数量化的数字的连续体。oStevens:将量表从低到高分为4个等级。1、命名量表(NominalScale)2、顺序量表(OrderScale)3、等距量表(IntervalScale)4、比率量表(RatioScale)1、命名量表(NominalScale)用数字来代表事物或对事物进行分类。代号类别数字只是一种名称的替代物。不同的个体用不同的数字标志。如球员的号码,各种分类标志(男或女;正常或异常,等)2、顺序量表(OrderScale)给个体赋值,使数值的大小次序与个体在所测量的心理特性上的多少、大小、高低等的次序相符合。顺序量表在心理和教育中十分常见(如竞赛成绩排名等)。o3、等距量表(IntervalScale)o给个体赋值,使数值间的差不仅能够反映出对应个体在所测量心理特性上的排序,而且能够反映出对应个体在该特性上的差异程度。(如温度计,偏爱程度等)o但建构间距量表不是容易的事,常常只能做到顺序量表。4、比率量表(RatioScale)给个体赋值,使数值间的比率能够反映对应个体在测量心理特性上比率。(如身高、体重、速度等)。但在心理学中是极少见的。心理测量通常都是顺序量表,为方便比较,通常把顺序量表转换为等距量表。二、二、心理测验的基本概念心理测验的基本概念o(一)定义o心理测验:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。o1、心理心理测验测量的是人的行为o2、行为样本:从总体行为中抽取出来的、能够反映个人特定心理特质的一组行为,作为直接的测量对象。o3、测验条件对所有被试必须是相同的。o4、原始分数的解释只有与其他人的分数或常模比较才有意义。(二)心理测量的性质o1心理测验的间接性通过测量外显行为来推断内隐的心理特质o2心理测验的相对性没有绝对的标准o3心理测验的客观性测验的客观性实际上就是测验的标准化问题三心理测验的种类o一、心理测验的种类o(一)按测验的功能分类o1能力测验o智力测验、特殊能力测验、能力倾向测验o2学绩测验o已获得的学业成就o3人格测验o兴趣、态度、动机、气质、性格(二)按测验的方式分类1个别测验优点:获得的信息多;容易建立融洽的合作关系;特殊被试(幼儿、盲人)缺点:费时、复杂、对主试要求高。2团体测验优点:缺点:(三)按测验材料性质分类1文字(纸笔)测验2非文字(操作)测验文化公平测验(四)按测验材料的严谨程度分类1构造性测验 2投射性测验(五)按测验的要求分类1最高行为测验2典型行为测验四、对心理测验的科学态度(一)错误观念o1、万能论o2、无用论o3、心理测验就是智力测验(心理测验=智力测验=智商=遗传决定论)(二)对待测验的正确态度1、心理测验是研究心理学的重要方法之一,是决策的辅助工具;2、心理测验作为研究方法和测量工具尚不完善;3、防止乱编和滥用心理测验。第二节测验的常模o一、常模团体o(一)常模团体的性质o由具有共同特征的人所组成的一组群体,或是该群体的一个样本。o任何一个测验,都有许多可能的常模团体。o在制定常模时,首先要确定常模团体。o在对常模参照分数做解释时,也必须首先考虑常模团体的组成。二、确定常模团体的注意事项o常模团体的四个条件:o1、群体构成的界限必须明确对每个常模团体的性质和特征的简短且明确的描述。o2、常模团体必须是所测群体的代表性样本克服取样偏差,采用正确的取样方法:随机取样,系统抽样,分层取样。o3、样本大小要适当o从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。o样本大小可以根据以下几方面来确定:常模总体的数目。总体数目小,则样本数目也小;总体数目大,样本数目也应大。一般来说,样本最好应有30100人;如果是全国性常模,一般应有20003000人为宜。总体性质。总体性质越复杂,样本容量就越大。测验结果的精确度。精确度要求越高,样本量就越大。o4、常模团体必须是近时的。三、取样的方法o取样:从目标人群中选择有代表性的样本上。o统计学分类:随机抽样、非随机抽样o随机原则:从总体中取样时,每个个案被抽取的机会是均等的。o1、简单随机抽样o按随机表顺序抽样。o每个人或抽样单位有相同的机会成为常模中的一部分。2、系统抽样是介于随机抽样和和非随机抽样之间的一种抽样方法。其第一种样本可以依立意抽样法抽取;亦可用随机方式抽取。具体抽样流程为:抽样前,须将母体的每一个单位编号,先计算样本区间(即N/n,N表示母体的数目,n表示样本的大小),如果样本区间为分数,可四舍五入化为整数。然后从1到N/n号中随机抽出一个号码作为第一个样本单位,将第一个样本单位的号码加下样本区间即得第二个样本单位,依此类推,直到样本数抽够为止。3、分组抽样先将总体依照一种或几种特征分为几个子总体(类群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本比如某中学有1000名学生装,其中男600人,女有400人,欲采用分层抽样从中抽取100人的一个样本,则其中男应有60人,女应有40人样本的精确度还与分层数目及样本大小密切相关,分层越细,样本越大,则样本的代表性越好。o4、分层抽样o是将总体按照某种标准(年龄、文化程度)划分为一些子群体。每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。四、常模分数与常模o1、常模分数:对常模样本施测后,将被试的原始分数按一定规则转换出来的导出分数。o2、常模o常模分数构成的分布是。它是解释心理测验分数的基础。o种类:一般常模、特殊常模o常模分数和常模均会随时间的变化而改变,因此常模必须经常修订。五、常模的类型o类型:1、发展量表2、商数3、百分位4、标准分数(一)发展量表o1心理年龄(mentalage)(智力年龄)o指被试智力发展水平的年龄。单位是年(或岁)和12个等距的月。o年龄量表最基本的假设是,随年龄的增长,所测量的特质有系统的改变。因此,不适用于成人。o年龄量表的基本要素:o(1)题目:可区分不同年龄组;o(2)常模团体:由各个年龄被试组成的有代表性样本;o(3)常模表2年级当量(gradeequivalents)o即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。o年级常模的单位通常为10个月间隔。如5年级的分布为5-0到5-9。o年级当量只适用于一般课程,不适合只学12年的课程。o年级当量只适用于解释本学年的水平,不适用于跨学年的。如一个五年级学生的年级当量为8,并不能说他已经掌握了8年级的课程。3.发展顺序量表(ordinalscales)o格塞尔发展顺序量表o格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。4周16周28周40周52周不能控制头部,仰卧姿势左右不对称颈可竖直,头微摇动,仰卧姿势左右对称扶起独坐,身体前倾可独坐,爬行,扶着物件站立搀一手行走,摇摆o皮亚杰量表o用特定的任务来揭示儿童发展处于哪个阶段。o5岁:质量守恒o6岁:重量守恒o7岁:容量守恒(二)商数(quotient)o1比率智商oIQ=100(MA/CA)o缺点:o实龄是等距的,而智龄不等距(智力发展不是直线的)o计算成人智商时,以多大实龄作为除数?智力生长何时达到顶点?o不同年龄组,比率智商分数具有不同的标准差,因而相同的比率智商对于不同年龄具有不同的意义。o2、离差智商:IQ100+15Z(三)百分位o1、百分等级(percentilerank)o概念:某个分数的百分等级就是得分低于这个分数的人数的百分比。o百分等级指示个体在常模团体中的相对位置。o百分等级越低,个体所处的地位越低。o2百分点o相对于某一百分等级的分数点叫百分点或百分位数。o3十分位o百分点将分数分布分成100个等份。o十分位是将分数分成10个等份。十分位提供一个10级的等级量表,每一级包括10%的分数。q百分位的评价优点:(1)容易计算,容易解释。(2)对于各种被试和各种测验普遍适用。缺点:(1)缺少相等单位,属于顺序量表,不能做加减乘除运算。(2)分布与分数分布不一致(四)标准分数(standardscore)1 Z分数。X-XZ=S不仅具有可比性,还具有可加性。Z=0SZ=1,-3+3约占总体的99.73%。o除了Z分数外,还可以把Z分数转换成T分数、标准九、离差智商等。o转换方法:o线性转换:从正态到正态o非线性转换:从偏态到正态(通过百分等级)2 T分数(非线性转换,常态化)纪念Terman和Thorndike。T=10Z+50平均数为50,标准差为103 标准九(stanine)标准化九级分制标准九=5+2Z,即平均数为5,标准差为2标准九分本段面积(%)累加面积(%)段中值与平均数的距离()941002.087961.5712891.0617770.5520600417400.5312231.027111.51442.0o4离差智商(deviationIQ)oIQ=100+15Z六、常模分数的表示方法o(一)转化表o转化表的3个基本要素:原始分、导出分、常模团体的特征描述。o1简单转化表oo2复杂转化表(二)剖析图第三节测验的信度o测量误差及其来源o一、测量误差的含义:测量值与实际值的差异o二、测量误差的种类o系统误差:测量工具本身引起的误差(稳定);o随机误差:由不稳定因素引起的误差(不稳定)。真分数及其有关的假设o真分数(TrueScore):一个测量工具在没有测量误差时,所得到的纯正值。o操作定义:无数次测量结果的平均值。o观察分数(ObservedScore):测验分数o真分数的数学模型及其假设oX=T+EoX:测验分数oT:真分数oE:误差o测量误差的假设:o(X)=T或(E)=0oSX2=ST2+SE2实得分数的变异数真分数的变异数误差变异数(随机误差)ST2=SV2+SI2真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数(系统误差)SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2一信度概述o(一)什么是信度?o信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。o操作定义:一组测量分数的真变异数与总变异数(实得变异数)的比率。orxx=ST2/Sx2orxx:信度系数o注意:o(1)信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性;o(2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。(二)信度的作用1评价测验:信度是测量过程中所存在的随机误差大小的反映2解释个人测验分数的意义SE=SX1-RxxSE:标准误Sx:所得分数的标准差rxx:测验的信度真分数的置信区间(95%)=X1.96SE3不同测验分数的比较二信度的估计方法o(一)重测信度o1含义和计算o重测信度(test-retestreliability):用同一量表对同一组被试施测两次所得结果的一致性程度。rxx=X1X2/N-X1X2S1S2o2使用的前提条件所测量的心理特质必须是稳定的;练习和遗忘的效果基本上相互抵消;在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。(二)复本信度o1含义和计算o复本信度(Alternate-formreliability)是指两个平行(等值)的测验测量同一批被试所得结果的一致性程度。计算方法与重测法相同。oo施测的安排:o等值性系数:两个复本测验是同时连续施测的o稳定等值系数(重测复本信度):两个复本测验是相距一段时间分两次施测的。o2使用的前提条件o两测验真正平行:项目的内容、形式、数量、难易、时限、指导语等o被试要有条件接受两个测验。注意:时间间隔要适当。o3、局限只能减少而不能排除练习和记忆的影响。许多测验建立复本相当困难。(三)分半信度o1含义和计算o分半信度(split-halfreliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。o假设:两半测验等值。常见的分半方法是按测题序号奇偶分半:l测验题目按某种顺序(如难度)排列;l如果是随机排列的题目,则必须是所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的);l如果测验有多个分量表,应在分量表内部排好顺序,再把各分量表的两半组合起来求相关。奇偶分半法作用注意事项o如果有相互有牵连的项目或一组解决同一问题的项目时,这些项目要放在同一半中。o如果试卷中存在任选题或试卷为速度测验时,不宜使用分办信度。o分半法是按正常的程序实施测验,然后将全部项目分成相等的两半,根据各人在这两半测验的分数计算其相关。然后进行修正(?)o校正公式:斯皮尔曼-布郎公式orxx=2rhh/(1+rhh)orhh是两半测验分数之间的相关系数。p当假定“两半测验等值(具有相同的平均数和标准差”)不成立时,用弗朗那根公式或卢仑公式来估计信度。p弗朗那根公式:orxx=21-(Sa2+Sb2)/Sx2oSa2、Sb2是两半测验分数的变异数,oSx2是测验总分的变异数o卢仑公式:orxx=1-Sd2/Sx2oSd2:两半测验分数之差的变异数oSx2:测验总分的变异数(四)同质性信度1含义同质性信度(homogeneityreliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。可弥补分半法的不足。2计算及适用范围基本公式:rkk=Krij/1+(K-1)rijK为测验项目数r ij是项目间相关系数的平均数。o库德理查逊公式oKR20公式:orxx=K/(K-1)1-(piqi)/Sx2opi为答对第i题的人数的比例;qi为答错第i题的人数的比例;K为题目数,Sx2为测验总分的变异。o适用于:已知各项目的难度(五)评分者信度1含义和计算评分者信度(scorerreliability)是指多个评分者给同一批人的答卷进行评分的一致性程度。2人时:相关系数(积差相关).90多人时:肯德尔和谐系数W=12Ri2-(Ri)2/N/K2(N3-N)(K=320;N=37时,查W表检验)RI为第i个被试被评的水平等级之和七、影响测量信度的主要因素o(一)被试方面o被试团体同质性越高(个体差异越小),所得相关系数(信度)就越低。o被试团体异质性越高(个体差异越大),所得相关系数(信度)就越高。o(二)主试方面o指导语、态度、期望等o(三)施测情境o(四)测量工具o测验长度:测验越长,信度越高。o测验难度:过难或过易都会使个体间得分差异减小,降低信度。o测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。o(五)两次施测的间隔时间o间隔时间越短,信度越高;o间隔时间越长,信度越低。第四节测验的效度o一效度的概念o1、什么是效度o效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。o(1)效度是一个相对的概念:每个测量工具都有自己的目的;内隐特质是通过外显行为间接测得的。o(2)效度是测量的随机误差和系统误差的综合反映。o(3)判断一个测量是否有效要从多方面收集证据操作定义:效度=SV2/SX2=rXY2SV2SI2SE2SX2ST2实得分数的变异数真分数的变异数误差变异数(随机误差)真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数(系统误差)2、效度与信度的关系(1)信度高是效度高的必要而非充分条件一个测验效度高,其信度也必然高;但一个测验信度高,其效度不一定高。(2)测验的效度受它的信度制约rXYrXX一个测验的信度必然比效度高,至少相等。二、效度的估计o1、内容效度o内容效度(contentvalidity)是指测验题目对有关内容或行为取样的适当程度,即一个测验实际测到的内容与所要测量的内容之间的吻合程度。o一个测验要有内容效度必须具备两个条件:o(1)要有定义完好的内容范围o(2)测验题目应是所界定的内容范围的代表性取样。o应用范围:主要应用于成就测验,也适合于某些用于选拔和分类的职业测验。不适用于能力倾向测验和人格测验。o表面效度(surfacevalidity):外行人对某个测验从表面上看好像是测某种心理特质的程度。并不是一种真正的效度。o人格测验要求表面效度不宜过高。2内容效度的确定方法(1)逻辑分析法:专家根据自己的知识经验对量表的有效性(逻辑性)作出判断,也称逻辑效度。为使内容效度的判断过程更客观,一般采用下列步骤:确定测验内容的总体范围;编制双向细目表;编制评定量表,从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面,对测验作出总的评价。(2)统计方法:用两个测验复本来测同一批被试,若相关高,则内容效度可能高,但若相关低,则说明必有一个测验缺乏内容效度。(3)经验推测法通过实践来检验效度2、结构效度structurevalidity是指一个测验实际测到所要测量的理论结构或特质的程度,或者说测验分数能够说明心理学理论的某种结构或特质的程度。特点:o(1)具有不同理论构思的测验,其结构效度无法进行比较;o(2)结构效度有时很难获得;o(3)结构效度没有单一的指标,是由各方面的证据累积起来进行评价的。结构效度的确定方法o结构效度确立的一般步骤:o(1)提出理论框架;o(2)依据理论框架推演出有关测验成绩的假设;o(3)用逻辑或实证的方法来证明假设。结构效度的确定方法o结构效度确立的一般步骤:o(1)提出理论框架;o(2)依据理论框架推演出有关测验成绩的假设;o(3)用逻辑或实证的方法来证明假设。o具体方法:(1)测验内部寻找证据法A.分析测验的内容效度:若内容效度高,说明其结构效度也高。B.分析被试对题目反应的特点:有无社会称许性的题目,如“当事情不顺我意时,我时常动怒。”对该题的回答,也许反映不了要测的性格。C.计算测验的同质性信度:分半信度、系数、KR20、KR21o(2)测验之间寻找证据法A.相容效度:新老测验之间的相关(两测验测的是同一心理特质)。若相关高,则说明新测验可能有较高的效度。B.区分效度:新老测验之间的相关(两测验测的不是同一心理特质),若相关低,则说明新测验可能有较高的效度。C.因素分析法:得出的因素符合理论的构思,说明效度高。o(3)考察测验的实证效度法o根据效标把被试分组,考察其得分差异。o根据测验得分差异把被试分组,考察其所测特质(行为表现)的差异。o(4)实验法和观察法证实o实验前训练实验后3、实证效度A.含义、种类及作用o实证效度实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。o效标效标(criterion):被估计的行为是检验测验效度的标准。衡量一个测验是否有效的外在标准。o实证效度又称效标关联效度效标关联效度(criterion-relatedvalidity)。常用的效标:学业成就临床诊断实际工作表现特殊训练成绩不同团体的总体表现先前有效的测验等级评定。效标测量的条件oa.有效性:效标测量能真正反映观念效标。ob.可靠性:有较高的信度oc.客观性:效标测量必须能真正反映观念效标,防止效标污染。o效标污染(criterioncontamination)是指评定者知道被试的测验分数,因而影响到对效标的客观评定。od.实用性:经济实用实证效度的确定方法o(1)相关法o测验分数与效标测量之间的相关系数。o优点:o数量化;o可用回归方程进行个人效标预测o缺点:o要求预测源与效标呈线性关系;o无法提供关于取舍正确性的指标o(2)区分法o检验测验分数能否有效地区分由效标所定义的团体。oT检验:o重叠量计算:工作 表现测验成绩不合格合格合格AB不合格CD(3)命中率法应用范围:预测源和效标都是二分的。强调社会公平时使用,总命中率=(B+C)/(A+B+C+D)当测验用于提高工作或学习效率时使用,正命中率=B/(A+B)效度的功能o一、预测误差o二预测效标分数o三预测效率指数四、影响测量效度的因素oA测验的构成o项目的质量(题型、区分度、难易顺序)o项目数量测验长度与效度的关系:r(nx)y=nrxy/n(1-rxx+nrxx)n测验增长倍数oB测验的实施过程oC接受测验的被试o常模团体的同质性影响到对被试测验得分的解释,进而影响到测验的效度。o测验偏倚(testbias)是指用不适用于被试的标准来解释被试的测验得分,因而造成解释的偏差。oD效标o测量行为与所选效标的相似性越高,效度越高。o测验分数与效标行为之间是否是线性关系,如果不是线性关系,求皮尔逊相关就会低估效度。o效标本身的测量越可靠,效度就可能越高。ooE测量的信度第五节项目分析o项目分析:对项目进行筛选和修订,可以提高测验的信度和效度。o定性分析:内容效度、题目编写的恰当性和有效性等的分析。o定量分析:主要是指题目难度和区分度的分析。第一单元、测验的难度一、难度(difficulty)的含义o难度:指项目的难易程度。o在“最高”作为测验(如:)中,称为“难度”,而在“典型”作为测验(如:)中,则指“通俗性”。o两者都是指在总体中,能够正确或确切回答某项目的人数。二难度的计算o1、二分法记分项目(是非题、选择题)的难度用通过率来表示。o通过率(易度):P=R/NR:通过人数;N全体被试人数P越大,难度越小o用极端分组法(上下27%):被试较多时,测验总分从高到低排列。分别计算高分组和低分组在某一项目上的通过率,合并:P=(PH+PL)/2o选择题难度的校正:CP(KP-1)/(K-1)oCP:校正后通过率,P:实得通过率,K:备选答案数目2、论述题等非二分法记分项目的难度oP=X/XmaxoX:所有被试在该项目上的平均得分,Xmax:该项目的满分。三、难度水平的确定(一)项目难度:取决于测验的目的、性质和项目形式1、测验目的:鉴别差异o防止被试得满分,满分的意义是不明确的。难度为0.50时最理想,项目具有最大的鉴别力。o一般只需使项目的平均难度接近0.50,各个项目的难度在0.500.20之间变化。2、项目形式选择题的难度一般应大于猜测概率。是非题:0.75最合适;四选一:0.633、测验性质:p效标参照测验、掌握测验:不考虑难度p选拔测验:难度=录取率(二)测验难度取决于:测验各项目难度考察测验分数的分布形态检验测验难度。o正偏态,难度大o常态分布,难度适中o负偏态,难度低p标准参照测验、掌握测验:不考虑难度o允许分数分布是偏态的第二单元项目的区分度一、区分度的含义o区分度(鉴别力):指测验项目对被试心理特性的区分能力。o项目的区分度是评价项目质量和筛选项目的主要指标。影响测验效度的重要因素。o高区分度项目能将不同水平的被试区分开来。o取值范围:-1+1二、区分度的计算项目得分高低、实际水平高低二者的相关。1、鉴别指数o比较测验高分组和低分组的两组被试在项目通过率上的差别。D=PH-PLD值越大,区分度越高,项目越有效伊贝尔(1965)鉴别指数评价标准鉴别指数题目评价0.40以上很好0.300.39良好,修改会更好0.200.29尚可,仍需修改0.19以下差,必须淘汰(二)相关法o相关法(项目-总分相关):以某一项目分数与效标分数或测验总分的相关作为该项目区分度的指标。o相关越高,区分度?计算方法1、点二列相关:点二列相关:o适用于:一类变量是二分称名变量,另一类变量是连续变量例如:o连续变量数据,如体重、身高以及许多测验与考试的分数;o二分称名变量数据,如性别(分男与女)、态度(分赞成和不赞成)、学习经历(分有与无)、考试结果(分合格与不合格)、题目解答(分答对与答错)等数据。2、二列相关o适用于:两个连续变量,其中一个变量被人为分成两类。如:一个测验的题目分数是连续的,而效标分数或测验总分被分成及格、不及格。3、相关法o适用于:两个变量均为二分称名变量。三、区分度与难度的关系o项目难度以常态分布为好,平均难度0.50难度()区分度()1.0000.900.200.800.400.700.600.600.800.5010.400.800.300.600.200.400.100.200.000第六节测验编制的一般程序o一、测验的目标分析:对象、用途、目标o二、测题的编写o三、测验的编排和组织第一单元测验的目标分析一、测量的对象:测验适用的团体o年龄、性别、职业、受教育程度、经济状况、民族、文化背景等。二、明确测量用途o用于显示,或用于预测?(一)显示性测验:测验题目和所要测量的心理特征相似的测验。(二)预测性测验:预测一些没被测量的行为的测验。三、测量目标(一)工作分析:预测性测验中要对所预测的行为活动作具体分析。确定哪些心理特征和行为可以使要预测的活动达到成功。建立效标。成功的标准(二)对特定概念下定义(操作定义):具体。(三)确定测验具体内容:双向细目表知识理解应用分析综合评价合计生物世界35632120资源利用23311010动力与机械23420112物质与能量56832125气象24322013宇宙25410012地球2221108合计1828301388100例:小学自然常识测验编题计划第二单元测题的编写一、收集测验资料设计项目的依据题目来源1.已有标准测验2.理论和专家的经验3.临床观察和记录二、命题的一般原则1.内容:符合目的;代表性;相互独立2.文字:准确;简要;意义明确3.理解:确切答案;普遍性4.社会敏感性方面:社会负评价的内容三、编制要领o种类:1.提供型题目(论文题、简答题、填充题)2.选择型题目(选择题、是非题、匹配题)(一)选择题o构成:题干+选项(正确选项与诱答选项)o原则:1.题干所提的问题必须明确2.选项要简短,必要的叙述或相同的修饰语应放在题干中;3.每题只给一个正确答案;4.各选项长度应相等;5.避免题干用词与选项用词一致;6.选项最好用同一形式(二)是非题o注意事项:1.内容以有意义的概念、事实或基本原则为基础。2.每题只包含一个概念,避免两个以上的概念在同一题中出现,造成题目似是而非,或半对半错。3.尽量采用正面肯定的叙述,避免反面陈述或双重否定的句子。如“生物没有不是由细胞组成的。”4.表达意见的题目,最好说明意见的来源和根据。5.“是”与“非”的题数应大致相等,且随机排列。(三)简答题o形式:填充题、简答题o原则:1.用问句形式2.填充题空格不宜过多3.每题只有一个正确答案(四)操作题o原则:1.明确测量目标,将其操作化2.尽量选择高真实性的项目3.指导语要简明扼要4.制定评分标准第三单元测验的编排和组织o(一)合成测验o(二)预测与项目分析o(三)信度和效度考察o(四)常模制订o(五)编写指导手册一、合成测验(一)选择与审定试题1.选择试题形式:取决于测验的目的、材料性质、测验对象、各种实际因素。2.审定题目:题目范围:要与双向细目表一致;题目数量:要比最终所需要的数量多,以便筛选或编制复本;题目的难度:测验目的;应有一定的分布范围;项目说明:用词力求清楚明白。(二)测题的编排o原则1.逐步由易变难2.同类型题目放在一起3.根据各类型测题本身特点排列p排列方式1.并列直进式:韦克斯勒量表2.混合螺旋式:比西量表二、试测与项目分析(一)试测u对象取样u施测过程与施测情景u时限可稍宽一些u记录被试的各种反应。(二)项目分析三、信度和效度考察四、常模制订o常模参照测验o方法:测验对象标准化样本施测评分统计(代表性分数分布)五、编写指导手册1、测验的目的和功用;2、编制测验的理论背景以及选择题目的根据和测验的构成;3、测验的实施方法、时限及注意事项;4、测验的标准答案和评分方法;5、测验的信度和效度资料;6、常模资料。第七节心理测验的使用第一单元主试资格1知识结构:基础知识、相关知识2专业知识和专业技能3职业道德:测验的保密和控制使用;测验中个人隐私的保护第二单元测验的选择o所选测验必须适合测量的目的o所选测验必须适合心理测量学的要求第三单元测验前的准备及注意事项o(一)测验前的准备工作1、向被试预告测验:测验的时间、地点、内容,让被试做好心理准备。2、熟悉测验程序:测验内容、施测步骤、记分方法、分数解释。3、准备测验材料。4、准备测验环境:通风、采光、噪声、桌椅高度、桌面大小、挂牌以防止以外干扰等。5、熟悉测验的指导语:告诉被试如何选择反应形式(划勾还是涂黑),说明时间限制,例题演示,有时告知被试测验目的。o二、测验中主试的职责o按照指导语要求实施测验o测验前不讲太多无关的话o对被试的反应不要暗示性反应o对特殊问题有所准备(如作弊、被试不配合等)。三、建立协调关系协调关系:主试和被试之间的友好、合作、能促使被试最大限度做好测验的关系第四单元测验实施的程序及要素一、指导语:被试、主试二、时限三、测验的环境条件第五单元被试误差及控制方法1应试技巧与练习效应2动机与焦虑因素3反应定势1.求快与求准的反应定势2.喜好正面叙述的反应定势3.喜好特殊位置的反应定势4.喜好较长选项的反应定势5.猜测的反应定势第六单元测验的评分一、原始分数的获得o为使评分尽可能客观,有三点要求:1.对被试反应的及时和清楚的记录。特别是对口试和操作测验。2.要有一张标准答案或正确反应的表格,即计分键。3.将被试的反应和计分键比较,对反应进行分类二、原始分数的转换第七单元测验结果的报告一、测验分数的综合分析1.根据心理测验的特点分析。对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释。2.不能把分数绝对化,对导致测验结果的原因(遗传、经验、测验情景)的解释要慎重。3.必须充分估计测验的常模和效度的局限性。解释分数应参考其它有关资料(受教育经历、文化背景、面谈内容、习惯、态度、兴趣、动机、健康、言语能力以及其他测验资料)。4.对来自不同测验的分数不能直接加以比较。二、报告测验分数1、使用当事人所理解的语言。2、要保证当事人知道这个测验测量或预测什么,但并不需要作详细的技术性解释。3、如果分数是以常模为参照的,就要使当事人知道他是和什么团体在进行比较。4、要使当事人认识到分数只是一个估计。5、要使当事人知道如何运用他的分数。6、要考虑测验分数将给受测者带来什么影响。7、测验结果应向无关的人员保密。8、对低分者的解释应谨慎小心。9、报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导。

    注意事项

    本文(王建心理测量学知识(咨询师).ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开