人力资源测评与调查第三讲-心理测验.ppt
人力资源测评与调查第三讲:心理测验基础、关键技术 主讲:李晓博内容提要心理测验概述心理测验基础心理测验是怎么编制出来的如何使用心理测验如何解释测验结果心理测验的关键技术信度效度心理测验的综合分析引子 心理测验应用1985年,美国联合航空公司进行的一项调查:在过去20年中,世界各地共发生过50000多起空难事件,其中只有1/5是机器故障,其余4/5是 。技术/资历和飞行时数-心理测验空军中的被淘汰率下降,美国70%36%;法国61%36%人力资源测评2008一、心理测验概述心理测量(psychological measurement)是通过科学,客观,标准的测量手段对人的特定的素质进行测量、分析、评价。P14心理测验是心理测量的一种具体方法和手段,它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处水平的手段。人力资源测评2008心理测验的基本类型从形式上可分为:问卷测验标准化的纸笔测验投射测验情境测验行为模拟与观察类测量基于工作情境的综合类测量 人力资源测评2008心理测验的基本类型-2从内容上可分为:智力测验:智力测验:比奈;瑞文推理测验;韦氏成人智力量表个性测验:个性测验:卡特尔16PF;MMPI明尼苏达多项人格问卷动机测验动机测验人力资源测评2008举例:韦氏成人智力量表分测验 11个言语量表常识背数词汇算术理解类同操作量表填图图片排列积木图图形拼凑数字符号分量表:平均数为10,标准差为3 P77-78人力资源测评20081.有人以56000元购得一间房子,纳税按房价的75%计算,税率是每100元收1.5元,该房纳税的款项是:A.310元 B.530元 C.630元 D.840元 E.1080元2.下列5个项目中哪个项目不属于同类?A.电话 B.电炉 C.无线电 D.电报 E.电视人力资源测评2008心理测验在工业/组织中的应用智力能力测验人格测验职业兴趣测验动机测验评价中心技术 20世纪30年代人力资源测评2008心理测验的五个基本要素心理测验实质上是行为样本的客观的和标准化的测量。行为样本标准化难度:难度水平影响测验的客观性:天花板、地板(差异性,区分度)效度:测量到的结果是否反映了所想要考察的内容。信度:测量结果的可靠性、稳定性。人力资源测评2008行为样本个体对所抽选出来的问题的解决行为就叫做行为样本(behavioral sample)目的是通过样本推测总体行为,关键是要保证样本能代表总体行为。行为样本的数量足够多样本具有代表性人力资源测评2008标准化(standardization)是指测验编制、实施、记分和解释必须遵循严格的统一的科学程序,保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。客观性与准确性题目的标准化实施过程与记分的标准化选用有代表性的常模人力资源测评2008常模(norm)曹冲聪明吗?曹冲有多聪明?司马光呢?高斯呢?一组具有代表性的被试样本的测验成绩的分布结构,包括它的集中趋势和离散度。平均数 标准差IQ=100+15*(X-M)/S 实验时间瑞文标准推理测验由英国著名心理学家RAVEN研制,于1938年公布实行。年龄跨度570岁,既可用于个别测试,也可用于团体施测,是一种跨语言,跨文化的国际上比较流行的量表。主要通过图形的辨别,组合,系列关系等测试一个人的推理能力。时间:60分钟瑞文推理测验瑞文推理测验以斯皮尔曼(Spearman)的智力的二因素理论为基础。整个测验分为5个组,分别测量知觉辨别知觉辨别能力、归类比较能力、图形推理与组合能力、归类比较能力、图形推理与组合能力、系列关系推理和逻辑能力、图形能力、系列关系推理和逻辑能力、图形互换和信息整合能力,互换和信息整合能力,每组有12题,由易到难排列,各组题的难度递增。瑞文推理测验A组:得分代表知觉辨别能知觉辨别能力力,是否只关注题目的部分信息,能否从整体上去获取信息并做出判断,区分对象与背景的能力如何,是否知道对象与背景具有相对性,并善于从不同的角度来看同样一个事物。B组:得分代表归类比较能力归类比较能力,是否能正确处理一个事物整体与部分之间的关系,观察能力如何,是否经常能注意到事物之间的细微差别。测验题目示例测验题目示例归类比较归类比较瑞文推理测验C组得分代表图形推理与组合能力图形推理与组合能力,是否经常能注意到事物之间存在的内在关系,并善于利用这种内在关系把事物进行组合。此外,联想能力如何,是否善于通过联想在事物之间建立关系。D组得分代表系列关系推理和逻辑系列关系推理和逻辑能力能力,对包含两层及两层以上逻辑联系的事物,能否注意到这些层,并根据对这些层之间联系的充分把握做出判断。此外,注意的分配能力如何,能否很好地分配自己的注意力。测验题目示例测验题目示例系列关系推理系列关系推理瑞文推理测验E组得分代表图形互换和信息整合能力图形互换和信息整合能力,能否把丰富的信息进行有效的整合,并从中得出问题的答案。此外,高级推理能力如何,当面对的问题包含的关系比较复杂时,能否梳理出问题包含的这些复杂关系,并总结出全面的规律。瑞文测验-百分位常模瑞文测验的总分分为5个水平,具体划分标准如下等级标准一级智力测验分数的百分等级等于或超过同年龄常模组的95,称为高水平智力。二级智力测验分数的百分等级界于75-94之间,称为智力水平良好。三级智力测验分数的百分等级界于25-74之间,称为中等水平智力。四级智力测验分数的百分等级界于5-24之间,称为智力水平低下。五级智力测验分数的百分等级低于5,称为智力缺陷。实验时间企业管理能力倾向测验到互动专区下载测验问卷与答卷将答案填在答卷上将答卷以自己姓名与学号命名发送到:能力倾向 P80-能力倾向(即潜能)是指经过适当训练或被置于适当的环境下完成某项任务的可能性,而不是当时就已经具备的现实条件。能力倾向与智力、知识、技能特点:相对广泛性:相对稳定性相对影响性能力倾向的测验企业管理能力倾向测验:言语理解、判断推理、数量关系、资料分析、思维策略思维策略行政职业能力倾向测验:数量关系、言语理解与表达、判断推理、常识判断、常识判断、资料分析管理能力倾向测验维度解释言语理解言语理解考察理解文字资料速度和准确度,以及用词的规范性.判断推理判断推理考察抓住问题的核心,把握事物之间复杂关系的能力.数量关系数量关系考察对数字的敏感度和心算能力.资料分析资料分析考察对图表的理解能力.思维策略思维策略考察思维的灵活性和多方法,多角度解决问题的能力.企业管理能力倾向测验第一部分第一部分 言语理解言语理解考察理解文字资料速度和准确度,以及用词的规范性包括三种类型的题目:词语填空、句子分析、阅读理解例题:只要方向正确,任何一点积极性都应当得到_和支持。A.尊重 B.肯定 C.表彰 D.重视解答:用肯定填空使句子的意思表达得最准确,故应选B。第二部分第二部分 判断推理判断推理考察抓住问题的核心,把握事物之间复杂关系的能力包括四种类型的试题:常识判断、图形推理、事件排序、演绎推理例题:(1)小李的建议没有被采纳(2)小李受到工厂的奖励(3)小李提出三项“合理化建议”(4)厂长说“贵在参与”(5)厂长号召职工关心企业建设A、4-2-3-1-5 B、5-2-3-4-1 C、5-3-1-4-2 D、4-2-1-3-5解答:此题正确答案为C。事件为:小李响应号召提出建议,尽管未被采用,仍然受到了奖励。这一顺序相对于其它被备选答案中的顺序而言最为合理。第三部分第三部分 数量关系数量关系考察对数字的敏感度和心算能力。例题:84.78元、59.50元、121.61元、12.43元及66.50元的总和是_元。解答:正确答案为D。实际上您只要把最后一位小数加一下,就会发现和的第二位小数是2,只有D符合要求。第四部分第四部分 资料分析资料分析这部分测试给您一些文字或图表,针对每一段文字或每一个图表可能有34个问题。考察对图表的理解能力第五部分第五部分 思维策略思维策略考察思维的灵活性和多方法,多角度解决问题的能力例题:某工厂的甲乙两个车间之间为了传送零件的方便互发运输车辆,甲车间从早上8点起每隔10分钟向乙车间发一辆车,乙车间从早上8点05分起每隔10分钟向甲车间发一辆,两个方向的车辆在同一条路线上行驶且速度相同,两车间相距刚好为运输车10分钟的路程,问两个方向的车辆几分钟会交错一次?A.20 B.10 C.6 D.5 解答:此题的正确答案为D。解决此题应这样考虑:两车相向行驶,其相对速度为两车速度之和,有了这样的正确思路,问题就可迎刃而解了。作业二小组作业二:测验的质量分析每组负责分析一个分测验。“常模”测算(平均数与标准差)项目分析(难度与鉴别度)实验时间-16PF本测验共有181道题目,都是有关个人的兴趣和态度等问题。每个人对这些问题是会有不同看法的,回答也是不同的,因而对问题如何回答,并没有对与不对之分,只是表明你对这些问题的态度。请你要尽量表达个人的意见,不要有顾虑。1每一测题只能选择一个答案。2不可漏掉任何题目。3尽量不选择B答案。4本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间。5有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。卡特尔16种人格因素测验(16PF)16PF(Sixteen Personality Factor Questionaire)是卡特尔1947年编制的。在国际上众多人格测验的试题中,被认为是非常经典的,其测评的准确度和广泛的适用性经过了时间考验。卡特尔是人格特质理论的主要代表人物,16PF也正是伴随着卡特尔的人格特质理论而发展的。16PF测验技术手册R.B.Cattell美国伊利诺州立大学测验结果报告自评:根据P129表6-4及参考资料中的描述对自己进行简单评价。比较自评结果与测验结果的异同。16PF测验技术手册人格测验人格一词,译自英文Personality,它来源于拉丁文Persona,原指戏剧表演时演员所戴的面具,而后引申为演员所扮演角色的特征。人格这个词在心理学上的广泛应用在上世纪30年代,当时主要作为性格(character)的替代概念而出现。因为在西方语境中,“性格”带有道德评价方面的含义,而“人格”则显得更为中性。这点与中文的语境正好相反。人格的概念与特性人们所具有的个体独特的独特的,稳定的稳定的对待现实的态度和习惯化了的行为对待现实的态度和习惯化了的行为方式方式,它是一个人区分于其他人的稳定的心理特征,是由先天和后天因素的交互作用而形成的。整体性 独特性和共同性稳定性可塑性人格的理论类型理论特质理论类型论认为人格可以划分为互不相容互不相容的几种类型,如外向,内向等。特质论主张人格可以通过有限的几个特质加以描述,如卡特尔的16种根源特质。特质论强调量的分析与连续的维度;而类型论则是把类型之间看作是互相独立和分离的,偏重质的研究。人格测量的方法自陈量表投射测验评定量表情景测验社会测量法心理测验基础心理测验是怎么编制出来的如何使用心理测验如何解释测验结果引子:最强大脑人力资源测评2008回顾:心理测验心理测量(psychological measurement)是通过科学,客观,标准的测量手段对人的特定的素质进行测量、分析、评价。P14你幸福吗?心理测验是心理测量的一种具体方法和手段,它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处水平的手段。人力资源测评2008心理测验的五个基本要素心理测验实质上是行为样本的客观的和标准化的测量。行为样本标准化难度:天花板、地板效度:测量到的结果是否反映了所想要考察的内容。信度:测量结果的可靠性、稳定性。人力资源测评2008一、心理测验编制确定测验的目的/测验的构思设计测试项目或题目项目的试测和分析合成测验将测验标准化内容指导语和时间限制记评分解释收集测验的信度效度资料编写测验使用手册1、测验的目的/构思稳定的素质特点(人才测评)能力因素(科学智能 社会智能)动力因素(价值观、动机、兴趣)个人风格要素(气质、MBTI)例:要测验一个人的能力。P72能力是什么?智力?能力倾向?特殊能力?人力资源测评2008智力测验 构思比较韦氏成人智力量表 P78 表4-1言语量表(常识(常识 背数背数 词汇词汇 算术算术 理解理解 类同)类同)操作量表(填图(填图 图片排列图片排列 积木图积木图 图形拼凑图形拼凑 数字符号)数字符号)瑞文标准推理测验A组:知觉辨别能力;B组:归类比较能力;C组:图形推理与组合能力;D组:系列关系推理和逻辑能力;E组:图形互换和信息整合能力智力 P73-75智力的二因素论。斯皮尔曼:普通因素(G)和特殊因素(S)多因素理论三维结构模型理论。吉尔福特。内容、操作、结果 5*5*6层次结构理论。唯农。智力的最高层次是一般因素,其下分为言语和操作两个大的因素群。三元智力理论。斯腾伯格。个人智力、自知力和人际智力。二因素论p斯皮尔曼用因素分析方法,分析被试者的各类测验成绩时,发现有一个因素与各类工作均有关,称为普通智力因素(普通智力因素(G G);但有些人数学测验成绩较好,而语文测验成绩较差;另一些人则相反。他认为这些差别或特长提示另一种因素的存在,即特殊智力因素(特殊智力因素(S S)。p普通能力系得自先天遗传,显示个人能力的高低。智力测验的理论基础瑞文的理论基础是:斯皮尔曼(Spearman)的智力的二因素理论韦克斯勒认为“智力是个人有目的地行动、理智地思考以及有效地应付环境的整体或综合能力”。韦氏的理论基础是什么呢?另一种构思方式另一种构思方式:16PF的编制过程4500个描述人类行为的词汇16种人格根源根源特质171项特质名称人力资源测评20082、题(项)目的设计建立一个题库。测验题目的来源:现有理论参考专家决定测量的模式。常用题目类型让专家评价最初的题库人力资源测评2008常用题目类型是非题我感到很难开口同陌生人交流()A 是 B 否折中是非题我认为只要双方同意,就可以离婚,无须受传统观念的束缚.A 是的 B 介于A.C之间 C不是的人力资源测评2008迫选题请在下列选项中选择其中一项,如果都喜欢,就选择两者中最喜欢的一项;如果都不喜欢,就选择相对不是那么厌恶的一项()A 我喜欢与不同性格特点的人交往B 我喜欢自己研究感兴趣的技术问题人力资源测评2008利克特偶数量表与奇数量表请在下列选项中选择最适合你的情况从事新的工作更令我兴奋.非常同意/比较同意/无所谓/比较不同意/非常不同意5 4.3.21选择题填充题企业管理能力倾向测验第一部分第一部分 言语理解言语理解考察理解文字资料速度和准确度,以及用词的规范性包括三种类型的题目:词语填空、句子分析、阅读理解例题:只要方向正确,任何一点积极性都应当得到_和支持。A.尊重 B.肯定 C.表彰 D.重视解答:用肯定填空使句子的意思表达得最准确,故应选B。第二部分第二部分 判断推理判断推理考察抓住问题的核心,把握事物之间复杂关系的能力包括四种类型的试题:常识判断、图形推理、事件排序、演绎推理例题:(1)小李的建议没有被采纳(2)小李受到工厂的奖励(3)小李提出三项“合理化建议”(4)厂长说“贵在参与”(5)厂长号召职工关心企业建设A、4-2-3-1-5 B、5-2-3-4-1 C、5-3-1-4-2 D、4-2-1-3-5解答:此题正确答案为C。事件为:小李响应号召提出建议,尽管未被采用,仍然受到了奖励。这一顺序相对于其它被备选答案中的顺序而言最为合理。第三部分第三部分 数量关系数量关系考察对数字的敏感度和心算能力。例题:84.78元、59.50元、121.61元、12.43元及66.50元的总和是_元。解答:正确答案为D。实际上您只要把最后一位小数加一下,就会发现和的第二位小数是2,只有D符合要求。第四部分第四部分 资料分析资料分析这部分测试给您一些文字或图表,针对每一段文字或每一个图表可能有34个问题。考察对图表的理解能力第五部分第五部分 思维策略思维策略考察思维的灵活性和多方法,多角度解决问题的能力例题:某工厂的甲乙两个车间之间为了传送零件的方便互发运输车辆,甲车间从早上8点起每隔10分钟向乙车间发一辆车,乙车间从早上8点05分起每隔10分钟向甲车间发一辆,两个方向的车辆在同一条路线上行驶且速度相同,两车间相距刚好为运输车10分钟的路程,问两个方向的车辆几分钟会交错一次?A.20 B.10 C.6 D.5 解答:此题的正确答案为D。解决此题应这样考虑:两车相向行驶,其相对速度为两车速度之和,有了这样的正确思路,问题就可迎刃而解了。对最初的题项库进行评价练习。以16PF量表为例。每小组对1-2个因素的分量表的题项进行评价。对每道题与拟测因素的相关程度及题项的清晰性进行评价。高、中、低。作业二小组作业二:测验的质量分析每组负责分析一个分测验。常模测算(平均数与标准差)项目分析(难度与鉴别度)3、项目分析进行试测,并根据试测结果对组成测验的各个题目(项目)进行分析,从而评价题目好坏,对题目进行筛选,对量表进行优化。难度分析鉴别度分析平均数与方差(利克特量表)人力资源测评2008项目难度分析难度指题目的难易程度,非能力测验难度是指题目的“通俗性”通过率:P=R/N*100%高分组(总分最高的27%)与低分组(总分最低的27%)通过率的平均数难度分析通过率只是表示难易的顺序,不能表示难易的差距。60%,40%,20%(60与40,40与20哪个差距大呢?)等距量表的难度指标。根据正态曲线表可查出任何通过率对应的值。84%也可转化为美国教育测验机构采用的难度指标=13+4X X是正态化的Z分数 16%难度的确定题目难度水平的确定测验的目的出发:平均难度0.5,难度在0.5+0.2测验的作用出发:选拔,尽量使难度值接近录取率从题目的形式出发:值应大于概率水平。真正的难度0.5最合适,此时计算所得的最合适的P 为(k+1)/2k K为选项数测验难度水平的确定使得得分尽量呈现正态分布。人力资源测评2008项目鉴别度分析指项目得分对被试实际能力或心理特质水平的区分能力或鉴别力,也即项目得分的高低与被试实际能力或心理特质水平高低的一致性程度。可从项目效度分析与内部一致性分析两方面入手。鉴别度分析:项目效度分析以效标为依据,考察被试在每个试题上的反应与其在效标上表现的相关程度。1、相关系数。点二列相关系数。效度系数高于0.2一般可以保留;低要修改或删除2、鉴别度指数:比较效标得分高和得分低的两组被试在项目上通过率上的差值 D=PH-PLD值高低与题目的有效性。点二列相关系数pqStXp-XqRpb=项目的分数以二分法计,答对1分,答错计0分。P代表通过该题的人数百分比;q代表未通过该题的人数百分比;st代表全体被试效标成绩的标准差Xp代表通过该题被试的平均效标成绩;Xq代表未通过该题被试的平均效标成绩;鉴别度分析:内部一致性分析当难以找到合适的效标时,可以采用测验的总分代替效标,考察每个试题和总分的一致性,即做项目项目-总分分析总分分析 可以计算相关系数或鉴别度指数。使用总分代替效标,需满足条件:每个每个项目方差相同,或测验项目较多。项目方差相同,或测验项目较多。计算每题与所有其他项目合成分数之间的相关。鉴别度的标准鉴别度的值具有相对性,很难确定筛选项目的绝对标准。要考虑样本大小和特性,测验的目的、性质和功能等。成就测验,一般要求项目和部分的相关达以0.2,鉴别度指数达到以上;一般心理测验,D值在0.3以上。美国测验专家伊贝尔提出一个标准鉴别度指数(鉴别度指数(D D)试题评价试题评价0.4以上很好0.3-0.39良好,最好修改0.2-0.29可以,必须修改0.19以下差,必须淘汰项目效度与内部一致性的比较项目效度代表题目与外在效标的关系,内部一致性代表题目与部分的关系。两者有时会矛盾根据测验目的。如果是预测性测验,多采用项目效度高的题目;如果测验要求同质,即希望各个试题测量同一特质,则选内部一致性高的如果测量的变量复杂,则采用分量表,要求各个分测验与外在效标有很高的相关,但彼此之间相关要低,分测验内部各题目彼此的相关要求很高。人力资源测评2008测验使用手册一般信息目的和作用理论背景和题目的来源实施方法,时间要求及注意事项标准答案与记分方法常模表,适用团体及计分系统,解释系统,样本的选择方法信效度资料例实验校园招聘案例演示综合实验1-校园招聘中的人才测评人力资源测评2008二、测验(测评)的操作标准化的指导语测量时限典型行为测验(典型反应:观察与自我报告)最高作为测验(最好成绩)测验的环境条件指导语-举例请在答题卷的右上角写上你的名字。在测题本上不要做任何记号。本测验的目的是考察你的逻辑推理能力。请将你的答案写在答题纸上,在每道题中你认为正确的选项上画圈表示,例如 。你的测验成绩将由你正确回答的题目的数量决定。因此,在你对某题没有把握时可以猜测,不要漏掉任何题目。如果测验时有什么问题,可以举手,询问主考人员。完成测验后请将答题纸和测试题本一起交给主考人员,之后离开考场。人力资源测评2008主试的职责测量前的准备工作(包括面试、评价中心等)预告测验、熟悉指导语、准备测验材料熟悉测验的具体程序确保满意合适的测验环境测验中主试的职责建立协调关系人力资源测评2008实施过程可能导致误差的影响因素主试对测量结果的影响主试的人格特点主试的期望罗森塔尔效应皮格马利翁效应实验者期望误差人力资源测评2008被试特点对测量结果的影响测量技巧与练习因素焦虑和动机因素应试动机 社会期望测验焦虑 反应定势求快与求精确(答题时间设计)肯定反应定势(是非题选择偏好是)位置定势偏好较长选项的反应定势猜测的反应定势 (猜测修正)人力资源测评2008实施测量计分的要领与误差控制计分的基本步骤记录反应、检索标准答案、反应和标准答案的比较问答题计分宽容定势和晕轮效应整体计分和分析计分客观题计分举 例北森新16PF测评,最后保留了181道题目,量表中的题目有三个选项,采用“0、1、2”的计分方式,每道题目的得分范围是02分。北森智维通用选拔,各个分量表中的题目采用Likert五点量表的形式,理论上假设对这五个点的判断在心理上是等距的,因此采用等距式记分方法。每道题目的得分范围是分。将每一道题的得分相加得到量表分。人力资源测评2008三、测验结果的解释常模参照解释效标参照解释原始分数:是将应试者的反应与标准答案相比较而直接获得的,只是一个过渡值标准分:原始分数与常模比较,可以转换成标准分。可以相互比较人力资源测评2008常模与基于常模的解释如何选择常模样本常模的类型百分位常模标准分数常模常模的表示方法转化表。常模表剖析图如何选择常模样本常模样本的构成 举例:16PF 智维通用总体与样本,样本的代表性取样的方法:随机取样。每个元素都有同样的机会入选样本。简单随机取样;分层抽样非随机取样。便利取样北森新16PF常模群体共1760人,下面是常模群体的具体分布情况:智维通用人才选拔系统量表开发项目的数据调查采用了网络收集的方法,自2005年9月16日起,9月30日结束,共收集到913份有效数据,被试的详细分布情况见下表。样本的代表性总体(population)拟测评或调查的人或事物的全体抽样架构。总体的详细名单总体的每个人或事物称为元素元素样本(sample)从抽样架构中选取的人群。但关心的不是样本而是总体。代表性。样本结果能推广至总体的能力取决于代表性。样本必须与总体的特征具有相同的分布状况。有偏样本瑞文测验-百分位常模瑞文测验的总分分为5个水平,具体划分标准如下等级标准一级智力测验分数的百分等级等于或超过同年龄常模组的95,称为高水平智力。二级智力测验分数的百分等级界于75-94之间,称为智力水平良好。三级智力测验分数的百分等级界于25-74之间,称为中等水平智力。四级智力测验分数的百分等级界于5-24之间,称为智力水平低下。五级智力测验分数的百分等级低于5,称为智力缺陷。新16PF测评标准分数常模采用标准十计分方式,最高分为10分,最低分为1分。5.5分为平均分,标准差为2,每1分之间的差距为0.5个标准差。原始分数转为标准十分数具体公式为:其中,Sten代表被试在某维度上的标准十得分,x代表被试在该测验维度上的得分,代表常模群体在该维度上得分的平均分,s代表常模群体在该维度上的标准差。再将标准十分划分为三个等级,13分为低分,47分为中等分数,810分为高分。16PF常模对照表人力资源测评2008效标与基于效标的解释效标参照解释效标参照解释(criterion reference explanation)是依据外在效标作为标准来对应试者的分数进行解释。内容参照分数内容参照分数的解释结果参照分数结果参照分数的解释内容参照分数内容参照分数的解释确定应试者对某个确定材料内容或技能的掌握和熟悉程度的分数。比较的内容不是其他人,而是内容的多少。新员工培训后的测验新员工培训后的测验掌握分数。通过或掌握的最低分数。驾考驾考正确百分数。与掌握或熟练标准的百分数比较结果参照分数结果参照分数的解释将效标材料直接结合到测验结果的解释过程而进行评价的分数。预测性测验往往适合用结果参照分数进行解释。用期望表期望表表示。期望表说明了一个给定的原始分数或分数等级获得不同效标分数或等级的可能性有多大,这种可能性用人数百分比来表示。期望表 示例原始分数原始分数效标(效标(%)EDCBA0-1.92-2.93-3.94-4.95-5.96-6.97-7.98-9.975-791001006770-74100100823665-691009450331160-64100854822455-59100886331450-5410094834512545-49100876124540-4410096724020435-3910085461530-34100解释测验分数向受测者传达测验结果16PF测评最后给出的报告有:剖面图、整体描述、16个子维度解释、二元维度等四个部分团体测评。团体与常模样本的关系向决策者传达测验结果测量的关键技术信度分析效度分析根据测评所做的决策效标测验分数淘汰录取成功错误拒绝正确接受正确接受失败正确拒绝正确拒绝错误接受测量误差误差:测量中与目的无关的变因所产生的不准确、不一致效应。误差的来源心理误差-考官测量误差-测试者与工具测量误差系统误差由与测验目的无关的因子所引起的恒定、系统的有规律的变化,存在于每次测量中,又称为常定误差。与信度无关,与效度有关。随机误差由与测验目的无关的偶然因素引起,使得几次测量不一致,且这种不一致是无系统的、随机的。真分数理论真分数是测量中不存在误差时的真值或客观值,操作定义就是无数次测量的平均值。用T表示测量分数X=T+E (E是误差)三个基本假设:误差分数的平均数为0;误差分数与真分数相关为0;两次测量的误差分数相关为0。二、信度分析信度指测量结果的可靠性与一致性。信度高低的指标通常以相关系数表示,称为信度系数(reliability coefficient)理论上表示为:信度就是一组测验分数中真分数方差与实测分数方差的比率。信度解释为总的方差中有多少比例是由真实分数的方差决定的。如0.9,可以说实得分数中有90%的方差反映了真实分数的差别,仅有10%来自测量的误差。P29-35信度可接受水平一般的能力与成就测验的信度系数在0.9以上;人格、兴趣等测验的信度系数通常在之间。一般来说,小于0.7,不能用测验对个人作评价,也不能在团体间作比较;大于0.7,可以进行团体间比较;大于0.85,可用于鉴别个人。信度多高才算可靠 对人力资源测评中信度系数与测评质量的关系,以下给出了几种测验的信度系数:测验类型测验类型信度信度低低中中高高成套成就测验成套成就测验0 066660 092920 09898学术能力测验学术能力测验0 056560 090900 09797成套倾向测验成套倾向测验0 026260 088880 09696客观人格测验客观人格测验0 046460 085850 09797兴趣问卷兴趣问卷0 042420 084840 09393态度量表态度量表0 047470 079790 09898如何评估人事测量的信度根据信度的操作性定义来求信度,也根据求信度的不同方法来给信度分类的。误差来源误差来源重测信度复本信度内部一致性信度评分者信度重测信度稳定性系数用同一测验,在不同时间对同一群体施测两次,这两次测量分数的相关系数。一般采用皮尔逊积差相关系数.(2周到6个月)例如:在技能测评中李某的分数是,在全体被测者中排名第一,这到底准不准呢?我们再重复测评一次,结果李某的分数是,还是排名第一,而且其他被测的位置顺序变化很小,我们就可以说第一次的技能测评结果很可靠。复本信度等值性系数,它是以两个测验复本来测量同一群体,然后求得应试者在这两个测验上得分的相关系数。为排除顺序影响,将被试分两组,一组先做A卷,再做B卷;另一组则相反。内部一致性信度分半信度分半信度系数。是通过将测验分成两半,计算这两半测验间的相关同质性信度同质性信度测验内部的各题目在多大程度上考察测验内部的各题目在多大程度上考察了同一内容。了同一内容。库德库德-理查逊理查逊 2020号公式号公式 常用常用 克伦巴赫克伦巴赫系数(多重计分)系数(多重计分)克伦巴赫克伦巴赫系数(系数(Cronbachs),),公式为公式为K为题目数,是测验总方差,是每一项目的方差基础研究中Cronbach 系数至少应达到0.8才能接受,在探索研究中Cronbach 系数至少应达到0.7才能接受,而在实务研究中,Cronbach 系数只需达到0.6即可。评分者信度不同评分者对同样对象进行评定时的一致性。(评分者的主观误差)肯德尔知谐系数提高测评者的测评能力:对测评标准的理解与把握;对测评信息的收集、分析与判断;对各种心理效应导致误差的控制技巧。高信度的评分者用高信度的测评方法获得高信度的测评结果;高信度的评分者用低信度的测评方法难以获得高信度的测评结果;低信度的评分者用高信度的测评方法难以获得高信度的测评结果;低信度的评分者用低信度的测评方法获得的结果必然不可靠。标准参照测验中的信度以上几种信度都是针对常模参照测验常模参照测验而言的。标准参照测验中的信度计算通常使用分类一致性信度,这种信度的的常用估计方法是考察同一批被测者在两次试测或者复本测验中的分类是否一致。标准参照测验标准参照测验中的信度也可以使用K系数计算,较分类一致性信度在统计上更合理。影响信度的因素分数分布的范围分数接近,分布狭窄,信度减小。样本团体的性质测验的长度越长,信度越高斯皮尔曼-布郎公式测验的难度各种信度系数应用 信度系数类型估计方法应用稳定性系数重测法(积差相关)人格、速度测验等值性系数复本法(积差相关)智力、学绩、速度测验等值稳定性系数复本法(积差相关)智力、学绩、人格测验内部一致性系数分半法(积差相关,用斯-布公式校正)库德尔-理查森公式法系数法智力、学绩、选拔测验评分信度系数斯皮尔曼等级相关法肯德尔和谐系数法作文、创造力、投射、道德判断测验三、效度分析一个测验对其所要测量的特性测量到什么程度的估计。测验测到它要测的东西了吗?测验对它所测量的东西测量到什么程度?定义:与测量目标有关的真分数方差与总分方差的比率。X=T+I+E I表示系统误差(与测量目标无关但稳定的方差)P35-48信度和效度的关系信度是效度的必要条件信度系数的平方根是效度系数的最大值。效度的性质效度是针对测验结果的。结果的有效程度效度是针对某个特定的目的的。效度只有程度上的差异。如何评估测量的效度根据评估效度方法的不同,效度可分为:内容效度效标关联效度构想效度内容效度检查测验内容是否是所要测量的行为领域的代表性取样的指标。(成就测量)内容效度一般没有可能的数量化指标,只能靠推理和判断来进行评估。专家评定双向细目表效标关联效度测验分数与外在标准的相关程度又称实证效度、效标效度、效标关联效度,是指测评结又称实证效度、效标效度、效标关联效度,是指测评结果与效标的一致性程度。效标是一种用来衡测评有效性果与效标的一致性程度。效标是一种用来衡测评有效性的外在参照标准的外在参照标准,它可以是一种测评的结果它可以是一种测评的结果,也可以是也可以是标准测评分数。管理能力倾向测验的效标可以是将来管标准测评分数。管理能力倾向测验的效标可以是将来管理工作的绩效。理工作的绩效。预测效度和同时效度。效标与效标测量。常用效标:学术成就,特殊训练成绩,实际工作表现,团体对照,等级评定和先前有效的测验等效标关联效度的估计方法效度系数组的分类:根据在效标上的表现将被试分组,这些组在分数上如果有显著差异,则预测效度较高。例:根据某公司中2个典型的职业类型来分析北森新16PF测评系统V2.2的效度:管理类和IT类。在乐群性A、影响性B、规范性F、冒险性H这四个维度上,管理类人员的得分显著高于IT类技术人员。构想(结构)效度Constructvalidity测验能测到理论上的结构或特质的程度。结构,构思,构想。用来表示解释人类行为的理论框架或心理特质,即那些抽象的假设性概念、特性或变量,如智力、动机、能力等。它们在物理上不存在,不能直接测量,需要借助测评工具。常用方法因子分析聚合效度和区分效度举例北森智维通用人才选拔系统结构效结构效度度 本量表的维度标准基于经典的CPI问卷,经过因素分析,前两个因素可以解释64.2,见表5.2,与国内修订的问卷负荷的因素近似,可以概括为机变性和控制性。聚合效度与区分效度举例你幸福吗?快乐、生活满意度、自尊、乐观主义,这些不同指标是在测同一概念还是测量各自的概念?生活满意度量表SWLS(Satisfactionwithlifescale)五项目生活满意度量表(LS-5)和正性情感量表(PA,积极情感,更广义的幸福)SWLSLS-5PASWLS(.88)LS-5.77(.90)PA.42.47(.81)聚合聚合区分区分效度的应用效标分数的预测和预测误差建立测验分数与效标分数的回归,对效标分数进行预测。效度越大,预测误差越小,置信区间就会越窄,预测也就越精确。测验安排职业锚测验职业兴趣测验基础实验三:职业锚与职业兴趣的辨析结构化面试测验网上测评。朗途职业生涯测评系统心理测验的综合分析 人力资源测评2008常用的心理测验智力能力测验-管理能力倾向人格测验-MBTI职业兴趣测验-HLD职业兴趣动机测验-动机综合评价 练习外向 直觉 感性 决断52361063艺术 传统 企业 研究 实际 社交70337910891权力 成就 亲和 回避13209082一、管理能力倾向测验言语理解考察理解文字资料速度和准确度,以及用词的规范性.判断推理考察抓住问题的核心,把握事物之间复杂关系的能力.数量关系考察对数字的敏感度和心算能力.资料分析考察对图表的理解能力.思维策略考察思维的灵活性和多方法,多角度解决问题的能力.二、人格测验-MBTI左右手。优势与不足一对母女和MBTIMyer-Briggs Type Indicator(梅尔-布来格类型指标)美国每年有超过200万份测试被使用作用广泛:自我了解和发展、职业发展和探索、团队建设、人际关系辅导理论基础是荣格的理论容格的类型理论容格认为,不同的行为源于各人在运用心智方面,天生有不同的倾向。人们按照各自的倾向行事,便逐渐形成各自的行为模式。容格观察到,有些人倾向于把精力专注于外在世界的人、经验和活动,并从中得到动力动力;而另一些人则倾向于专注于内在世界的意念、记忆和情绪,并从中得到动力动力。容格把这两种不同的动力取向,取名为外向和内向外向和内向。容格的8种人格类型外向感性型内向感性型外向理性型内向理性型外向辨识型内向辨识型外向直觉型内向直觉型MBTI 概述(二)外向(E Extravert)内向(I Introvert)辨识(S Sensing)直觉(iN Ntuition)理性(T Thinking)感性(F Feeling)决断(J Judging)熟思(P Perceiving)行为风格维度的解释(1)外向者外向者主要定位于外部世界,倾向于集中在人和事上,他们是“活动”定向的,具有易沟通、好交际的特点。易适应环境,随环境变化随时调整。经常被外部的人和