素质测评的质量分析.ppt
《素质测评的质量分析.ppt》由会员分享,可在线阅读,更多相关《素质测评的质量分析.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十二章第十二章 素质测评的质量分析素质测评的质量分析l一项测评是否可靠、可信?l一项测评是否准确、有用?l一项测评是否公正、公平?l一项测评是否经济、合理?l教学内容教学内容12-1 12-1 测评的信度测评的信度 12-1-1 12-1-1 信度及其影响因素信度及其影响因素 12-1-2 12-1-2 信度的评估方法信度的评估方法12-2 12-2 测评的效度测评的效度 12-2-1 12-2-1 效度及其影响因素效度及其影响因素 12-2-2 12-2-2 效度的评估方法效度的评估方法12-3 12-3 项目分析项目分析 12-3-1 12-3-1 测评的难度分析测评的难度分析 12-3
2、-2 12-3-2 测评的鉴别度分析测评的鉴别度分析 12-3-3 12-3-3 测评的公平性分析测评的公平性分析 12-3-4 12-3-4 测评的经济效益分析测评的经济效益分析12-1 12-1 测评的信度测评的信度l信度是标准化素质测评的基本要求之一,信度是标准化素质测评的基本要求之一,如果测评工具的信度不理想,测量结果就如果测评工具的信度不理想,测量结果就无法被认为能代表应试者的一致、稳定和无法被认为能代表应试者的一致、稳定和可靠的行为表现,就可能误导对应试者的可靠的行为表现,就可能误导对应试者的评价。评价。12-1-1 12-1-1 信度及其影响因素信度及其影响因素l如果我们用一个游
3、标卡尺来测量一个钢管的外直径,每次测量如果我们用一个游标卡尺来测量一个钢管的外直径,每次测量时都难免会有一定的误差。时都难免会有一定的误差。l首先,游标卡尺作为一种测量工具是有一定精度限制的,也就首先,游标卡尺作为一种测量工具是有一定精度限制的,也就是说,测量工具本身存在误差。当然这种误差是必然存在的,是说,测量工具本身存在误差。当然这种误差是必然存在的,而且误差是在一定范围中有规律的变动的,这种误差在测量工而且误差是在一定范围中有规律的变动的,这种误差在测量工作中被称之为作中被称之为系统误差(系统误差(systematic errorsystematic error)。l其次,我们每一次测量
4、都可能出现操作上的差异,或者由于不其次,我们每一次测量都可能出现操作上的差异,或者由于不可预见的外界因素的影响,产生测量误差。这些误差是很难控可预见的外界因素的影响,产生测量误差。这些误差是很难控制的,而且无规律可循,有时大有时小,这种误差被称为制的,而且无规律可循,有时大有时小,这种误差被称为随机随机误差(误差(random errorrandom error)。l前者在一定程度上可以控制,而后者很难控制,一个好的测量前者在一定程度上可以控制,而后者很难控制,一个好的测量工具应该不仅要有尽可能高的精确度(与系统误差相关),还工具应该不仅要有尽可能高的精确度(与系统误差相关),还能够把误差控制
5、在一个有规律的范围以内,这样才能够得到稳能够把误差控制在一个有规律的范围以内,这样才能够得到稳定可信的测量结果。定可信的测量结果。信度实际上就是对随机误差的一种度量。信度实际上就是对随机误差的一种度量。1、信度的概念、信度的概念l信度(信度(reliabilityreliability)信度是标示测验一致性高低的)信度是标示测验一致性高低的统计指标。主要指测量结果的统计指标。主要指测量结果的可靠性、稳定性和一可靠性、稳定性和一致性致性,可以定义为测验结果不受测验情境或测验过,可以定义为测验结果不受测验情境或测验过程中无关变量影响的程度。实际上就是指测验分数程中无关变量影响的程度。实际上就是指测
6、验分数不受测量误差影响的程度。可以指出测验出的个体不受测量误差影响的程度。可以指出测验出的个体差异在多大程度上是真正的差异,又在多大程度上差异在多大程度上是真正的差异,又在多大程度上是由于随机误差造成的。是由于随机误差造成的。l随机误差越大,信度就越低。反之,信度就越高。随机误差越大,信度就越低。反之,信度就越高。l通常任何测验都存在某种程度的不一致性(同一受通常任何测验都存在某种程度的不一致性(同一受试者在不同时间或在不同的测验条件下做同一测验)试者在不同时间或在不同的测验条件下做同一测验)l因为误差的存在,我们永远不可能完全揭示人的心因为误差的存在,我们永远不可能完全揭示人的心理特点,只能
7、无限接近真实分数。理特点,只能无限接近真实分数。测量结果的稳定性:测量结果的稳定性:l测验分数一致性的程度(不同时间、测验条件测验分数一致性的程度(不同时间、测验条件下所得分数之间的一致性)下所得分数之间的一致性)l一个人获得分数与一个人获得分数与“真实分数真实分数”之间的接近程之间的接近程度度l测量结果的一致性是否达到实际应用的程度测量结果的一致性是否达到实际应用的程度影响稳定性的原因:影响稳定性的原因:l什么因素造成了这种差异(误差的来源)什么因素造成了这种差异(误差的来源)l这些效应的相对作用如何(分数的实际含意)这些效应的相对作用如何(分数的实际含意)在研究信度时,主要应考虑两方面的问
8、题:在研究信度时,主要应考虑两方面的问题:信度的计算:信度系数信度的计算:信度系数l信度指标的一般公式:测验分数信度指标的一般公式:测验分数 =真实分数真实分数 +测量误差测量误差 或者:或者:X=T+eX=T+el信度的高低通常以相关系数表示,称为信度系数信度的高低通常以相关系数表示,称为信度系数(reliability coefficientreliability coefficient)。)。信度系数一般是同一样本信度系数一般是同一样本所得的两组资料的相关,因此有:所得的两组资料的相关,因此有:测验分数方差测验分数方差 =真实分数方差真实分数方差+误差分数方差误差分数方差 X X2 2
9、=T T2 2 +e e2 2l信度系数:信度系数:r rxxxx=T T2 2 /X X2 2 =T T2 2 /(T T2 2 +e e2 2 )l信度系数即是真实分数方差(变异数)与测验分数总方差信度系数即是真实分数方差(变异数)与测验分数总方差(变异数)之比。(变异数)之比。2、信度的作用、信度的作用l测验信度要能够区分出:测验信度要能够区分出:导致一致性的因素:导致一致性的因素:个体稳定的特性(测量对象)个体稳定的特性(测量对象)导致不一致性的因素:导致不一致性的因素:可能影响测验,但又与测验可能影响测验,但又与测验对象没有关系的个体和环境的特性对象没有关系的个体和环境的特性 l在素
10、质测评中,对信度系数进行确定通常有以下作用:在素质测评中,对信度系数进行确定通常有以下作用:解释真实分数与实得分数之间的相关解释真实分数与实得分数之间的相关说明可以接受的信度水平说明可以接受的信度水平几种心理测验的信度系数几种心理测验的信度系数测验类型测验类型信度信度低低中中高高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向性测验0.260.880.96客观人格测验0.460.850.97兴趣问卷0.420.840.93态度量表0.470.790.983、信度的影响因素、信度的影响因素l 受试者个体持久而泛化的特性受试者个体持久而泛化的特性:进行测验的一般技能
11、水平进行测验的一般技能水平理解测验指示语的一般能力水平理解测验指示语的一般能力水平进行类似测验的一般的人格特质进行类似测验的一般的人格特质l 受试者个体持久而特殊的特性受试者个体持久而特殊的特性:进行某项测验(或其形式)需要的特殊的技能、能力进行某项测验(或其形式)需要的特殊的技能、能力 和和特质;以及稳定的反映定势;特质;以及稳定的反映定势;对某个测验项目内容的熟悉程度对某个测验项目内容的熟悉程度l 受试者个体短时而泛化的特性受试者个体短时而泛化的特性:健康、疲劳、动机、情绪状态、测验自如性;温度、健康、疲劳、动机、情绪状态、测验自如性;温度、光光亮、通风等测验外部条件亮、通风等测验外部条件
12、l 受试者个体短时而特殊的特性受试者个体短时而特殊的特性对特殊测验的理解,测验所需要的特殊技巧;为做测验对特殊测验的理解,测验所需要的特殊技巧;为做测验所进行的练习;所进行的练习;对测验项目内容的注意、记忆等的飘忽不定。对测验项目内容的注意、记忆等的飘忽不定。l 影响测验过程和解释的外部因素系统改变影响测验过程和解释的外部因素系统改变测验条件;对测验的各种限制;干扰程度;指示语的清测验条件;对测验的各种限制;干扰程度;指示语的清晰度;晰度;受试者在个性、性别、种族等与测验主试的交互作用;受试者在个性、性别、种族等与测验主试的交互作用;对测验结果的不一致或有偏差的评判。对测验结果的不一致或有偏差
13、的评判。l无法解释的变化(随机因素)无法解释的变化(随机因素)猜测、运气,以及暂时的干扰猜测、运气,以及暂时的干扰12-1-2 12-1-2 信度的评估方法信度的评估方法l针对不同的误差来源,信度可以有不同的确定方法。针对不同的误差来源,信度可以有不同的确定方法。信度系数类型信度系数类型误差来源误差来源重测信度重测信度时间取样时间取样复本信度(即时)复本信度(即时)内容取样内容取样重测复本信度(延迟)重测复本信度(延迟)时间和内容取样时间和内容取样分半信度分半信度内容取样内容取样同质性信度同质性信度内容的异质性内容的异质性评分者信度评分者信度评分者间差异评分者间差异1 1、重测信度、重测信度(
14、test-retest reliability)l又称为又称为稳定性系数稳定性系数,是采用重测法计算信度的方,是采用重测法计算信度的方法,即用同一测验在不同时间对同一对象施测两法,即用同一测验在不同时间对同一对象施测两次,两次测量分数的相关系数即为重测系数。次,两次测量分数的相关系数即为重测系数。l人事测量所测查的特质中,有相当多的内容具有人事测量所测查的特质中,有相当多的内容具有一定的稳定性,如人格、能力倾向等,因此,对一定的稳定性,如人格、能力倾向等,因此,对于这些内容而言,重测信度对于衡量测量工具的于这些内容而言,重测信度对于衡量测量工具的质量是很重要的指标。质量是很重要的指标。重测信度
15、的考察对象重测信度的考察对象l重测信度所考察的误差来源是时间的变化所带来的随机影重测信度所考察的误差来源是时间的变化所带来的随机影响(气候、噪音的干扰、疾病、疲劳、情绪的影响等),响(气候、噪音的干扰、疾病、疲劳、情绪的影响等),根据重测相关系数的高低,可以得知测量结果在经过一段根据重测相关系数的高低,可以得知测量结果在经过一段时间之后的稳定程度。时间之后的稳定程度。重测信度表示测量能够应用于不同重测信度表示测量能够应用于不同时间的程度,信度越高说明测量结果受环境中日常的随机时间的程度,信度越高说明测量结果受环境中日常的随机因素影响越小,测量结果越稳定、可靠因素影响越小,测量结果越稳定、可靠。
16、l评估重测信度时,要注意重测间隔的时间,时间太短被试评估重测信度时,要注意重测间隔的时间,时间太短被试对测试题记忆犹新,必然会造成假性相关;时间太长,测对测试题记忆犹新,必然会造成假性相关;时间太长,测验结果又会受应试者的身心特质改变的影响,使相关系数验结果又会受应试者的身心特质改变的影响,使相关系数降低。间隔时间的长短必须根据测验的性质和目的来确定。降低。间隔时间的长短必须根据测验的性质和目的来确定。如果希望测量结果能预测较长时间的变化,则重测间隔时如果希望测量结果能预测较长时间的变化,则重测间隔时间应该长一些。例如人格测验一般间隔间应该长一些。例如人格测验一般间隔2-62-6个月比较合适。
17、个月比较合适。应用重测信度应注意:应用重测信度应注意:l重测信度一般只反映由随机因素导致的变化,而不反映被测者重测信度一般只反映由随机因素导致的变化,而不反映被测者行为的长久变化。例如被测者智力的发展与能力的提高,不是行为的长久变化。例如被测者智力的发展与能力的提高,不是重测信度考察的因素。这些因素导致的重测相关系数的降低,重测信度考察的因素。这些因素导致的重测相关系数的降低,不能说明测验的重测信度低。不能说明测验的重测信度低。l不同行为受随即误差影响不同。例如手指敏捷性就比言语理解不同行为受随即误差影响不同。例如手指敏捷性就比言语理解力更容易受疲劳、环境等因素的影响。因此必须分析测量目的力更
18、容易受疲劳、环境等因素的影响。因此必须分析测量目的和了解所预测的行为。当测量的行为或特质较为稳定时,重测和了解所预测的行为。当测量的行为或特质较为稳定时,重测信度的解释才有效。信度的解释才有效。l只有不大容易受重复影响的测验,如感觉只有不大容易受重复影响的测验,如感觉-运动测验或人格测验,运动测验或人格测验,才比较适合用重测法计算信度系数。因为被测者一旦知道答案才比较适合用重测法计算信度系数。因为被测者一旦知道答案就不容易忘记,从而造成假性相关。就不容易忘记,从而造成假性相关。2、复本信度、复本信度(alternative-form reliability)l又称为又称为等值性系数等值性系数,
19、它是以两个测验复本(功能,它是以两个测验复本(功能等值但题目内容不同)来测量同一对象,然后求等值但题目内容不同)来测量同一对象,然后求得被测者在这两个测验上得分的相关系数。复本得被测者在这两个测验上得分的相关系数。复本信度反映了两个测验复本在内容上的等值性程度。信度反映了两个测验复本在内容上的等值性程度。l复本信度考虑的是复本信度考虑的是内容取样内容取样误差误差的影响问题,计的影响问题,计算复本信度的主要目的在于考察两个测验复本的算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。题目取样或内容取样是否等值。l优点:优点:能够避免重测信度的一些问题,如记忆效果、练习效应等;能
20、够避免重测信度的一些问题,如记忆效果、练习效应等;适用于进行长期追踪研究或调查某些干涉变量对测验成绩的适用于进行长期追踪研究或调查某些干涉变量对测验成绩的影响;影响;减少了辅导或作弊的可能性。减少了辅导或作弊的可能性。l缺点:缺点:如果测量的行为受练习的影响,复本信度只能减少而不能消如果测量的行为受练习的影响,复本信度只能减少而不能消除这种影响;除这种影响;有些测验的性质会由于重复测量而发生改变,例如某些问题有些测验的性质会由于重复测量而发生改变,例如某些问题解决型的测验,如果掌握了解题原则就有可能产生迁移,尤解决型的测验,如果掌握了解题原则就有可能产生迁移,尤其当复本只是在题目具体内容上有改
21、变时,这种正迁移的作其当复本只是在题目具体内容上有改变时,这种正迁移的作用会很强;用会很强;有些测验很难找到复本。有些测验很难找到复本。3、一致性信度、一致性信度Consistency Reliabilityl一致性信度又称为一致性信度又称为同质性信度,同质性信度,是指一个测评活分测评中是指一个测评活分测评中各个题目所测内容的一致性。各个题目所测内容的一致性。l同质性是保证测评只测量同一特质的必要条件。也就是说,同质性是保证测评只测量同一特质的必要条件。也就是说,评估一组测验题目内部一致性程度,对于确定测验题目是评估一组测验题目内部一致性程度,对于确定测验题目是否测量了同一事物很重要。如果同质
22、性差,则表示测评混否测量了同一事物很重要。如果同质性差,则表示测评混淆了不同的测评内容,其结果就无从判断究竟是否反映了淆了不同的测评内容,其结果就无从判断究竟是否反映了被测者的某一特质。被测者的某一特质。一致性信度的作用一致性信度的作用l重测信度和复本信度分别注重考虑测量跨时间的重测信度和复本信度分别注重考虑测量跨时间的一致性(稳定性)和跨形式的一致性(等值性),一致性(稳定性)和跨形式的一致性(等值性),而内部一致性信度用内部一致性系数表示,主要而内部一致性信度用内部一致性系数表示,主要反映的是测验内部题目之间的关系,考察测验的反映的是测验内部题目之间的关系,考察测验的各个题目是否测量了相同
23、的内容或特质,即测验各个题目是否测量了相同的内容或特质,即测验内部各部分之间具有同质性(测验同一特性的各内部各部分之间具有同质性(测验同一特性的各个项目的得分呈正相关)。个项目的得分呈正相关)。l同质性的测验,其结果的解释较为明确。例如:同质性的测验,其结果的解释较为明确。例如:在一个同质性的语言逻辑推理能力测验中,应试在一个同质性的语言逻辑推理能力测验中,应试者的得分可以反映其语言逻辑推理能力的高低;者的得分可以反映其语言逻辑推理能力的高低;而如果一个测验既包含有测查逻辑推理能力的试而如果一个测验既包含有测查逻辑推理能力的试题,又含有测查数量分析能力的试题,那么在应题,又含有测查数量分析能力
24、的试题,那么在应试者得分低的情况下,就无法说明被测者到底哪试者得分低的情况下,就无法说明被测者到底哪种能力不足。种能力不足。一致性信度应用实例一致性信度应用实例l例如:例如:在人格测评中,乐观情绪特质和外向特质是在人格测评中,乐观情绪特质和外向特质是两个容易混淆的内容,这就要求测评设计时能够找两个容易混淆的内容,这就要求测评设计时能够找到相应的题目把二者区分开来。到相应的题目把二者区分开来。l再例如:再例如:在考察管理技能时,预测和决策、监督和在考察管理技能时,预测和决策、监督和控制等都是不太容易区分的,对题目设计的要求就控制等都是不太容易区分的,对题目设计的要求就相当高,否则就会把不同技能混
25、淆,导致结论错误相当高,否则就会把不同技能混淆,导致结论错误和用人失误。和用人失误。l在设计测评题目时,所有测评题目都要保证只测量在设计测评题目时,所有测评题目都要保证只测量一种特质或内容,如果需要在一个测评中测量不同一种特质或内容,如果需要在一个测评中测量不同内容,就应该将测评设计为几个分测评进行分别测内容,就应该将测评设计为几个分测评进行分别测评。评。例如例如16PF16PF人格测评就包括人格测评就包括1616个分测评,每个分个分测评,每个分测评量表只对一种人格特质进行测评。测评量表只对一种人格特质进行测评。一致性信度的计算方法一致性信度的计算方法l分半信度分半信度项目折半分析,是通过将测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 素质 测评 质量 分析
限制150内