第三章__测量的误差及其检验.ppt
《第三章__测量的误差及其检验.ppt》由会员分享,可在线阅读,更多相关《第三章__测量的误差及其检验.ppt(172页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 测量的误差及其检验测量的误差及其检验第一节第一节 测量的误差测量的误差 第二节第二节 测量的信度测量的信度 第三节第三节 测量的效度测量的效度 教学目的与要求教学目的与要求(1)了解测量误差的种类与来源(2)掌握信度的定义、意义及其估计方法(3)掌握效度的定义、意义及其估计方法第一节第一节 测量的误差测量的误差一、误差的定义和种类一、误差的定义和种类二、误差的来源二、误差的来源三、真分数三、真分数一、误差的定义和种类一、误差的定义和种类(一)误差的定义(一)误差的定义 误差是在测量中与目的无关的因素所产生的不不准确准确的或不一致不一致的结果。有二层含义:、误差是由与测量目的无关的
2、因素引起的;、误差是不准确或不一致的测量结果。(二)误差的种类(二)误差的种类1、随机误差:与测量目的无关的偶然因素引起的变化无规律的误差,这种误差的大小和方向是随机的。既影响测量的准确性又影响一致性。2、系统误差:与测量目的无关的因素引起的恒定的有规律的误差,它稳定地存在于每一次测量中。只影响测量的准确性。二、误差的来源二、误差的来源在心理测量中,常见的误差来源于三个方面:在心理测量中,常见的误差来源于三个方面:测验自身;测验自身;施测过程;施测过程;受测者本身。受测者本身。(一)测验自身引起的误差 主要来源于测验的编制过程,其中项目取样影响最大。测验题目少或样本缺乏代表性测验题目少或样本缺
3、乏代表性 测验复本不等值测验复本不等值 题目用词模棱两可题目用词模棱两可 反应步骤说明不清反应步骤说明不清 题目过难引起猜测题目过难引起猜测 时间短促仓促作答等时间短促仓促作答等(二)施测过程引起的误差1、测试环境2、测试时间3、主试因素4、意外干扰5、评分记分(评的客观,记得准确)小资料:小资料:对于论文题、问答题要多少人评分,平均分数才能相对于论文题、问答题要多少人评分,平均分数才能相对稳定和客观呢?国外有人做过专门研究,结果如下:对稳定和客观呢?国外有人做过专门研究,结果如下:哲学论文人,作文人,物理人,数学哲学论文人,作文人,物理人,数学人。人。(三)被试引起的误差 既使一个测验经过精
4、心编制,题目取样具有代表性,又有标准化的施测和记分程序,由于受测者本身的变化,仍然会给测验分数带来误差,这种误差是最难控制的。1、应试动机被试对测验的动机不同,会影响其作答态度,注意力、持久性、反应速度等,从而影响测验成绩。2、测验焦虑测验焦虑是指受测者在应试前和测试中出现的一种紧张的、不愉快的情绪体验。中等程度的焦虑最有利于被试的发挥 测验焦虑影响因素测验焦虑影响因素 1能力能力高的人,测验焦虑一般较低,而对自己能高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高力没有把握的人,测验焦虑较高 2抱负水平抱负水平过高,求胜心切的人,测验焦虑较高;过高,求胜心切的人,测验焦虑较高;
5、3,具有某种,具有某种人格特点人格特点,如缺乏自信、患得患失、,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑;情绪不稳定的人易产生测验焦虑;4测验成绩与被试的测验成绩与被试的关系关系重大,或被试受到的压重大,或被试受到的压力过大,容易使其产生测验焦虑;力过大,容易使其产生测验焦虑;5经常接受测验的人焦虑较低,而对测验程序不经常接受测验的人焦虑较低,而对测验程序不熟悉熟悉,尤其是测验中采取了新的,尤其是测验中采取了新的 题目题目形式或实施程序形式或实施程序会增加测验焦虑会增加测验焦虑。6,被试不了解测验目的,指导语不清会增加被试的,被试不了解测验目的,指导语不清会增加被试的焦虑。焦虑。3、
6、测验经验任何一种新的项目形式,由于被试比较陌生,就可能使测验成绩受到影响。如果提供足够的演示和练习,测验成绩就会提高。相反,有些被试测验经验较多,掌握了答题技巧,成为了“测验油子”。4、练习效应任何一个测验在重复使用时,都会有练习效应而使成绩提高。练习效应练习效应教育背景较差、经验较少或智力较高者,其教育背景较差、经验较少或智力较高者,其受练习效应的影响较大受练习效应的影响较大着重速度的测验练习效应较为明显着重速度的测验练习效应较为明显重复实施相同的测验,受练习效应影响的程重复实施相同的测验,受练习效应影响的程度要大于复本的测验度要大于复本的测验两次测验时距越大,练习效应越小,三个月两次测验时
7、距越大,练习效应越小,三个月以上可以忽略以上可以忽略一般的练习效应,约在一般的练习效应,约在1/5标准差以下标准差以下5、反应倾向(反应定势)反应定势是指独立于测验内容的反应倾向。即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。6、生理变因指生病、疲劳、失眠等生理因素以及在智力、情绪、体力等方面的生物节律也会影响测验成绩而带来误差。常见的反应定势常见的反应定势求求“快快”与求与求“精确精确”的反应定势的反应定势喜好正面叙述的反应定势喜好正面叙述的反应定势喜好特殊位置的反应定势喜好特殊位置的反应定势喜好较长选项的反应定势喜好较长选项的反应定势猜测的反应定势猜测的反应定势三、
8、真分数(一)含义(一)含义理论定义:是指测量没有误差时所得到的真值。真分数是一个在理论上构想出来的抽象概念。操作定义:是无数次测量结果的平均值。(二)数学模型及其假设(二)数学模型及其假设、经典测量理论的基本思想、经典测量理论的基本思想把任何一个人在一个测验上的成绩都看作是真分数把任何一个人在一个测验上的成绩都看作是真分数和测量误差的和,这是经典测量理论的基本思想。即:和测量误差的和,这是经典测量理论的基本思想。即:X=T+E X=T+E X X:实得分数或观测分数:实得分数或观测分数T T:假设的真分数:假设的真分数E E:测量误差:测量误差注意:注意:测量误差E指的是引起测量不一致的变因所
9、产生的效不一致的变因所产生的效应,应,即指随机误差随机误差,不包括系统误差。系统误差不引起分数的改变,因此包含在真值中。关于测量误差关于测量误差E E有以下假设:有以下假设:()如果对一个人测量无数次或同一测验施测于无限大的()如果对一个人测量无数次或同一测验施测于无限大的人群,其平均误差为,即人群,其平均误差为,即 ;()真分数和测量误差是相互独立的即()真分数和测量误差是相互独立的即 ;()误差分数和实得分数的相关为,即()误差分数和实得分数的相关为,即 。2 2、引申:、引申:(1)对于一个团体来说,实得分数的变异数等于其真分数的变异数与误差变异数之和。S SX X2 2=S=ST T2
10、 2+S+SE E2 2(2)真分数的变异数可以分成两部分:与测量目的有关的变异SV2(有效变异)和与测量目的无关的但却稳定的变异SI2,即:S ST T2 2=S=SV V2 2+S+SI I2 2(3)一次测验中,一个团体的实得分数的变异性是由与测量目的有关的变异数SV2、稳定的但出自无关来源的变异数SI2和随机误差的变异数SE2所决定的。即:S SX X2 2=S=SV V2 2+S+SI I2 2+S+SE E2 2SV2SI2SE2SX2ST2 第二节第二节 信度信度一、什么是信度一、什么是信度二、信度的类型及估计方法二、信度的类型及估计方法三、信度的应用三、信度的应用四、影响信度的
11、因素四、影响信度的因素一、什么是信度一、什么是信度定义:指的是测量结果的稳定性程度(或叫可靠性、一致性)。思考:信度受随机误差的影响还是受系统误差的影响思考:信度受随机误差的影响还是受系统误差的影响?在测量学中,信度被定义为:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的百分比。计算公式:计算公式:r rxxxx=S=ST T2 2/S/SX X2 2 r rxxxx也被称为信度系数。也被称为信度系数。该定义有两点要注意:该定义有两点要注意:、信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性。、信度是一个理论上构想的概念,
12、只能根据一组实得分数作出估计。信度系数r rxxxx实际是真正分数与实得分数之间的决定系数。可以解释为在实得分数的变异数中有多少比例是由真分数的变异决定的。例如:当r rxxxx 0.9时,怎么解释?r rxxxx?r rxx xx 0?对信度系数也要注意三点:对信度系数也要注意三点:1)在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。2)信度系数只是对测量分数不一致性程度的估计,并没有指出不一致的原因。3)获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的第一步,是使测验有效的一个必要条件。二、信度的类型及估计方法二、信度的类型及估
13、计方法信度是个理论上构想的概念,在实际应用时,通常信度是个理论上构想的概念,在实际应用时,通常以同一样本所得的两组资料的相关,作为测量一致以同一样本所得的两组资料的相关,作为测量一致性的指标。由于测验分数的误差来源不同,估计信性的指标。由于测验分数的误差来源不同,估计信度的方法也不同,故每一种信度系数只能说明信度度的方法也不同,故每一种信度系数只能说明信度的不同方面,因而具有不同的意义。的不同方面,因而具有不同的意义。(一)重测信度(再测信度)(一)重测信度(再测信度)(二)复本信度(二)复本信度(三)分半信度(三)分半信度 (四)同质性信度(四)同质性信度 (五)评分者信度(五)评分者信度(
14、一)重测信度(再测信度)1、含义与计算用同一个测验,在同样条件下同样条件下对同一组被试前后两次施测,求两次得分间的相关系数。它反映的是两次测验的结果有无变化,也就是测验分数的稳定程度,所以又称稳定性系数稳定性系数。计算公式为:例题:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。(为了便于理解和计算,本(为了便于理解和计算,本章估计信度的例子都是小样组,实际应用时应采用章估计信度的例子都是小样组,实际应用时应采用大样组。)大样组。)表1 某幸福感调查表的两次测试结果 被 试测验 1 2 3 4 5 6 7 8 9 10X1 16 15 1
15、3 13 11 10 10 9 8 7X2 16 16 14 12 11 9 11 8 6 7解:用计算器算出:S1=2.82 S23.38 把以上数据代入公式2 2、使用的前提条件、使用的前提条件(1)所测量的心理特性必须是稳定的。(2)遗忘和练习的效果基本上相互抵消。(3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。3 3、使用时的注意要点、使用时的注意要点(1)两次测验的时间间隔要适当。(2)再测法适用于速度测验和人格测验。(3)应注意提高被试的积极性。提问:重测法的误差主要是来源于什么?提问:重测法的误差主要是来源于什么?4 4、优缺点、优缺点缺点:
16、(1)易受练习和记忆的影响。(2)如果两次施测时间间隔较长,由于在此期间受到被试学习、成熟的影响,都会使两次测验结果不相同。(3)同一被试对一个测验先后两次作答,对测验的兴趣不同、身心状况的变化,影响测验结果。(4)两次施测的条件不同,也是产生测量误差的因素。优点:(1)能提供有关测验结果是否随着时间而变异的资料,可作为预测受测者将来行为表现的依据;(2)首测和再测只需要一套测验题目,省时、省力;(3)同一套题目无论施测几次,所测的属性是完全相同的。(二)复本信度(二)复本信度 1 1、含义与计算、含义与计算含义:根据一组被试在两个平行(等值)测验上的得分计算的相关系数即为复本信度。其计算方法
17、与再测法相同。例题:假设用A、B两型创造力复本测验对初中一年级10个学生施测,计算该测验的复本信度。结果见表2。被 试测验 1 2 3 4 5 6 7 8 9 10X1 20 19 19 18 17 16 14 13 12 10X2 20 20 18 16 15 17 12 11 13 9表2 某创造力复本测验测试结果解:先用计算器计算得出以下值:把以上数据代入公式 2 2、使用的前提条件:、使用的前提条件:(1)要两份或两份以上真正真正等值的测验,必须是真正的复本,否则所得的信度就成了歪曲的估计。(2)被试要有条件接受两个测验。主要取决于时间、经费等几方面。3 3、连续施测和间隔施测、连续施
18、测和间隔施测(1 1)连续施测)连续施测同时施测的复本信度叫同时施测的复本信度叫等值性系数等值性系数。提问:同时施测的复本信度的误差主要来源于什么?提问:同时施测的复本信度的误差主要来源于什么?(2)间隔施测相距一段时间分两次施测得到的信度叫做稳定性与等稳定性与等值性系数值性系数。提问:间隔施测的复本信度的误差主要来源于什么?提问:间隔施测的复本信度的误差主要来源于什么?4 4、复本信度局限性、复本信度局限性如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。对于许多测验来说,建立复本是十分困
19、难的。(三)分半信度 1、含义含义:按正常的程序实施测验,然后将全部项目分成相等的两半,根据各人在这两半测验的分数计算其相关系数。由于只需对一个测验进行一次施测,考察的是两半题目之间的一致性,所以这种信度系数有时也被称为内部一致性系数内部一致性系数。2 2、计算、计算提问:怎样对测验进行分半?提问:怎样对测验进行分半?进行奇偶分半时,要注意的问题是:怎样安排互相有牵连的题目。在这种情况下整个一组的题目应放到同一半。(1 1)两半测验分数的变异数相等(方差齐性)两半测验分数的变异数相等(方差齐性)先计算两半测验的积差相关系数,再进行斯皮尔曼先计算两半测验的积差相关系数,再进行斯皮尔曼布朗公式校正
20、:布朗公式校正:r rhhhh为两半分数的相关系数;为两半分数的相关系数;r rxxxx为测验在原长度时的信度估计为测验在原长度时的信度估计提问:为什么求得的分半信度要用斯皮尔曼布朗公提问:为什么求得的分半信度要用斯皮尔曼布朗公式校正?式校正?(2 2)两半测验分数的变异数不等(方差不齐)两半测验分数的变异数不等(方差不齐)当两半测验不等值时,可采用下列公式的两种之一,直接求得测验的信度系数:弗朗那根公式:Sa2 和Sb2表示两半测验分数的变异数SX2表示测验总分的变异数卢伦公式:Sd2为两半测验分数之差的变异数;Sx2为测验总分的变异数;r为信度值。提问:怎样理解卢伦公式?提问:怎样理解卢伦
21、公式?例:有一个由例:有一个由100100题构成的量表施测于题构成的量表施测于1010个高三学生。测个高三学生。测验一次后,应试者即毕业离校。现在怎样评价测验结果验一次后,应试者即毕业离校。现在怎样评价测验结果的信度?的信度?被 试测验 1 2 3 4 5 6 7 8 9 10X1 38 37 38 41 40 36 38 39 40 35X2 37 37 36 39 39 34 38 39 39 36解:因不能再次测验,只能求分半信度。步骤:(1)计算出每个应试者的奇数题总分(X1)和偶数题总分(X2),见表:解:用计算器求得(也可以用计算机做):(1)斯皮尔曼布朗公式(平均数和标准差差异显
22、著性检验略)(2)弗朗那根公式:(3)卢伦公式:3 3、使用的前提条件及范围、使用的前提条件及范围(1)分半信度通常是只能施测一次或没有复本的情况下使用。(2)由于将一个测验分成两半的方法很多,所以,同一测验通常会有多个分半信度值。(3)当试卷中有任选题时不宜用分半法,速度测验也不宜用分半法。(四)同质性信度(四)同质性信度 1 1、含义、含义同质性也指内部一致性,指测验内部所有题目间所有题目间的一致性。题目的一致性有两层含义:其一是指所有题目都测的是同一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特质的相同质性信度就是一个测验所测内容或特质的相同
23、程度。同程度。2 2、测量同质性的基本公式:、测量同质性的基本公式:K:K:构成测验的题目数 :项目间相关系数的平均数 :同质性性度值提问:这个公式说明什么?提问:这个公式说明什么?3 3、库德、库德-理查逊公式:适用于客观性试题(理查逊公式:适用于客观性试题(0 0、1 1记分)记分)K-RK-R2020公式:公式:K K:构成测验的题目数:构成测验的题目数P Pi i:通过第:通过第i i题的人数比例题的人数比例q qi i:未通过第:未通过第i i题的人数比例题的人数比例S Sx x2 2:测验总分的变异数:测验总分的变异数K-RK-R2121公式:适用于各项目难度相近的情况公式:适用于
24、各项目难度相近的情况 K:K:构成测验的题目数构成测验的题目数 :测验总分的平均数测验总分的平均数S Sx x2 2:测验总分的变异数测验总分的变异数4 4、克伦巴赫系数:适用于多重记分测验、克伦巴赫系数:适用于多重记分测验K K:构成测验的题目数:构成测验的题目数S Si i2 2:某一题目分数的变异数:某一题目分数的变异数S Sx x2 2:测验总分的变异数:测验总分的变异数题号被 试Si2 ABCDE1711811113.042697891.3636106892.5648116836.965711811113.046711811113.044062415452例:有一种包含6个论文式题目
25、的测验,对5个应试者施行,得分见下表,试求该测验的信度。解:(1)求每题各被试得分的方差S Si i2 2、方差和(2)求测验总分的变异数即各被试得分的方差(即求40、62、41、54、52的方差),Sx 2 68.96(3)代入公式求信度系数 4 4、注意:、注意:用库德-理查逊公式和克伦巴赫系数所求得的信度通常比分半信度低。上面这些公式不适用于速度性测验。提问:同质性信度的误差主要来源于什么?提问:同质性信度的误差主要来源于什么?(五)评分者信度(五)评分者信度1 1、含义、含义指的是多个评分者给同一批人的答卷进行评分的一致性程度。是用于测量不同评分者之间所产生的误差。2 2、方法与计算、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 _ 测量 误差 及其 检验
限制150内