教育统计与测量第6章-信度优秀PPT.ppt
《教育统计与测量第6章-信度优秀PPT.ppt》由会员分享,可在线阅读,更多相关《教育统计与测量第6章-信度优秀PPT.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、测验结果的牢靠性称为测验的信度一般接受相关分析的方法,计算出两种变量的相关系数,用相关系数的大小来表示一样性程度的凹凸。相关系数大,则测验信度高;相关系数小,则测验信度低。信度(信度(reliabilityreliability):指的是测量结果的稳定性和):指的是测量结果的稳定性和牢靠的程度,亦即测量的结果是否真实、客观地反映牢靠的程度,亦即测量的结果是否真实、客观地反映了考生的实际水平,可记为了考生的实际水平,可记为rxxrxx。具体而言,可以从以下三方面来理解测量的信度:具体而言,可以从以下三方面来理解测量的信度:x xT TE Ex x表示实测值,表示实测值,T T表示真值表示真值(是
2、未知的,可以把多次测量是未知的,可以把多次测量的实测值的平均值作为真值的近似值的实测值的平均值作为真值的近似值),E E表示误差。表示误差。E Ex-T x-T 1 1、试比较以下两次测量结果(只进行一次)的信、试比较以下两次测量结果(只进行一次)的信度:度:用尺子量用尺子量100cm100cm高的一个儿童,得到高的一个儿童,得到1cm1cm的确定误差;的确定误差;量量185cm185cm高的一位运动员,也得得到高的一位运动员,也得得到1cm1cm的确定误差。的确定误差。要比较两种测量结果的信度,确定要看误差分数要比较两种测量结果的信度,确定要看误差分数(E E)对于真分数()对于真分数(T
3、T)所占的百分数是多少。这个)所占的百分数是多少。这个百分数表示该实得分数(百分数表示该实得分数(x x)的相对误差。其计算式)的相对误差。其计算式如下:如下:相对误差相对误差E/T100%E/T100%把上述两次测量(设为甲和乙)和确定误差分数和把上述两次测量(设为甲和乙)和确定误差分数和真分数代入上式,得:真分数代入上式,得:相对误差(甲)相对误差(甲)1/100100%1/100100%1%1%相对误差(乙)相对误差(乙)1/185100%1/185100%0.54%0.54%据此,度量乙的信度要比度量甲的信度高。据此,度量乙的信度要比度量甲的信度高。最大确定误差最大确定误差E/x 10
4、0%E/x 100%判别两组数据谁好谁差判别两组数据谁好谁差,不能只靠对平均数的统计不能只靠对平均数的统计和比较,关键是确定这两组数据偏离各自的平均和比较,关键是确定这两组数据偏离各自的平均数的大小。为了消退数据容量的影响,我们借鉴数的大小。为了消退数据容量的影响,我们借鉴探讨加权平均数的方法,选用各个偏差的平方的探讨加权平均数的方法,选用各个偏差的平方的平均数,来描述一组数据偏离其平均数的大小,平均数,来描述一组数据偏离其平均数的大小,这就是方差。这就是方差。依据假设,实得分数的方差应等于真分数的方差依据假设,实得分数的方差应等于真分数的方差加上测量误差的方差。即:加上测量误差的方差。即:于
5、是,信度(于是,信度(r rxxxx)可定义为真分数的方差与实得分数方差的比率。)可定义为真分数的方差与实得分数方差的比率。即:即:)可见,可见,越小,测量的信度就越高。信度的取值范围越小,测量的信度就越高。信度的取值范围为为0 0,1 1。表表1-11-1测量测量5 5个学生的某种分数个学生的某种分数 学生真分数误差分数实得分数学生真分数误差分数实得分数A A18182 21616B B9 9 1 11010C C15152 21717D D21211 12222E E12122 21010平均数平均数 15150 0 1515 方差方差18182.82.820.820.8v统计量是指样本上
6、的各种数字特征。(如样本平均数、统计量是指样本上的各种数字特征。(如样本平均数、标准差等);参数是总体上的各种数字特征(如总体平标准差等);参数是总体上的各种数字特征(如总体平均数、标准差等)。均数、标准差等)。v在统计学中,统计量越接近参数,这个统计量的牢靠在统计学中,统计量越接近参数,这个统计量的牢靠性越高。而要知道统计量与参数的接近程度,可以对参性越高。而要知道统计量与参数的接近程度,可以对参数进行区间估计。数进行区间估计。v我们不妨将测量的平均值看做平均数抽样分布中的一个平均数,真值视为平均我们不妨将测量的平均值看做平均数抽样分布中的一个平均数,真值视为平均数抽样分布的总平均数(数抽样
7、分布的总平均数(),这样一来,只要能估计出实得分数分布的),这样一来,只要能估计出实得分数分布的标准差标准差测量的标准误测量的标准误,就可以利用,就可以利用区间估计的公式区间估计的公式,算出实测值与真值的接近程度,算出实测值与真值的接近程度,从而计算出测量结果的信度。从而计算出测量结果的信度。例:依据对一组人(设例:依据对一组人(设n30)进行某种智力因素测验的结果,)进行某种智力因素测验的结果,计算出有关统计量如下,求真分数的置信区间(或真值在什么计算出有关统计量如下,求真分数的置信区间(或真值在什么数值的范围内)。数值的范围内)。统计学中估计事物或现象间数量变动的一样性,统计学中估计事物或
8、现象间数量变动的一样性,主要接受相关分析的方法,即计算出两种变量的主要接受相关分析的方法,即计算出两种变量的相关系数(相关系数(rxyrxy)。)。在运用相关系数表示信度的凹凸时,相关系数可在运用相关系数表示信度的凹凸时,相关系数可称为信度系数称为信度系数(coefficient of reliability)(coefficient of reliability)。它是对相同应试者的同一特性的两次测量分数的它是对相同应试者的同一特性的两次测量分数的相关系数,是测量结果的一样性的指标。相关系数,是测量结果的一样性的指标。(一)再测信度(稳定性系数)(一)再测信度(稳定性系数)(二)复本信度(等
9、值性系数)(二)复本信度(等值性系数)(三)内部一样性系数(三)内部一样性系数(四)评分者信度(四)评分者信度(五)目标参照测验信度(五)目标参照测验信度(六)速度测验的信度(六)速度测验的信度又称重测信度,表示测验稳定性的方法,是指用又称重测信度,表示测验稳定性的方法,是指用同一量表对相同被试者(一组人)在不同时间测同一量表对相同被试者(一组人)在不同时间测验两次的实得分数的相关系数。验两次的实得分数的相关系数。估计稳定性系数的基本程序:估计稳定性系数的基本程序:测测验验A A1 1 适当时距适当时距 测验测验A A2 2相关系数可以用不同方法计算,这取决于数据相关系数可以用不同方法计算,这
10、取决于数据的性质。最为普遍的是皮尔逊积差相关系数:的性质。最为普遍的是皮尔逊积差相关系数:X为第一次测验的实得分数;Y为第一次测验的实得分数;N为应试者数.用一个算术四则的速度测验用一个算术四则的速度测验1212个小学生,得分个小学生,得分记为记为X X,为了考察测量结果的牢靠性,于,为了考察测量结果的牢靠性,于3 3个月个月后再测一次,得分记为后再测一次,得分记为Y Y,问测验结果是否牢靠,问测验结果是否牢靠?序号序号 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12X 20 20 21 22 23 23 23 24 25 26 26
11、 27X 20 20 21 22 23 23 23 24 25 26 26 27Y 20 21 21 20 23 23 25 25 26 26 27 29Y 20 21 21 20 23 23 25 25 26 26 27 29解解:(1)把资料列表于后把资料列表于后,计算出公式计算出公式(1-10)所需的各种统计量所需的各种统计量:X280 Y286 X26594Y26912 XY6420(2)把所计算的统计量代入公式把所计算的统计量代入公式:1 1、两次测验之间的时间间隔要适宜。、两次测验之间的时间间隔要适宜。2 2、两次测验试卷要等值,即在内容范围、题型、两次测验试卷要等值,即在内容范围
12、、题型、题数、难度、区分度等方面要基本相同。题数、难度、区分度等方面要基本相同。3 3、确定两测验是否等值,还要考察两次测验结、确定两测验是否等值,还要考察两次测验结果的平均数与标准差。果的平均数与标准差。4 4、重测法适用于速度测验而不适用于难度测验。、重测法适用于速度测验而不适用于难度测验。5 5、测试应留意提高被试者的主动性。、测试应留意提高被试者的主动性。6 6、测试间隔期内,被试不能获得学习和训练、测试间隔期内,被试不能获得学习和训练复本信度是一种表示测验等值性的方法,是以复本信度是一种表示测验等值性的方法,是以两个等值(题型题数、难度、区分度相等)但两个等值(题型题数、难度、区分度
13、相等)但具体内容不同的量表,在最短时距内,对相同具体内容不同的量表,在最短时距内,对相同应试者先后施测两次所获得的两组对应分数的应试者先后施测两次所获得的两组对应分数的相关系数。相关系数。其模式是:其模式是:以以A A、B B两型英语复本测验对初中三年级两型英语复本测验对初中三年级1010个学生个学生施测,为避开由测验施测依次所造成的误差,其施测,为避开由测验施测依次所造成的误差,其中中5 5个学生先做个学生先做A A型测验,休息型测验,休息1515分钟后,再做分钟后,再做B B型型测验;而另测验;而另5 5个学生先做个学生先做B B型测验,休息型测验,休息1515分钟后,分钟后,再做再做A
14、A型测验。型测验。1010个学生个学生A A型测验结果记为型测验结果记为X X,B B型型测验结果记为测验结果记为Y Y,其测验的复本信度如何?,其测验的复本信度如何?学生序号学生序号 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1010X 19 19 18 17 16 15 15 14 13 X 19 19 18 17 16 15 15 14 13 1212Y 20 17 18 18 17 15 13 15 12 Y 20 17 18 18 17 15 13 15 12 1212优点:优点:1 1、测验的两个复本,假如在不同的时间运用,、测验的两个复本,假如在不同
15、的时间运用,其信度既可以反映在不同时间的稳定性,又可以其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一样性;反映对于不同测题的一样性;2 2、两个复本在同时运用时,可以避开再测信息、两个复本在同时运用时,可以避开再测信息的一些缺点,如首测时再测在记忆、练习、效果的一些缺点,如首测时再测在记忆、练习、效果的影响,间隔期间获得新学问的影响,两次施测的影响,间隔期间获得新学问的影响,两次施测的环境不同和被试主观状态不同的影响,以及为的环境不同和被试主观状态不同的影响,以及为了应付测验所作训练的影响等。了应付测验所作训练的影响等。缺点:缺点:1 1、编制两个完全相等的测验是很困难的,假如
16、两个、编制两个完全相等的测验是很困难的,假如两个复本过分相像,则变成再测形式,而过分不相像,复本过分相像,则变成再测形式,而过分不相像,又使等值的条件不存在;又使等值的条件不存在;2 2、两个复本测验有可能在某种程度上测量了不同的、两个复本测验有可能在某种程度上测量了不同的性质,这就会低估测验的信度;性质,这就会低估测验的信度;3 3、被试同时接受性质相像的两个测验,可能削减完、被试同时接受性质相像的两个测验,可能削减完成测验的主动性;成测验的主动性;4 4、虽然两个复本测验的题目材料不同,但被试一旦、虽然两个复本测验的题目材料不同,但被试一旦驾驭了解题的某一模式,就能触类旁通,有可能失驾驭了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计 测量 信度 优秀 PPT
限制150内