2022年细说试题的难度区分度信度和效度以及对高考复习的启示.docx
《2022年细说试题的难度区分度信度和效度以及对高考复习的启示.docx》由会员分享,可在线阅读,更多相关《2022年细说试题的难度区分度信度和效度以及对高考复习的启示.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 学习必备 欢迎下载细说试题的难度、 区分度、信度和效度以及对高考复习的启示一.试题的难度(一)什么是难度难度是指试题的难易程度,是评判考试的一个特别重要的一个指标;一个题目,假如大部分考生都能答对,那么这个题目的难度就小;假如大部分考生都不能答对,那么这个题目的难度就大;客观题 难度运算公式 :P(难度 指数)试题答对人数 /考生人数;主观题 难度运算公式 :P试题平均得分 /试题满分;试卷难度运算公式: P为平均分, K 为试卷满分值;易、中、难的标准为:易: P0.7,中: 0.4 P0.69,难:P0.39;P 值越大,难度越低, P 值
2、越小,难 度越高;一般来说,难度值平均在 0.5 正确,难度值过高或过低,都会降低测验的信度;当 然,在实际的评判过程中,测验的难度水平多高才合适,也仍要取决于测验的目的;假如教师要对同学的学问预备状况进行一次诊断性测验,为了真实、精确地明白同学的学问把握情 况,测验难度大一点也是正常的;(二)难度的运算(1)客观性试题难度 P(这时也称通过率)运算公式:P=k/N(k 为答对该题的人数, N 为参与测验的总人数)(2)主观性试题难度 P 运算公式:P=X/M (X 为试题平均得分; M 为试题满分)(3)适用于主、客观试题的运算公式:P=(PH+PL)/2(PH、 PL 分别为试题针对高分组
3、和低分组考生的难度值)在大群体标准化中,此法较为便利;详细步骤为 :将考生的总分由高至低排列;从最 高分开头向下取全部试卷的 27%作为高分组;从最低分开头向上取全部试卷的 27%作为低 分组;按上面的公式运算;例 1:一次生物测试中,在100 名同学中,高低分组各有27 人,其中高分组答对第一题有 20 人,低分组答对第一题的有5 分,这道题的难度为:PH=20/27=0.74 PL=5/27=0.19 P=0.74+0.19/2=0.47 整个试卷的难度等于全部试题难度之平均值(包括主、客观试题);(三)试题难度的一般要求就高考来说,难度以适中为宜,单个试题的难度以 间为正确;0.3-0.
4、7 之间为好,整卷以 0.5-0.6 之一般将难度值大于和等于0.7 的试题定为简洁题;大于0.4 和小于 0.7 的定为中档题;小于和等于 0.4 的试题定犯难题;命题时难度一般要按肯定比例安排,如3:6:1 或 3:5:2,一般说来,简洁题、难度系数为 0.95-0.75,中档题为 0.74-0.6,难题为 0.59-0.20;二.试题的区分度(一)什么是区分度 区分度是指考试题目对考生心理特点的区分才能;区分度高的试题能将不同水平的考生 区分开来,水平高的考生得高分,水平低的考生得低分;区分度高的考试,优秀、一般、差三个层次的同学都有肯定比例,假如某一分数区间同学相对集中,高分太多或不及
5、格太多的 考试,区分度就低;名师归纳总结 - - - - - - -第 1 页,共 7 页精选学习资料 - - - - - - - - - 学习必备 欢迎下载(二)区分度的运算1.单个挑选题目区分度的运算27%考生定为高分组,总分最低的27%考将全体考生总分从高到低排列,将总分最高的生定为低分组,分别运算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数);运算公式为: D=PH-PL. PH 和 PL 分别为高分组和低分组的通过率;2 整个试题的区分度运算(常用)运算公式为: D=2(X HX L)/W 其中 D 为试卷区分度, X H 为 27%高分组平均分, X
6、 L 为 27%低分组平均分, W 为试卷 总分;一般也将全体考生总分从高到低排列,将总分最高的 的 27%考生定为低分组,再分别运算各组的平均分;27%的考生定为高分组,总分最低如:一份满分 100 分的试卷,高分组平均得分90 分,低分组平均得分60 分,就区分度为 2(90-60)/100=0.6 一道题值 2 分的试题,高分组平均得分1.5 分,低分组平均得分0.5 分,就区分度为 2(1.5-0.5)/2=1 (三)试题区分度的一般要求 区分度( D)的取值范畴介于 -1.00 至+1.00 之间;通常 D 为正值,称为积极区分; D 为 负值称为消极区分; D 值为 0 称为无区分
7、作用;具有积极区分作用的试题,其 D 值越大,区 分的成效越好;试题的区分度在 0.4 以上说明此题的区分度很好, 0.30.39 说明此题的区分度较好, 0.20.29 说明此题的区分度不太好需要修改,0.19 以下说明此题的区分度不好应剔除;高考的区分度一般要求在 0.3 以上,表示高分组的同学比低分组的同学能多得 30%的分 数;一般认为,区分度的数值达到了 0.3,便可以接受;低于 0.3 的题目,区分才能就差了;三.试题的信度 信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分 数的一样性和稳固性程度;信度除了要说明成果的真实性之外,仍要说明题目涉及的内容与
8、 教学的相关程度;信度系数愈高即表示该测验的结果愈一样、稳固与牢靠;系统误差对信度没什么影响,由于系统误差总是以相同的方式影响测量值的,因此不会造成不一样性;反之,随机误差可能导致不致性,从而降低信度;信度可以定义为随机误差R 影响测量值的程度;假如R=0,就认为测量是完全可信的,信度最高;信度的定义 信度主要是指测量结果的牢靠性、一样性和稳固性,即测验结果是否反映了被测者 的稳固的、 一贯性的真实特点;和信度相关的一个概念是效度,信度是效度的前提条件;信度只受随机误差的影响,随机误差越大,信度越低;因此,信度可以视为测试结 果受随机误差影响的程度;系统误差产生恒定效应,不影响信度;测试信度
9、test reliability 也叫测试的牢靠性,指的是测试结果是否稳固牢靠;也就是说,测试的成果是不是反映了受试者的实际语言水平;例如,假如同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,就说明该测试 缺乏信度;测试的信度与测试的效度有着亲密的关系;一般说来,只有信度较高的测试才能 有较高的效度,但效度较高不能保证信度也肯定较高;测试的信度主要涉及到试题本身的可 靠性和评分的牢靠性这两个方面;试题本身是否牢靠主要取决于试题的范畴、数量、试题的 区分度等因素;评分是否牢靠就要看评分标准是否客观和精确;名师归纳总结 测试的信度通常用一种相关系数(即
10、两个数之间的比例关系)来表示,相关系数越大,第 2 页,共 7 页信度就越高;当系数为1.00 时,说明测试的牢靠性达到最高程度;而系数是0.00 时,就测试- - - - - - -精选学习资料 - - - - - - - - - 学习必备 欢迎下载的牢靠性降到最低程度;在一般情形下,系数不会高到1.00,也不会降到 0.00,而是在两者之间;对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求 在 0.90 以上,例如“托福”的信度大致为 0.95,而课堂测试的信度系数就以 0.70-0.80之间为可 接受性系数;测试信度的运算方法有很多种,以下仅介绍三种易于操作的方
11、法:1)重测法( the retesting method);用同一套试卷在两个不同时间内来测试同一批受试 者,这样便获得两组分数,然后运算出两组分数的相关系数;当然,在两次测试中,同学第 二次的测试成果理应比第一次的要高,由于在其次次测试时同学已经有了进步而且临场体会也更丰富了;但是如该试题是比较牢靠的,每个同学在两次测试中的排名次序应当是基本不 变的;2)交替形式法( the alternative method);对同一批受试者使用试题类型完全相同,难易 程度相当,但详细题目不同的两套对等试卷先后进行两次测试,然后运算出两次得分的相关 系数;3)对半法( the splithalf me
12、thod );测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用SpearmanBrown 的公式计算整份试卷的信度系数;详细运算步骤是:将两组分数的相关系数乘以 2,再除以 1 加两组 分数的相关系数;每一个测试的实得分数(X )总是由真实分数 T 和误差 E两部分构成的,用公式 表示如下:X=T+E 假如我们争论一组测验分数的特性时,可用方差代表详细分数,得到公式:S2(x)=S2t+S2e S2t 是真分数的方差,S2e 是误差的方公式中, S2( x)是实得分数的方差,差 在测量理论中,信度被定义为:一组测量分数的真分数方差与中方差(实得方
13、差)的比率;即:rxx=S2t/S2 (x)由于真实分数的方差是无法统计的,因此转化为:rxx=S2x-S2e/S2x =1-S2e/S2x 因此,信度也可以看做是总方差中非测量误差的方差所占的比例 信度的指标 一、信度系数与信度指数 大部分情形下,信度是以信度系数为指标,它是一种相关系数;经常是同一被试样 本所得到的两组资料的相关,理论上说就是真分数方差与实得分数方差的比值,公式为:rxx=r2xt=S2t/S2(x)公式中 r2xt 是真分数标准差与实得分数标准差的比值,称作信度系数,公式为:rxt=St/Sx 可见信度指数的平方就是信度系数;二、测量标准误 信度系数仅表示一组测量的实得分
14、数与真分数的符合程度,但并没有直接指出个人 测验分数的变异量;我们可以用一组被试两次测量结果来代替对同一个人的反复施测,于是有了信度的另一个指标,公式为:SE=Sx1-rxxrxx 为测验的信度系数,信度越高, 标准误越公式中 SE 为测量的标准误,Sx 是所得分数的标准差,从公式我们可以看出测量的标准误与信度之间有互为消长的关系:小,信度越低,标准误越大;名师归纳总结 - - - - - - -第 3 页,共 7 页精选学习资料 - - - - - - - - - 学习必备 欢迎下载影响信度的因素 一、样本特点 1、样本团体异质性的影响 2、样本团体的平均才能水平的影响 二、测量长度 一般来
15、说,在一个测试中增加同质的题目,可以使信度提高;需留意的是,增加测验长度的成效应当遵循酬劳递减原就;通过斯皮尔曼-布朗公 式的导出公式可以运算出最少应增加的题目:K=rkk*1-rxx/rxx*rkk-1rxx 为原测试的信度,rkk 为测验长度是原先的K 为转变后的长度与原长度之比,K 倍时的信度估量;三、测验难度理论上说,只有测验难度为50%时,才能使测验分数分布范畴最大,求得的信度也最高;事实上,难度为 0.50 只适合于简答型题目,对于挑选题目由于推测因素,难度值应当提高,洛德提出在学习成果中,为了保证其牢靠性,各类挑选题的抱负平均难度为:五择一测,0.70;四择一测,0.74;三择一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 细说 试题 难度 区分 信度 以及 高考 复习 启示
限制150内