心理和教育测量第六章.ppt
《心理和教育测量第六章.ppt》由会员分享,可在线阅读,更多相关《心理和教育测量第六章.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于心理与教育测关于心理与教育测量第六章量第六章第一张,PPT共六十一页,创作于2022年6月第六章第六章 测验的项目分析测验的项目分析测验项目的难度测验项目的难度测验项目的区分度分析测验项目的区分度分析猜测问题与猜测率猜测问题与猜测率多重选择题的项目分析多重选择题的项目分析第二张,PPT共六十一页,创作于2022年6月第一节第一节 测验项目的难度测验项目的难度难度的意义难度的意义项目难度的计算项目难度的计算测验难度水平的确定测验难度水平的确定难度的等距变换难度的等距变换难度对测验的影响难度对测验的影响第三张,PPT共六十一页,创作于2022年6月一、难度的意义一、难度的意义难度分类难度分类项
2、目难度和测验难度。本章主要讲项目难度。项目难度和测验难度。本章主要讲项目难度。难度定义难度定义难度是测验项目的难易程度。通常用难度是测验项目的难易程度。通常用“P”来表示。来表示。一个测验项目,如果大部分被试都能答对,则该项目的难度就小;一个测验项目,如果大部分被试都能答对,则该项目的难度就小;反之亦然。反之亦然。CTT下的难度特征下的难度特征难度是测验项目性质与被试水平共同作用的结果。如果测验难度是测验项目性质与被试水平共同作用的结果。如果测验项目需要较复杂的心理操作,那么被试水平高时,得到的难项目需要较复杂的心理操作,那么被试水平高时,得到的难度值就小;反之得到的难度值就大。度值就小;反之
3、得到的难度值就大。第四张,PPT共六十一页,创作于2022年6月二、项目难度的计算二、项目难度的计算得分率法得分率法通式(所有项目都适用):通式(所有项目都适用):为全体被试在项目上的平均得分,为全体被试在项目上的平均得分,F为项目满分为项目满分值。值。特式(针对二分法记分项目):特式(针对二分法记分项目):其中其中P代表项目难度;代表项目难度;N为全体被试数;为全体被试数;R为答对通为答对通过该项目的人数。过该项目的人数。第五张,PPT共六十一页,创作于2022年6月高低分组法高低分组法通式:通式:其中其中 、分别为总分排名在前分别为总分排名在前27%的高分组和的高分组和后后27%低分组被试
4、在要计算难度的项目上的平均分。低分组被试在要计算难度的项目上的平均分。F为满分值。为满分值。特式:特式:=(RH/NH+RL/NL)/2其中其中 和和 分别代表高分组与低分组的通过率。分别代表高分组与低分组的通过率。RH和和RL分别代表高低分组答对人数,分别代表高低分组答对人数,NH和和NL分别代分别代表高低分组总人数。表高低分组总人数。第六张,PPT共六十一页,创作于2022年6月举例:请分别用通过率法和高低分组举例:请分别用通过率法和高低分组法计算下列两题难度法计算下列两题难度第七张,PPT共六十一页,创作于2022年6月二、测验难度水平确定二、测验难度水平确定取决于测验的目的取决于测验的
5、目的目标参照性测验可以不过多考虑项目难度,只要客观标准要目标参照性测验可以不过多考虑项目难度,只要客观标准要求掌握的内容均应适用。求掌握的内容均应适用。常模参照测验应使项目平均难度为常模参照测验应使项目平均难度为0.5,项目难度范围为,项目难度范围为0.50.2。选拔性考试应将项目难度控制在录取率附近分布,或使对选选拔性考试应将项目难度控制在录取率附近分布,或使对选拔点附近的被试有拔点附近的被试有0.5的难度,或难度为录取率。的难度,或难度为录取率。取决于测验的性质取决于测验的性质速度测验难度不宜太高,项目难度值基本相等。速度测验难度不宜太高,项目难度值基本相等。难度测验要求难度值在难度测验要
6、求难度值在0.5左右。左右。无论速度还是难度测验,都要防止被试得满分。无论速度还是难度测验,都要防止被试得满分。第八张,PPT共六十一页,创作于2022年6月四、难度的等距变换四、难度的等距变换难度转换的目的难度转换的目的难度为通过率,属于等级量表水平,需要转换难度为通过率,属于等级量表水平,需要转换为等距量表水平才能进一步进行加减运算。为等距量表水平才能进一步进行加减运算。难度到难度到Z分数的转换。分数的转换。以通过率以通过率P在标准正态分布表中查得对应的在标准正态分布表中查得对应的Z分分数。由于数。由于Z分数存在负数和小数点,需要将分数存在负数和小数点,需要将Z分分数作进一步的线性变换。数
7、作进一步的线性变换。ETS常采用下列换算公式:常采用下列换算公式:=4*Z+13=4*Z+13。越越大,难度越大。大,难度越大。第九张,PPT共六十一页,创作于2022年6月五、难度对测验的影响五、难度对测验的影响测验难度影响到测验分数的分布形态。测验难度影响到测验分数的分布形态。测验难度太大,测验分数将呈正偏态分布。测验难度太大,测验分数将呈正偏态分布。测验难度太小,测验分数将呈负偏态分布。测验难度太小,测验分数将呈负偏态分布。测验难度中等,测验分数将呈正态分布。测验难度中等,测验分数将呈正态分布。测验项目的难度分布影响到测验分数的离散程度,进而测验项目的难度分布影响到测验分数的离散程度,进
8、而影响到信度。影响到信度。Ebel的实验。如下一幻灯片所示。的实验。如下一幻灯片所示。Ebel的研究结论:项目的难度集中在的研究结论:项目的难度集中在0.5左右为最佳。左右为最佳。测验项目的难度会影响到项目的区分度。(区分度这节测验项目的难度会影响到项目的区分度。(区分度这节再讲)再讲)第十张,PPT共六十一页,创作于2022年6月第十一张,PPT共六十一页,创作于2022年6月第二节第二节 测验项目的区分度测验项目的区分度项目区分度的意义项目区分度的意义区分度的计算区分度的计算区分度与难度的关系区分度与难度的关系区分度的相对性区分度的相对性第十二张,PPT共六十一页,创作于2022年6月一、
9、项目区分度的意义一、项目区分度的意义定义:定义:区分度指测验项目对被试心理特质水平差异的区分能力。通常用区分度指测验项目对被试心理特质水平差异的区分能力。通常用D表示。表示。区分度价值:区分度价值:将优劣被试准确区分是测验项目的职能,区分度是对项目这将优劣被试准确区分是测验项目的职能,区分度是对项目这项职能高低的评价指标,是评价项目质量,选择优秀项目的项职能高低的评价指标,是评价项目质量,选择优秀项目的依据。依据。区分度标准:区分度标准:本来应找客观外界标准,也即类似于效标的测量,但因比较本来应找客观外界标准,也即类似于效标的测量,但因比较困难,故转而在测验内部找,实际以测验总分为标准,称其困
10、难,故转而在测验内部找,实际以测验总分为标准,称其为内部效标。为内部效标。第十三张,PPT共六十一页,创作于2022年6月区分度的实质:区分度的实质:项目得分与总分的一致性程度。项目得分与总分的一致性程度。区分度取值范围:区分度取值范围:-1,1,D为为0无区分作用,无区分作用,D值为正,表示值为正,表示积极区分,越大区分效果越好,积极区分,越大区分效果越好,D0表示消极表示消极区分。区分。第十四张,PPT共六十一页,创作于2022年6月二、区分度的计算二、区分度的计算高低分组法(也称鉴别指数法)高低分组法(也称鉴别指数法)适用范围:二分法记分的测验项目。适用范围:二分法记分的测验项目。计算公
11、式:计算公式:评价标准:评价标准:Ebel的研究结果的研究结果D D评价评价0.400.40以上以上0.300.300.390.390.200.200.290.290.200.20以下以下优良优良良好,修改更好良好,修改更好合格,必须修改合格,必须修改差,淘汰差,淘汰第十五张,PPT共六十一页,创作于2022年6月相关系数法相关系数法点二列相关点二列相关二列相关二列相关相关相关积差相关积差相关第十六张,PPT共六十一页,创作于2022年6月(一)点二列相关(一)点二列相关适用范围适用范围用于总分是连续变量,题分是二分变量情况。用于总分是连续变量,题分是二分变量情况。显著性检验可用积差相关检验。
12、显著性检验可用积差相关检验。计算公式计算公式其中其中p、q为答对和答错的人数比率。为答对和答错的人数比率。与与 对对应于答对和答错该项目的被试的总分平均数,应于答对和答错该项目的被试的总分平均数,为为所有被试总分的标准差。所有被试总分的标准差。第十七张,PPT共六十一页,创作于2022年6月举例:请计算该题区分度举例:请计算该题区分度第十八张,PPT共六十一页,创作于2022年6月(二)二列相关(二)二列相关适用范围适用范围题分和总为均为连续变量,但人为地将其中一题分和总为均为连续变量,但人为地将其中一个变量(既可以是总分,也可以是题分)区分个变量(既可以是总分,也可以是题分)区分为二分变量(
13、例如,将总分为及格和不及格两为二分变量(例如,将总分为及格和不及格两类)。类)。计算公式计算公式y是标准正态曲线下是标准正态曲线下 p与与q交界处的交界处的Y轴高度轴高度(曲线高)(曲线高),要查正态分布表。,要查正态分布表。第十九张,PPT共六十一页,创作于2022年6月二列相关的显著性检验二列相关的显著性检验第二十张,PPT共六十一页,创作于2022年6月第二十一张,PPT共六十一页,创作于2022年6月(三)(三)相关相关适用范围适用范围总分区分为高分组和低分组,项目得分区分为通过和未总分区分为高分组和低分组,项目得分区分为通过和未通过。即两个变量均为二分变量时。通过。即两个变量均为二分
14、变量时。资料整理成四格表(注意:格式中的符号表示该格资料整理成四格表(注意:格式中的符号表示该格的人数)的人数)高分高分低分低分通过通过ab未通过未通过cd第二十二张,PPT共六十一页,创作于2022年6月计算公式:计算公式:其中其中a、b、c、d为四个格子的人数。为四个格子的人数。为为相关相关系数。系数。相关的显著性检验相关的显著性检验 使用使用 检验,其中自由度检验,其中自由度df=1。检验公式为:检验公式为:第二十三张,PPT共六十一页,创作于2022年6月举例:请计算该题的区分度举例:请计算该题的区分度第二十四张,PPT共六十一页,创作于2022年6月(四)积差相关(四)积差相关例子:
15、请用积差相关法计算下列论述题的区例子:请用积差相关法计算下列论述题的区分度。分度。第二十五张,PPT共六十一页,创作于2022年6月三、区分度与难度的关系三、区分度与难度的关系D的最大值与项目难度的关系(理论上)的最大值与项目难度的关系(理论上)第二十六张,PPT共六十一页,创作于2022年6月题目的综合分析和筛选题目的综合分析和筛选整个测验的平均难度应保持在整个测验的平均难度应保持在0.5左右。左右。测验中各项目之间有一定相关,为了使成绩测验中各项目之间有一定相关,为了使成绩分布均匀,项目难度的应广一些,梯度大一些,分布均匀,项目难度的应广一些,梯度大一些,最好成正态分布。最好成正态分布。每
16、项题目理想的区分度都应在每项题目理想的区分度都应在0.3以上,至少以上,至少是是0.2。第二十七张,PPT共六十一页,创作于2022年6月四、影响区分度的因素四、影响区分度的因素效标不同,区分度不同。效标不同,区分度不同。应选择较好的效标。应选择较好的效标。不同的计算方法,所得区分度不同不同的计算方法,所得区分度不同在分析同一个测验时,各个项目的区分度值要在分析同一个测验时,各个项目的区分度值要采用同一种指标。采用同一种指标。样本容量大小影响相关法区分度值的大小样本容量大小影响相关法区分度值的大小样本容量越小,区分度的计算值越不可靠。样本容量越小,区分度的计算值越不可靠。采用相关法计算的区分度
17、要进行显著性检验和采用相关法计算的区分度要进行显著性检验和计算统计检验力。计算统计检验力。第二十八张,PPT共六十一页,创作于2022年6月分组标准影响鉴别指数值分组标准影响鉴别指数值一般情况下,取一般情况下,取25%33%,习惯上取,习惯上取27%。当效标分数较正态分布平坦时,比值应略高于当效标分数较正态分布平坦时,比值应略高于27%。当样本团体人数过少(例如样本容量当样本团体人数过少(例如样本容量n100)时,可按)时,可按50%的规则选取高低分组被试。的规则选取高低分组被试。被试样本的同质性程度影响区分度值大小被试样本的同质性程度影响区分度值大小同质性高,区分度小。同质性高,区分度小。区
18、分度高低受被试样本团体特质水平影响。区分度高低受被试样本团体特质水平影响。因此不能将区分度作为筛选试题的绝对标准。因此不能将区分度作为筛选试题的绝对标准。第二十九张,PPT共六十一页,创作于2022年6月五、提高题目区分度方法五、提高题目区分度方法(1)(1)控制好题目难度。将题目难度在控制好题目难度。将题目难度在0.50.5左右左右时,区分能力理论上会比较高。时,区分能力理论上会比较高。(2)(2)保证题目所测心理特质与全卷所测心理保证题目所测心理特质与全卷所测心理品质的一致性。品质的一致性。(3)(3)题干及答案无歧义。题干及答案无歧义。(4)(4)语言准确规范。语言准确规范。(5)(5)
19、借助选项分析提供的信息对不良选项进借助选项分析提供的信息对不良选项进行修改,以提高题目区分能力。行修改,以提高题目区分能力。第三十张,PPT共六十一页,创作于2022年6月综合练习综合练习一试卷施测于十一名被试,结果如附表。一试卷施测于十一名被试,结果如附表。第三十一张,PPT共六十一页,创作于2022年6月请求取:请求取:(1)第二、第五两题的难度。)第二、第五两题的难度。(2)第三题的区分度(点二列相关)。)第三题的区分度(点二列相关)。(3)第六题的区分度(高低分组法)。)第六题的区分度(高低分组法)。(4)全卷信度)全卷信度系数。系数。(5)试卷实证效度。)试卷实证效度。第三十二张,P
20、PT共六十一页,创作于2022年6月第三节第三节 猜测问题与猜测率猜测问题与猜测率客观测验题中的猜测问题与猜测率客观测验题中的猜测问题与猜测率项目难度受猜测影响的校正项目难度受猜测影响的校正第三十三张,PPT共六十一页,创作于2022年6月一、客观测验题中的猜测问题与猜测率一、客观测验题中的猜测问题与猜测率客观测验题中的猜测问题客观测验题中的猜测问题测验分数确实反映了被试的真实特质水平还是因为猜测而获得成测验分数确实反映了被试的真实特质水平还是因为猜测而获得成功?功?猜测误差的来源猜测误差的来源猜相对于不猜引起的误差猜相对于不猜引起的误差是否猜得对引起的误差是否猜得对引起的误差猜测率猜测率是指
21、被试全凭随机猜测而答对题目的概率。是指被试全凭随机猜测而答对题目的概率。猜测行为主要出现在客观题(如选择题、是非判断题、配对题猜测行为主要出现在客观题(如选择题、是非判断题、配对题等)等)第三十四张,PPT共六十一页,创作于2022年6月二、项目难度受猜测影响的校正二、项目难度受猜测影响的校正猜测校正公式(前提:猜测是随机猜测)猜测校正公式(前提:猜测是随机猜测)因猜测对项目难度的校正因猜测对项目难度的校正其中其中CP为校正后难度,为校正后难度,K为备选答案数,为备选答案数,P为实际难为实际难度。度。因猜测对个体得分的校正因猜测对个体得分的校正其中其中R为原答项目数,为原答项目数,W为错答数,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 测量 第六
限制150内