心理与教育测量第六章ppt课件.ppt
《心理与教育测量第六章ppt课件.ppt》由会员分享,可在线阅读,更多相关《心理与教育测量第六章ppt课件.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 测验的项目分析测验项目的难度测验项目的区分度分析猜测问题与猜测率多重选择题的项目分析第一节 测验项目的难度难度的意义项目难度的计算测验难度水平的确定难度的等距变换难度对测验的影响一、难度的意义难度分类项目难度和测验难度。本章主要讲项目难度。难度定义难度是测验项目的难易程度。通常用“P”来表示。一个测验项目,如果大部分被试都能答对,则该项目的难度就小;反之亦然。CTT下的难度特征难度是测验项目性质与被试水平共同作用的结果。如果测验项目需要较复杂的心理操作,那么被试水平高时,得到的难度值就小;反之得到的难度值就大。二、项目难度的计算得分率法通式(所有项目都适用):为全体被试在项目上的平均得
2、分,F为项目满分值。特式(针对二分法记分项目):其中P代表项目难度;N为全体被试数;R为答对通过该项目的人数。高低分组法通式:其中 、分别为总分排名在前27%的高分组和后27%低分组被试在要计算难度的项目上的平均分。F为满分值。特式:=(RH/NH+RL/NL)/2其中 和 分别代表高分组与低分组的通过率。RH和RL分别代表高低分组答对人数,NH和NL分别代表高低分组总人数。举例:请分别用通过率法和高低分组法计算下列两题难度二、测验难度水平确定取决于测验的目的目标参照性测验可以不过多考虑项目难度,只要客观标准要求掌握的内容均应适用。常模参照测验应使项目平均难度为0.5,项目难度范围为0.50.
3、2。选拔性考试应将项目难度控制在录取率附近分布,或使对选拔点附近的被试有0.5的难度,或难度为录取率。取决于测验的性质速度测验难度不宜太高,项目难度值基本相等。难度测验要求难度值在0.5左右。无论速度还是难度测验,都要防止被试得满分。四、难度的等距变换难度转换的目的难度为通过率,属于等级量表水平,需要转换为等距量表水平才能进一步进行加减运算。难度到Z分数的转换。以通过率P在标准正态分布表中查得对应的Z分数。由于Z分数存在负数和小数点,需要将Z分数作进一步的线性变换。ETS常采用下列换算公式:=4*Z+13。越大,难度越大。五、难度对测验的影响测验难度影响到测验分数的分布形态。测验难度太大,测验
4、分数将呈正偏态分布。测验难度太小,测验分数将呈负偏态分布。测验难度中等,测验分数将呈正态分布。测验项目的难度分布影响到测验分数的离散程度,进而影响到信度。Ebel的实验。如下一幻灯片所示。Ebel的研究结论:项目的难度集中在0.5左右为最佳。测验项目的难度会影响到项目的区分度。(区分度这节再讲)第二节 测验项目的区分度项目区分度的意义区分度的计算区分度与难度的关系区分度的相对性一、项目区分度的意义定义:区分度指测验项目对被试心理特质水平差异的区分能力。通常用D表示。区分度价值:将优劣被试准确区分是测验项目的职能,区分度是对项目这项职能高低的评价指标,是评价项目质量,选择优秀项目的依据。区分度标
5、准:本来应找客观外界标准,也即类似于效标的测量,但因比较困难,故转而在测验内部找,实际以测验总分为标准,称其为内部效标。区分度的实质:项目得分与总分的一致性程度。区分度取值范围:-1,1,D为0无区分作用,D值为正,表示积极区分,越大区分效果越好,D0表示消极区分。二、区分度的计算高低分组法(也称鉴别指数法)适用范围:二分法记分的测验项目。计算公式:评价标准:Ebel的研究结果D评价0.40以上0.300.390.200.290.20以下优良良好,修改更好合格,必须修改差,淘汰相关系数法点二列相关二列相关相关积差相关(一)点二列相关适用范围用于总分是连续变量,题分是二分变量情况。显著性检验可用
6、积差相关检验。计算公式其中p、q为答对和答错的人数比率。与 对应于答对和答错该项目的被试的总分平均数,为所有被试总分的标准差。举例:请计算该题区分度(二)二列相关适用范围题分和总为均为连续变量,但人为地将其中一个变量(既可以是总分,也可以是题分)区分为二分变量(例如,将总分为及格和不及格两类)。计算公式y是标准正态曲线下 p与q交界处的Y轴高度(曲线高),要查正态分布表。二列相关的显著性检验(三)相关适用范围总分区分为高分组和低分组,项目得分区分为通过和未通过。即两个变量均为二分变量时。资料整理成四格表(注意:格式中的符号表示该格的人数)高分低分通过ab未通过cd计算公式:其中a、b、c、d为
7、四个格子的人数。为相关系数。相关的显著性检验 使用 检验,其中自由度df=1。检验公式为:举例:请计算该题的区分度(四)积差相关例子:请用积差相关法计算下列论述题的区分度。三、区分度与难度的关系D的最大值与项目难度的关系(理论上)题目的综合分析和筛选整个测验的平均难度应保持在0.5左右。测验中各项目之间有一定相关,为了使成绩分布均匀,项目难度的应广一些,梯度大一些,最好成正态分布。每项题目理想的区分度都应在0.3以上,至少是0.2。四、影响区分度的因素效标不同,区分度不同。应选择较好的效标。不同的计算方法,所得区分度不同在分析同一个测验时,各个项目的区分度值要采用同一种指标。样本容量大小影响相
8、关法区分度值的大小样本容量越小,区分度的计算值越不可靠。采用相关法计算的区分度要进行显著性检验和计算统计检验力。分组标准影响鉴别指数值一般情况下,取25%33%,习惯上取27%。当效标分数较正态分布平坦时,比值应略高于27%。当样本团体人数过少(例如样本容量n100)时,可按50%的规则选取高低分组被试。被试样本的同质性程度影响区分度值大小同质性高,区分度小。区分度高低受被试样本团体特质水平影响。因此不能将区分度作为筛选试题的绝对标准。五、提高题目区分度方法(1)控制好题目难度。将题目难度在0.5左右时,区分能力理论上会比较高。(2)保证题目所测心理特质与全卷所测心理品质的一致性。(3)题干及
9、答案无歧义。(4)语言准确规范。(5)借助选项分析提供的信息对不良选项进行修改,以提高题目区分能力。综合练习一试卷施测于十一名被试,结果如附表。请求取:(1)第二、第五两题的难度。(2)第三题的区分度(点二列相关)。(3)第六题的区分度(高低分组法)。(4)全卷信度系数。(5)试卷实证效度。第三节 猜测问题与猜测率客观测验题中的猜测问题与猜测率项目难度受猜测影响的校正一、客观测验题中的猜测问题与猜测率客观测验题中的猜测问题测验分数确实反映了被试的真实特质水平还是因为猜测而获得成功?猜测误差的来源猜相对于不猜引起的误差是否猜得对引起的误差猜测率是指被试全凭随机猜测而答对题目的概率。猜测行为主要出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 测量 第六 ppt 课件
限制150内