《化学教学测量与评价精选PPT.ppt》由会员分享,可在线阅读,更多相关《化学教学测量与评价精选PPT.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、化学教学测量与评价第1页,此课件共30页哦1.化学化学试卷和命卷和命题质量分析量分析2.常用的统计概念和特征量常用的统计概念和特征量第2页,此课件共30页哦一、难度一、难度难度是反映试题难易程度的数据。难度记为难度是反映试题难易程度的数据。难度记为P。难度的。难度的计算公式如下:计算公式如下:每一道试题:每一道试题:对客观试题对客观试题 (1)(R:答对试题人数:答对试题人数 n:考试人数):考试人数)对一般主观性试题对一般主观性试题 (2)(:该试题每个考生的得分该试题每个考生的得分 :得分总和:得分总和 a:该试题的赋分)该试题的赋分)即难度又等于试题的平均分除以试题的赋分。即难度又等于试
2、题的平均分除以试题的赋分。第3页,此课件共30页哦主观性试题和客观性试题难度公式本质上是一样的,主观性试题和客观性试题难度公式本质上是一样的,都是得分率。客观性试题得分情况只有两种,要么答都是得分率。客观性试题得分情况只有两种,要么答对得满分,要么打错得零分。因此公式(对得满分,要么打错得零分。因此公式(1)是公式)是公式(2)的特例(分子分母都约去了赋分值)的特例(分子分母都约去了赋分值a)。)。按此计算法按此计算法P值越大则题目越容易,这与我们习惯值越大则题目越容易,这与我们习惯认为难度大小正相反。为顺应习惯,也有不少书使用打认为难度大小正相反。为顺应习惯,也有不少书使用打错得比率错得比率
3、P(q)表示难度)表示难度P=1-q或或q=1-P。由上述公式可看出,由上述公式可看出,0P1.当当P=0时,说明无一时,说明无一人答对,极难。当人答对,极难。当P=1时,说明全部得分,极易。时,说明全部得分,极易。经验表明,对一般常规考试经验表明,对一般常规考试P值在值在0.30.8的试题应占的试题应占全卷试题总数的比较适宜。全卷试题总数的比较适宜。第4页,此课件共30页哦二、区分度二、区分度试题所具有的按考生实际程度把他们区分开来的能力,称为试题的区分度,或称试题所具有的按考生实际程度把他们区分开来的能力,称为试题的区分度,或称高低相差指数,鉴别能力指数,记为高低相差指数,鉴别能力指数,记
4、为D。1.相关系数法相关系数法考生总分的高低,是由每一道试题得分的高低来决定的,总分高的考生,相应每考生总分的高低,是由每一道试题得分的高低来决定的,总分高的考生,相应每一道题都得到较高的分数,反之亦然。这就是说,当考生在每道试题上的得分与他的一道题都得到较高的分数,反之亦然。这就是说,当考生在每道试题上的得分与他的总分之间成正相关时,程度好的考生(总分高),在此题得到高分数,这就满足了区总分之间成正相关时,程度好的考生(总分高),在此题得到高分数,这就满足了区分度的要求。如果正相关越强,区分能力越强。于是区分度计算公式为(求相关系数分度的要求。如果正相关越强,区分能力越强。于是区分度计算公式
5、为(求相关系数的积差相关公式)的积差相关公式)(N:考生总人数,不小于:考生总人数,不小于30,x:某一试题各个考生的得分,:某一试题各个考生的得分,y:对应于:对应于x的考的考生的总分)生的总分)用相关系数法求用相关系数法求D值具有普遍意义,若得出值具有普遍意义,若得出D为负值或为负值或D0.2的试题,一般应剔除。的试题,一般应剔除。0.2D0.4时,一般认为有较好的区分度。时,一般认为有较好的区分度。第5页,此课件共30页哦2.得分率求差法得分率求差法将占总考生人数的将占总考生人数的27%的总分高的考生作为的总分高的考生作为高分组,高分组,27%的总分低的考生作为低分组,某一的总分低的考生
6、作为低分组,某一试题在高分组的平均得分率与低分组的平均得分试题在高分组的平均得分率与低分组的平均得分率之差就是该题的区分度。率之差就是该题的区分度。(:高分组该题得分总和,:高分组该题得分总和,:低分组该题得分:低分组该题得分总和,总和,n:高分组或低分组人数,即为总人数的:高分组或低分组人数,即为总人数的27%,:回答本题所得的最低分,一般为零分):回答本题所得的最低分,一般为零分)第6页,此课件共30页哦该法又称为约翰逊法,此法忽略了高分组、该法又称为约翰逊法,此法忽略了高分组、低分组各自内在的区分情况,只是注意了高低组低分组各自内在的区分情况,只是注意了高低组之间的差别。用此法所得之间的
7、差别。用此法所得D值偏低,弗拉南根对此值偏低,弗拉南根对此作了修正,可查修正表将计算作了修正,可查修正表将计算D值加以修正。值加以修正。按此法算出区分度按此法算出区分度D后,则难度为:后,则难度为:第7页,此课件共30页哦三、信度三、信度 表示一份试卷的稳定性和可靠性的数据,称为试卷的信度。它表示用同表示一份试卷的稳定性和可靠性的数据,称为试卷的信度。它表示用同一种试题对学生在不同场合,不同时间进行几次考核所得结果的一致程一种试题对学生在不同场合,不同时间进行几次考核所得结果的一致程度。度。第一种是第一种是“重复测试法重复测试法”。第二种是第二种是“平均测试法平均测试法”。第三种是第三种是“分
8、半相关法分半相关法”。考虑到这种做法已将全卷题目分成两份,每部分只取总体量的一半,无形中考虑到这种做法已将全卷题目分成两份,每部分只取总体量的一半,无形中缩短了试卷的长度,影响了全卷原来应有的信度,需要作补长矫正,公缩短了试卷的长度,影响了全卷原来应有的信度,需要作补长矫正,公式为式为(:全卷的信度系数,:全卷的信度系数,:奇偶两部分的相关系数):奇偶两部分的相关系数)一般信度一般信度r的最高值为的最高值为1.0,若,若r为零,表示考试的成绩根本不可靠。一般认为为零,表示考试的成绩根本不可靠。一般认为r在在0.9左右既有较高的信度。左右既有较高的信度。第8页,此课件共30页哦四、效度四、效度效
9、度是反映试卷的准确性和有效性的数据,它效度是反映试卷的准确性和有效性的数据,它反映了我们希望测到的与实际测到的相符合的程度,反映了我们希望测到的与实际测到的相符合的程度,是一个程度上的概念,只有高低之分,不宜断然说一是一个程度上的概念,只有高低之分,不宜断然说一份试卷完全有效或完全无效。份试卷完全有效或完全无效。高效度必然有高信度,反之不然,高信度不一定是高效度。高效度必然有高信度,反之不然,高信度不一定是高效度。提高效度的主要途径是:考试内容和范围要涉及教学的主要提高效度的主要途径是:考试内容和范围要涉及教学的主要内容,考试中要尽量将与测验目的无关的成分除去,试题的内容,考试中要尽量将与测验
10、目的无关的成分除去,试题的难度适当,评分、计分的标准要统一、客观等。难度适当,评分、计分的标准要统一、客观等。.第9页,此课件共30页哦2.常用的统计概念和特征量常用的统计概念和特征量第10页,此课件共30页哦 统计图统计图统计图由标题、图号标目、图注等项构成统计图由标题、图号标目、图注等项构成。1.直条图直条图 2.圆形图圆形图第11页,此课件共30页哦3.线条图线条图4.频数颁布直方图频数颁布直方图图图.4中考化学统计成绩直方图中考化学统计成绩直方图第12页,此课件共30页哦5.累积频数图累积频数图图图.5 2004年中考化学抽样得分情况累积频数图年中考化学抽样得分情况累积频数图 10 2
11、0 30 40 50 60 70 80 90 100图2.6:高一语文第13页,此课件共30页哦频数分布图频数分布图1)直方图)直方图A、建立直角坐标系,、建立直角坐标系,把频数分布表的上、下把频数分布表的上、下限,组中值列在横轴上,限,组中值列在横轴上,以频数作纵轴。以频数作纵轴。B、依频数分布表,定、依频数分布表,定出各组频数高度,并在出各组频数高度,并在各组频数高度处划一横各组频数高度处划一横线,与各组上、下限上线,与各组上、下限上的两条纵线相交,形成的两条纵线相交,形成一个矩形,各矩形间不一个矩形,各矩形间不能留空隙。能留空隙。第14页,此课件共30页哦2)多边图)多边图A建立直角坐标
12、系,把建立直角坐标系,把频数分布表的上、下限,频数分布表的上、下限,组中值列在横轴上,以组中值列在横轴上,以频数作纵轴。频数作纵轴。B 依频数分布表,以各依频数分布表,以各组的中点为横坐标,以组的中点为横坐标,以各组的频数为纵坐标描各组的频数为纵坐标描点,然后把每相邻两点点,然后把每相邻两点用直线连接,即成多边用直线连接,即成多边图。图。第15页,此课件共30页哦3、频数分布曲线、频数分布曲线如分数的数目逐渐增多,如分数的数目逐渐增多,组数渐增,组距渐小,组数渐增,组距渐小,则曲线将变光滑,此光则曲线将变光滑,此光滑曲线称为频数分布曲滑曲线称为频数分布曲线。线。依学生的测验分布绘成依学生的测验
13、分布绘成的频数分布曲线,一般的频数分布曲线,一般有以下几种有以下几种正偏态负偏态双峰型 单狭峰第16页,此课件共30页哦正态分布图正态分布图n偏正态分布偏正态分布第17页,此课件共30页哦一、算术平均数一、算术平均数二、众数二、众数众数是指次数分布出现次数最多的数据。用众数是指次数分布出现次数最多的数据。用Mo表示表示众数的计算一般可用统计观察法。例如某班化学试众数的计算一般可用统计观察法。例如某班化学试卷中选择题的错误情况统计如下:卷中选择题的错误情况统计如下:选择题错误选择题错误个数个数0 01 12 23 34 45 56 67 7计总计总试卷份数试卷份数5656878711411413
14、71375656282811118 8500500那么选择题错误个数那么选择题错误个数3是近似众数,因为选错是近似众数,因为选错3个的试卷有个的试卷有137份之多,是首位的。份之多,是首位的。第18页,此课件共30页哦例:甲、乙两位学生成绩如下所示例:甲、乙两位学生成绩如下所示语文语文数学数学物理物理化学化学政治政治英语英语平均平均甲甲9595909065657070757585858080乙乙110110707095955050808075758080如何来评价两个学生的成绩呢?如何来评价两个学生的成绩呢?先用下面的图作直观的分析先用下面的图作直观的分析由图可见乙的成绩离开平均(离中)由图可
15、见乙的成绩离开平均(离中)趋势越大,即各科成绩离散的程度大;甲趋势越大,即各科成绩离散的程度大;甲的成绩离散程度小,成绩总的来看比较平的成绩离散程度小,成绩总的来看比较平稳。稳。平均分数在这里没有起作用,它平均分数在这里没有起作用,它反映不了各科成绩的差异情况。反映不了各科成绩的差异情况。表示一组数据离散程度(集表示一组数据离散程度(集中趋势)的数量,称为差异量数。中趋势)的数量,称为差异量数。差异量数有多种,这里主要介绍应差异量数有多种,这里主要介绍应用最广的方差和标准差。用最广的方差和标准差。第19页,此课件共30页哦三、方差三、方差一组数据每一数与平均数的差的平方的平均称为方差,一组数据
16、每一数与平均数的差的平方的平均称为方差,记为记为 。已知一组数据已知一组数据x:x1、x2、x3xn,其算术平均,其算术平均数为,则方差为:数为,则方差为:第20页,此课件共30页哦四、标准差四、标准差 方差的算术平方根即为标准差,记为方差的算术平方根即为标准差,记为(2)式与(式与(1)等价,它表示一组数据的方差,等于这组数)等价,它表示一组数据的方差,等于这组数据平方的平均(据平方的平均()与平均的平方)与平均的平方 之差。它有利于之差。它有利于记忆,在实际计算中也比较方便。记忆,在实际计算中也比较方便。第21页,此课件共30页哦前例中甲、乙两位学生各科学习成绩的标准差:前例中甲、乙两位学
17、生各科学习成绩的标准差:甲:甲:(利用公式(利用公式(1)乙:乙:(利用公式(利用公式(2)可知乙的标准差大于甲的标准差,可见标准差的大小确定能够可知乙的标准差大于甲的标准差,可见标准差的大小确定能够反映甲乙二人各科成绩的另外一些特征。反映甲乙二人各科成绩的另外一些特征。一般说来标准差越小,表明数据的离中趋势越小,即对平均数的离散程一般说来标准差越小,表明数据的离中趋势越小,即对平均数的离散程度越小,数据分布范围集中在平均数附近,总体显得比较整齐;标准差度越小,数据分布范围集中在平均数附近,总体显得比较整齐;标准差越大,表明数据的离中趋势越大,即对平均数的离散程度越大,数据分越大,表明数据的离
18、中趋势越大,即对平均数的离散程度越大,数据分布范围越大,总体显得参差不齐布范围越大,总体显得参差不齐。第22页,此课件共30页哦五、无偏标准差五、无偏标准差 在一般情况下,成绩的分布总是呈现高分,低分的人数较少,在一般情况下,成绩的分布总是呈现高分,低分的人数较少,而在平均分附近的人数较多,即而在平均分附近的人数较多,即“两头小,中间大,左右对称两头小,中间大,左右对称”,这,这种情况即所谓正态分布。因此,抽出的样本中抽到极端的情况就更少,种情况即所谓正态分布。因此,抽出的样本中抽到极端的情况就更少,抽不到差距大的书,必然会使样本的标准差较小于总体的标准差。在抽不到差距大的书,必然会使样本的标
19、准差较小于总体的标准差。在数学上可以证明,随机样本的标准差小于相应总体的标准差,利用误数学上可以证明,随机样本的标准差小于相应总体的标准差,利用误差分析方法来进行修正,涉及到下面公式差分析方法来进行修正,涉及到下面公式:S称为无偏标准差,它与标准差公式的差别为分母一个是称为无偏标准差,它与标准差公式的差别为分母一个是n,一个是,一个是n-1,由于由于nn-1,则可见,则可见S。如果用样本的标准差来代替总体的标准差,请记住一。如果用样本的标准差来代替总体的标准差,请记住一定用定用S,不用,不用,这样才符合总体的情况。这样才符合总体的情况。第23页,此课件共30页哦六、变差系数六、变差系数一组数据
20、标准差与平均值得百分比称为这组数据的变一组数据标准差与平均值得百分比称为这组数据的变差系数,记为差系数,记为式中式中S为标准差,为平均值,其单位一样,因而为标准差,为平均值,其单位一样,因而 无单位。这样,对于不同单位的量就好比较了。无单位。这样,对于不同单位的量就好比较了。如:某市如:某市1979年年10岁儿童身高、体重数据岁儿童身高、体重数据项目项目平均平均标准差标准差S身高身高cm135.01135.015.545.54体重体重kg28.0328.033.403.40则:身高则:身高体重体重由以上计算可知:由以上计算可知:,即体重的离散程度比身高的离散程度大。,即体重的离散程度比身高的离
21、散程度大。第24页,此课件共30页哦利用上面几个概念可以对两个班学生化学学习成绩利用上面几个概念可以对两个班学生化学学习成绩作一些分析比较。作一些分析比较。时间时间中期考试中期考试期末考试期末考试项目项目S1S2试验班试验班7272151520.6%20.6%8080121215%15%0.720.72对照班对照班686814148181131316%16%0.780.78由上表可知两班由上表可知两班 均小于均小于1,即从期中到期末,成绩的分化,即从期中到期末,成绩的分化都缩小,且试验班分化的缩小更快一些。都缩小,且试验班分化的缩小更快一些。为了更确切地反映出学生的学习成绩,表明一个原始分数在
22、总为了更确切地反映出学生的学习成绩,表明一个原始分数在总体中的地位,即考虑平均分数,又考虑离散程度,引入一个反体中的地位,即考虑平均分数,又考虑离散程度,引入一个反映题目难度(总体水平)和学生实际水平的分数叫做标准分数。映题目难度(总体水平)和学生实际水平的分数叫做标准分数。第25页,此课件共30页哦七、标准分数七、标准分数原始分数与平均分数的差所包含标准差的个数称为原始分数与平均分数的差所包含标准差的个数称为标准分数。标准分数。其中其中Z:标准分数;:标准分数;x:原始分数;:原始分数;:平均分数;:平均分数;:标准差:标准差利用标准分数,可以开展多种教学质量的评价。利用标准分数,可以开展多
23、种教学质量的评价。例,某学生一次考试三科成绩如下:例,某学生一次考试三科成绩如下:项目项目原始分数原始分数班平均分班平均分班标准差班标准差标准分数标准分数语文语文858582827 70.40.4数学数学858590901919-0.3-0.3外语外语858590904 4-1.3-1.3原始分数都一样,不便于分析该生在各科学习上潜在的问题。转化为标准分数后,原始分数都一样,不便于分析该生在各科学习上潜在的问题。转化为标准分数后,可以看出,语文、数学均在平均分附近,外语则差些,即外语需要更多下工夫。可以看出,语文、数学均在平均分附近,外语则差些,即外语需要更多下工夫。第26页,此课件共30页哦
24、八、相关系数八、相关系数在教育领域内,更多的会遇到下面的现象:一组变量的变化,会引起另一组在教育领域内,更多的会遇到下面的现象:一组变量的变化,会引起另一组变量的变化。从数量关系的特点来考查,大体可分为两种:变量的变化。从数量关系的特点来考查,大体可分为两种:第一种类型:变量间存在着严格的依存关系,即我们熟知的函数关系。第一种类型:变量间存在着严格的依存关系,即我们熟知的函数关系。第二种类型:两组变量间虽不十分严格但却存在着依存关系。这时一组变量的变化,必然会第二种类型:两组变量间虽不十分严格但却存在着依存关系。这时一组变量的变化,必然会引起另一组变量的变化,数值间不能如函数关系那样唯一确定,
25、有波动性,但却遵循一引起另一组变量的变化,数值间不能如函数关系那样唯一确定,有波动性,但却遵循一定的规律而变动。我们称这样的两组变量之间的关系就是相关关系。定的规律而变动。我们称这样的两组变量之间的关系就是相关关系。相关关系又分为以下三种情况相关关系又分为以下三种情况正相关正相关两组变量变化方向一致,如化学成绩与其它理科成绩之间为正两组变量变化方向一致,如化学成绩与其它理科成绩之间为正 相相关。关。负相关负相关两组变量变化方向相反,如复习次数与遗忘量之间的负相关。两组变量变化方向相反,如复习次数与遗忘量之间的负相关。零相关零相关两变量间无任何关系,如身高与学习成绩间为零相关。两变量间无任何关系
26、,如身高与学习成绩间为零相关。表示相关程度大小的数据称为相关系数,记为表示相关程度大小的数据称为相关系数,记为 。第27页,此课件共30页哦积差相关公式积差相关公式例:抽出例:抽出10名学生高考的数学、化学成绩如下:名学生高考的数学、化学成绩如下:数学数学x化学化学yxyxy636374743969396954765476466246629292818184648464656165617452745275757171562556255041504153255325808090906400640081008100720072007373848453295329705670566132613265
27、65696942254225479147914485448572727878518451846084608456165616848491917056705682818281764476446262656538443844422542254030403070707878490049006084608454605460781781549965499661669616695800658006第28页,此课件共30页哦代入公式:代入公式:一般情况下,数据要大于一般情况下,数据要大于30对,否则易失掉有效意对,否则易失掉有效意义。义。,为完全相关,为完全相关,为零相关,为零相关,表示相关程度低,表示相关程度低,为相关程度普遍,为相关程度普遍,为为相关程度显著,相关程度显著,为相关程度高。为相关程度高。上例说明数学与化学高考成绩相关程度较高。上例说明数学与化学高考成绩相关程度较高。第29页,此课件共30页哦学生成绩核校办法学生成绩核校办法对于标准化考试有比较精确的算法,对于一般对于标准化考试有比较精确的算法,对于一般考试可用如下两公式核校:考试可用如下两公式核校:,x为原始分,为原始分,y为校正后的分数,有为校正后的分数,有时也可变动系数时也可变动系数10.,如设,如设x=45,65;y=60,80代入公式代入公式求得求得a、b后进行计算。后进行计算。第30页,此课件共30页哦
限制150内