SPSS 在英语试卷统计分析中的应用.doc
《SPSS 在英语试卷统计分析中的应用.doc》由会员分享,可在线阅读,更多相关《SPSS 在英语试卷统计分析中的应用.doc(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS 在英语试卷统计分析中的应用刘宝权 席仲恩上海外国语大学 研究生部,上海 摘要:本文旨在通过演示,使没有系统学过教育统计学的外语研究者和广大外语教师能够借助SPSS对日常考试试卷进行必要的分析。重点介绍SPSS在项目分析和试卷整体定量统计分析中的应用,包括原始数据的输入、项目难度、项目区分度以及试卷信度内容,以消除外语研究者及广大外语教师对于试卷定量分析的神秘感和恐惧感,从而使我们的学校考试或者课堂考试更科学,更好地服务于外语教学,最终大面积地提高我国的外语教学质量和效率。关键词:SPSS; 英语试卷分析;项目分析;信度分析Analyzing English Language Test
2、 with SPSSLIU Bao-quan, XI Zhong-enGraduate School, Shanghai International Studies UniversityAbstract: This paper demonstrates to the foreign language researchers and teachers how they, who have had no systematic training in educational statistics, can analyze their classroom or school-based tests w
3、ith SPSS. A step-by-step approach is taken, starting from variable definition, inputting data, analysis to understanding the result. Our focus is on the interpretation of SPSS printout concerning item difficulty and item discrimination. Our aim is to demystify quantitative item and test analysis for
4、 humanistic-minded foreign language teachers so as to make it possible for them to make classroom test and school-based test more scientific and better serve foreign language education. Ultimately, the quality and efficiency of foreign language teaching in China will be improved. Key words: SPSS; An
5、alysis of English Test; Item Analysis; Reliability Study1 引言测试既是教育系统的有机组成部分,又是教育系统中不可缺少的“魔鬼”。然而,显而易见,在当今社会教育资源相对落后的现实情况下,谁掌握着测试,谁就掌握着学校的课程安排和教学情景。于是,怎样驯服测试这个“魔鬼”,让其更好地服务于我们的教育和社会,就是一个摆在每一位政治家和教育工作者面前的既现实而又棘手的问题。由于测试目标的隐蔽性、模糊性以及对于测量对象测量的不完备性,使得测试工具(即考试试卷)的开发/制作、分析评价以及测量结果的报道不得不依赖一定的统计学理论。于是,就给测试涂上了一层
6、神秘的色彩,使得一般的教师特别是外语老师对科学的测试理论望而却步。一方面,由于几乎完全凭借自己的经验出题而不能保证试卷应有的质量,对学生有欠公正;另一方面,由于缺乏必要的简单统计知识,使考试结果中蕴藏的大量信息白白浪费,或者对考试结果做出不够正确的解释。本文的目的就是帮助广大的外语教学研究者和工作在教学第一线的外语教师消除对于测试,特别是对于试卷定量分析的神秘感和恐惧感,使最广大的外语教学研究者和老师了解、并进而掌握试卷的定量分析技术,提高自己的课堂考试试卷的质量,增强科学解释考试结果以及从考试结果中提取有用信息的能力。SPSS是一种在世界社会科学范围内应用最为广泛的统计软件之一,其界面的友好
7、性和操作的简便性,使得它备受广大社会科学工作者的青睐。因此,本文拟运用SPSS软件,对一份想象的客观考试试卷进行全程定量分析和评价,包括数据输入、项目分析和整卷分析等,目的是让有意学习试卷定量分析的读者,按照本文中的操作示例学会对自己的试卷进行独立分析,至于这份微型试卷的具体质量并没有任何实际意义。我们假定读者已经熟悉Windows 95及以上版本操作系统和Word字处理软件以及EXCEL统计软件的界面及其操作。2 具体操作2.1 数据输入本文中,我们假定试卷中的所有题目都是多项选择题或者有具体唯一客观答案的填空题,并假定每道题都被赋予相同的分数值,这样,答对一道题计1分,答错一道题计0分。于
8、是,我们的原始数据就都是 0 、1 数据。象启动Word一样启动SPSS,于是我们就进入SPSS的数据编辑器界面,如图1所示。SPSS的数据编辑器界面酷似EXCEL的界面。当看到SPSS processor is ready (SPSS 处理器已经就绪)字样时,说明启动成功。这时便可以命名并定义变量。用鼠标左键单击数据编辑器下方的Variable View(变量表)字样,就进入变量命名及定义界面。在第一列输入变量名:在第一行的第一个单元格中输入“姓名”,在第二行的第一格输入第一个题目名(本文用v1),余此类推。单击第二列的相应单元格,选择适当的变量类型,和学生名字或者代号对应的变量类型为Str
9、ing(字符串),和题目名对应的为Numeric(数值类型)。第三列可以不管,第四列Decimals(小数点后的位数)选择0。最后一列Measure(量表水平),对应于学生姓名的选择Nominal(称名),对应于题目的选Scale(规度)。其余均用SPSS的默认值。变量一一定义完毕,左键点击下面的Data View (数据),返回数据编辑器界面,开始输入数据。输入数据时,第一列输入考生的名字或者编号,从第二列起直接输入题目成绩,以后依次每列输入一个题目的成绩,答对这个题目输入1,答错输入0。为了方便,本文假定考生的人数为22,题目(词汇)的个数为20。实际分析题目时,学生的人数一般要远远多于2
10、2人,题目的个数也多于20个。我们的原始数据表如图1。图1. SPSS原始数据表2.2 试卷分析2. 2. 1试卷分析的操作步骤原始数据准备就绪后,我们便可以进行项目(题目)分析。左键单击数据编辑器上面菜单栏的Analyze(分析),将鼠标移动到下拉菜单的Scale(量表)处,左键单击更下一级菜单的Reliability Analysis(信度分析),进入项目分析和信度分析对话框。在左框中选中要进入分析的项目(本例为v1v20),左键单击左右框之间的箭头,将选中的项目移至右边的框中。左键单击右框下面的Statistic(统计)钮,进入项目及试卷统计对话框。选中其中的Item,Scale,Sca
11、le if item deleted, Means,Variance,左键单击Continue钮,返回项目分析和信度分析对话框。左键单击OK钮,计算机就完成了所有的项目和信度分析。其输出结果如下。剩下的工作就是解释分析结果,提取必要的信息。2. 2. 2试卷分析结果的解读 用SPSS进行试卷分析,一次性可以提供大量的信息。下面,我们逐个解读几个分析结果输出表。图2.项目难度分析结果 R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Mean Std Dev Cases 1. V1 .2273 .4289 22.0 2.
12、V2 .5909 .5032 22.0 3. V3 .3182 .4767 22.0 4. V4 .6818 .4767 22.0 5. V5 .6364 .4924 22.0 6. V6 .5000 .5118 22.0 7. V7 .4091 .5032 22.0 8. V8 .4545 .5096 22.0 9. V9 .3182 .4767 22.0 10. V10 .2727 .4558 22.0 11. V11 .6364 .4924 22.0 12. V12 .5000 .5118 22.0 13. V13 .0909 .2942 22.0 14. V14 .5000 .5118
13、 22.0 15. V15 .1364 .3513 22.0 16. V16 .5909 .5032 22.0 17. V17 .5455 .5096 22.0 18. V18 .1364 .3513 22.0 19. V19 .4545 .5096 22.0 20. V20 .1818 .3948 22.0图2向我们提供的是项目难度(也就是通常所说的p)的信息。第一列是项目的序号,第二列是项目的名称,第三列(Mean)就是项目的难度(实际上是易度),第四列是项目的标准差,第五列是考生的人数。这里,我们只需要第三列-项目的难度就可以了。对于四选一的项目,其难度取值一般在0.475-0.85之间
14、。低于0.475和高于0.85的题目一般认为不合适,应舍弃。图3.试卷统计结果Statistics for Mean Variance Std Dev N of Variables SCALE 8.1818 7.5844 2.7540 20 图3向我们提供的是整卷的总结信息。也就是说,这22个考生的平均分为8.1818,他们分数分布的标准差为2.7540,这份试卷由20个项目组成。如果我们用这份试卷测量任何一组和这22个考生能力分布一样的其他考生,得到的结果也应该是这样。值得注意的是,在项目分析阶段,试卷的统计结果是没有多大意义和用处的,因此可以忽略。但是,如果是用通过分析筛选过的合格项目构成
15、的试卷做施测前的试测,则这部分关于整卷的总结信息就至关重要了。图4.项目区分度及试卷的信度 R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)Item-total Statistics Scale Scale Corrected Mean Variance Item- Alpha if Item if Item Total if Item Deleted Deleted Correlation Deleted V1 7.9545 8.0455 -.2651 .5061V2 7.5909 7.6818 -.1257 .489
16、6V3 7.8636 6.5996 .3093 .3926V4 7.5000 6.5476 .3318 .3873V5 7.5455 7.0216 .1228 .4347V6 7.6818 6.4177 .3489 .3795V7 7.7727 7.2316 .0368 .4543V8 7.7273 7.3506 -.0094 .4650V9 7.8636 7.5519 -.0743 .4762V10 7.9091 7.2294 .0600 .4475V11 7.5455 6.1645 .4816 .3484V12 7.6818 6.7987 .1963 .4174V13 8.0909 7.6
17、104 -.0693 .4611V14 7.6818 6.7987 .1963 .4174V15 8.0455 7.8550 -.2001 .4846V16 7.5909 7.3009 .0111 .4600V17 7.6364 6.6234 .2673 .4001V18 8.0455 7.1883 .1448 .4316V19 7.7273 6.0173 .5229 .3341V20 8.0000 6.8571 .2764 .4065Reliability CoefficientsN of Cases = 22.0 N of Items = 20Alpha = .4458图4向我们提供项目区
18、分度的各种信息和试卷的信度信息。第一列是项目名称,第二、三、四、五列全部是关于项目区分度的信息。通常,我们根据第四列判断项目区分度的优劣。具体的标准要根据考试的重要性决定。如果是非常重要的考试,例如高考和硕士入学考试,一个合格的项目,其区分度不应该低于0.3,最好在0.4以上。如果是一般的考试,区分度也不应该低于0.2。如果我们的标准定为0.4,根据我们的分析结果,只有v11和v19两个项目合格,其余都不合格,因此应该淘汰,不能进入正式的试卷。图4下面提供的便是试卷的信度信息。一般说来,在项目分析阶段,信度信息自身是没有多大用处的,可以不去理会它。因为,项目分析的目的是选出优秀的项目,剔除不合
19、格的项目。如果我们经过多次的项目分析,将每一次选择的合格项目连同它们的难度和区分度参数(即数值)汇集起来,就构成一个题库。考试前,从题库中提取足够量的项目组成试卷。将构好的试卷施测于一组代表样本的学生。对这个考试结果再进行试卷分析,这时得到的试卷信度才是试卷的信度,才有意义。3结语考试是一种测量,试卷就是进行测量的工具。要提高测量的精度,就得在测量工具上下大功夫,我们用科学的测量理论对组成试卷的一道道题目进行分析,取优弃劣。即使由于各种原因在考试前不能做项目分析,在每次考试后也应该进行项目分析。这样做,虽然对于本次考试已经没有多大意义,但是,如果通过分析,把每一次考试的优秀项目累积起来,慢慢地
20、,就构成自己系或者学校,甚至一门课程的题库。对由题库中的项目构成的试卷进行分析的过程与以上的过程完全相同。过去由于计算机不普及,统计软件不普遍,进行试卷分析有技术上的困难。可是,到了今天,计算机已走进千家万户,象SPSS这样的专业统计软件已经非常流行,而且它的使用并不比Word或者EXCEL复杂。我们没有理由不利用现代科学技术的成果服务于我们的外语教学和研究。对于一份试卷的分析到此还没有完成,我们以后将继续介绍用SPSS如何分析试卷的构建效度,以及如何用微软公司推出的EXCEL应用软件进行项目和试卷分析。通过专业软件学习试卷分析,是我们的一种新的学习方式,也是一种尝试,既然是学习和尝试,就难免
21、有缺点和错误,敬请广大专家、学者、同行及其他读者批评指正。一个量表的效度可以定义为观察值之间的差异所反映的物体之间被测特性的真实差异的程度,而不是系统误差或者随机误差。 1、内容效度 有时也叫做表面效度,是对量表的内容表现特定测量任务的优劣程度的一个主观而系统的评价,研究人员或其他人检测量表项目是否充分地覆盖了被测构想的全部范围。因此一个测量商店形象的量表如果忽略了任何主要的尺度(商品的质量、种类以及分类等),将被看做是不充分的。由于其主观的本质,单独的内容效度不是量表效度的充分指标,然而它有助于对量表分值的常识性解释。更为正式的评价可以通过检测标准效度获得。 2、标准效度 指一个量表是否像预
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 在英语试卷统计分析中的应用 英语 试卷 统计分析 中的 应用
限制150内