数学教育测量与评价(共28页).doc
精选优质文档-倾情为你奉上数学教育测量与评价专题讲座 第一章 均值和方差的检验题 一、参数假设检验的几个基本因素 关于什么是参数假设检验,我们先看一个实际例子。“某班语文课教学采用研讨式方法后,对其中10名同学测验,平均成绩为85分。已知这个班过去测验成绩服从正态分布,其均值保持在82分左右,这意味着总体平均分是给定的,那么现在问采用研讨式方法后,其平均成绩是否和原来一致?” 如果我们假设采用研讨式方法后的平均成绩和采用研讨式方法前的平均成绩一致,则需要判断这种假设对不对? 如果对,对的把握性有多大? 如果不对,那么平均成绩比原来是增加还是减少? 当然,我们不能只看到85分高于82分就认为比原来高了,这是因为抽取样本时受到随机因素的干扰,我们不能以样本参数对总体参数进行单纯比较而简单地下结论。 这个例子所反映问题的是: 总体分布已知,对总体参数作假设,用统计理论来判断这一假设正确与否,统计学上称为参数假设检验。 一般说来,进行假设检验应重点关注以下几个基本因素: 其一,假设。 假设分为参数假设和非参数假设.参数假设指总体分布已知,关于未知参数的假设,教育研究中用的最多的是已知总体服从正态分布,对总体均值某校五年级学生期末语文成绩,方差,总体方差做出假设。例如,在过在原有状况下不变,而均值去常规教学下为82分。为了提高教学质量,采用新的教学法后抽测10名同学,其平均成绩为85分,这时我们提出采用新教学法后总体均值称为原假设或零假设,相对于为82分的假设,记为 ,还要给出一个备选假设,记为 对这个例子我们不提本均值85大于82。 小于82这样的假设,这是因为这样的假设是没有根据的,原因在于样其二,假设检验。 对于一个假设,我们关心的是“假设”是否成立。判断假设成立与否的方法叫假设检验,最简单的检验是显著性检验。 例如,已知,对进行检验。其三,检验水平。 当原假设正确时,若否定原假设犯错误的概率为。 ,称为检验水平。一般地,取值为, 和,但常用的是其四,两类错误。 统计学上有两类错误: 第一类错误和第二类错误。 第一类错误是, 实际上,显著性水平是正确的,但检验的结论却是否定,记其概率为 就是犯第一类错误的概率,取的越大,否定的可能性就越大。 第二类错误是,是不对的,但检验结论却认为 是正确的,记其概率为 犯这两类错误的后果通常是不一样的,如检验某人是否患某种疾病,设:该人患有此种疾病,则第二类错误是无病当作有病,但第一类错误却是有病当作无病,有可能使该人延误病情而发生意外。可见犯第一类错误的后果较第二类错误的后果严重。最理想的情况是找到一种检验方法使得两类错误的概率都为0,但实际情况是当样本量事先给定的情况下,第一类错误小,第二类错误就大;第二类错误小,第一类错误就大。也就是说不可能找到一个方法能同时控制两类错误,退而求其次,在样本量给定的情况下,把第一类错误控制在检验水平以内,尽量使第二类小一些。 其五,检验的一般步骤。 第一步:建立原假设 备选假设not 。 第二步:构造一个检验统计量布。 ,在原假设正确的条件下得到的分第三步:观测到的数据可以得到统计量p=P(|t|) 的观测值t,计算p值 若p值小于检验水平平,则得出的结论是:原假设是不成立的;若p大于检验水,则需要进一步采取别,则得出的结论是:原假设是成立的;若p等于检验水平的方法来处理一下。 二、总体均值、方差和概率的检验问题 总体均值的检验 总体均值的检验方法有两种:检验和检验,这里我们主要介绍常用的t检验。利用服从分布的统计量进行的检验叫做检验.检验根据处理问题的不同主要涉及下面的三类检验问题。 第一,单正态总体,总体方差未知,对总体均值进行检验。 在实际应用中往往只知道总体服从正态分布,参数本方差作为的一个估计,从而构造t检验。设未知,设假设问题为 是未知的,常用的方法就是用样为来自正态总体not . 的一个样本, 在成立条件下,T统计量服从t分布,见如下 () 其中为样本方差,为样本均值,为自度。再样本数据计算出T统计量的观测值值,在成立条件下计算p值 pP(|T|>|t|)。 若p值小于检验水平检验水平,则得出的结论是:总体均值与与有显著差异;若p值大于,则得出的结论是:总体均值没有显著差异;若p值等于检验水平则需要进一步采取别的方法来处理一下。 例1:已往资料知道某区6岁女童平均体重为,现从某幼儿园抽测10名女童其体重数据为,,。问该幼儿园6岁女童平均体重与某区6岁女童平均体重有无显著差异?。 解:为样本量,未知,检验问题为 not 则T统计量服从自度为9的t分布。样本数据计算得 pP(|T|>|t|)>. p值大于检验水平说明该幼儿园6岁女童平均体重与本区6岁女童平均体重无显著性差异。 第二,方差,未知,但=,比较两总体均值和。 设样本,记 ,分别来自正态总体,的两个独立, , 检验问题为 not。 在成立条件下,构造统计量T, () 给定检验水平值 pP(|T|>|t|)。 ,再样本数据计算出T统计量的观测值值,在成立条件下计算p若p值小于检验水平于检验水平,则得出的结论是:总体均值和和有显著差异;若p值大,则得出的结论是:总体均值没有显著差异;若p值等于检验水平则需要进一步采取别的方法来处理一下。 特别地,当时,称为配对数据,统计量为 上一页 1 2 3 4 下一页 () 专题讲座 第一章 均值和方差的检验题 总体均值的检验 例2:从某中学初三学生中随机选定两个组(每组10人)进行语文教学改革试验。甲组采用讨论式方法,乙组采用讲授式方法,期末测验甲组平均成绩为78分,方差为15分,乙组平均成绩为73分, 方差为16分,问两种方法效果有无差异?(布。) )(设成绩服从正态分解:,假定两个总体的方差相等。 检验问题为not 则T统计量服从自度为18的t分布,样本数据计算出T统计量的观测值值为p值为 pP(|T|>|t|)|t|)0附小三年级学生采用结构教材前后成绩 使用使用结结构构教材教材后 前 70 82 60 62 85 75 74 90 58 72 总和 74 90 68 64 92 75 70 95 62 78 4 8 4 2 7 0 -4 5 4 6 40 0 4 0 2 3 -4 -8 1 0 2 0 16 0 4 9 16 64 1 0 4 130 解:设采用结构教材前成绩样本,采用结构教材后。 属同一组对象进行两次实验,故为相关样本。 而差数为D的均值,于服从正态分布,样本均值,未知,故也未知. ,其中为D的方差,检验问题为 :=0not 在成立条件下,构造T统计量, 则T统计量服从自度为9的t分布, 样本数据计算出T统计量的观测值值为其中样本均值为 样本方差为 p值为 pP(|T|>|t|) 差没有显著性变化. 。p值大于检验水平说明该幼儿园6岁儿童这项智力测定成绩方检验:利用均值分布统计量进行的检验叫做,检验。检验用来检验当两正态总体和。 未知,方差未知时比较两正态总体方差设本,记 ,分别来自正态总体的两个独立样 我们在检验中进行双正态总体,未知假定=,独立样本比较两总体均值和时,。因此在进行这类问题的检验前,首检先要检验两总体方差是否一致,这就要用到验。 检验问题为 not 在成立条件下,构造服从自度为和的F分布的统计量 其中为第一自度,为第二自度。给定检验水平,再样本数据计算,则得出的出F统计量的观测值f值,在结论是:总体方差方差和和成立条件下计算p值,若p值小于检验水平有显著差异;若p值大于检验水平,则得出的结论是:总体没有显著差异;若p值等于检验水平,则需要进一步采取别的方法来处理一下。 例6:利用例3的数据,检验问题为 not 在成立条件下,构造服从自度为39和29的F分布的统计量样本数据计算出F统计量的观测值f值在成立条件下计算p值> 。 p值大于检验水平说明男、女新生体重的方差无显著性差异。 上一页 1 2 3 4 下一页 ,单击OK,执行操作。 单样本t检验实例应用 某学校统一考试的高等数学的平均成绩为75分,该校经济学院某班的成绩见下表。请问该班的成绩与全校的平均成绩的差异显著吗? 编1 2 3 4 5 6 7 8 9 号 成 97 82 98 87 56 89 60 68 绩 90 编10 11 12 13 14 15 16 17 号 成96 97 75 60 92 64 83 76 绩 编18 19 20 21 22 23 24 25 26 号 成74 70 55 85 86 56 71 65 77 绩 编号 27 成绩 56 28 60 29 92 30 54 31 87 32 80 建立SPSS数据文件。 根据该班的高等数学的成绩建立SPSS数据文件。 One-Sample T Test的操作步骤。 读取数据文件,点击Analysis/Compare Means / One-Sample T Test,打开单样本t检验对话窗口。 将成绩变量移入Test Variable框中。 在Test Value后的参数栏中键入总体均值75. 点击OK,执行操作。 输出结果以及解释 单样本t检验的结果输出包括样本的基本描述统计结果与t检验结果。 表1输出的结果从左至右依次为样本的数量、均值、标准差和标准误。 表1 One-Sample Statistics Std. Deviation Std. Error Mean N Mean 成32绩 表2输出的结果从左至右依次为t值、自度、双尾检验的p值、样本均值与总体均值的差值和均值差值的95%臵信区间。均值插值的95%臵信区间=均值差值标准误,即Lower和Upper两项数值的含义。在此实验结果中,样本均值与总体均值的差值落在两项数值之间的概率为95%。 表2 One-Sample Testt df Sig. Test Value = 75 Mean 95% Confidence Interval (2-tailed) 成绩 .466 31 .645 Difference of the Difference Lower - Upper 结果的报告 T检验结果显示,这个班的高等数学的成绩与该学校高等数学平均成绩之间的差异不显著,t=,df=31,p 上一页 1 2 3 4 下一页 专题讲座 第一章 均值和方差的检验题 Independent-Sample T Test的操作选项 依次点击Analysis/Compare Means / Independent-Samples T Test, 打开独立样本t检验的对话窗口。 选择检验变量。从左侧变量列表中选定进行差异检验的变量,单击向右箭头,将其移入Test Variable(s)框中。 选择分租变量并定义组别。从左侧变量列表中选择一个分组变量,单击向右箭头按钮,将变量移入Group Variable框中。单击Define Groups按钮,打开定义组别的对话窗口。 如果Grouping Variable是分类变量且只有两个值,选择Use Specified Values选项栏,在Group后面的参数框中分别键入两组的分类变量值;如果Grouping Variable是分类变量且有多个值,选择Use Specified Values选项栏,并在Group后面的参数框中分别键入特定两组的分类变量值,系统只对具有这两个组进行均值比较;如果Grouping Variable是连续变量,选择Cut Point 选项并在其后面的参数栏中键入一个值,系统会将Grouping Variable按大于等于和小于该值分成两组,然后对它们进行均值比较。 臵信区间与缺失值处理采用系统默认方式。 点击OK,执行操作。 Independent-Sample T Test应用举例 某城市中考成绩出来后,有关教育部门想知道学校a1重点班和学校a2重点班的数学考试成绩是否具有显著性差异。请用Independent-Sample T Test来进行分析。数据参见附件。 建立SPSS文件 将两个学校重点班学生的数学中考成绩分别输入建立SPSS文件。 Independent-Sample T Test的操作步骤。 依次点击Analysis/Compare Means / Independent-Samples T Test, 打开独立样本t检验的对话窗口。 将成绩变量输入Test Variable中。 将学校变量移入Grouping Variable框中。单击Define Group按钮,在Group后面的参数框中分别键入两组的分类变量值1和2.点击Continue按钮。 点击OK,执行操作。 输出的结果及解释 独立样本t检验的结果输出包括两个独立样本的基本表述统计量和t检验结果,见下表。 表1的输出结果从左到右依次为两个样本的人数、均值、标准差和标准误。 表1 Group Statistics 学校 成绩 8 0 2N 3Mean Mean 表2输出的结果包括方差齐性检验结果和t 检验结果。方差齐性包括两个假设:假设方差是齐的以及假设方差是不齐的。如果方差齐性检验的结果是不显著的,选择Equal Variances Assumed,报告上面一行的t检验结果:如果方差齐性检验的结果是显著的,选择Equal Variances not Assumed,报告上面的一行的t检验结果。 表2 Independent Samples Test Levenes Testt-test for Equality of Means 95% Confidence Interval of the Mean SF ig. t f dig Std. Error Lower Upper Difference SDifferencDifference e Equa绩l .-6 5534 .- - 593 445 .626 variances assumed Equal variances not assumed -5.- - .630 531 结果的报告 两个学校重点班数学中考成绩的t检验的结果显示,方差齐性检验显著,即两组的方差不齐。两校重点班数学中考成绩不存在显著性差异。 Paried-Samples T Test的操作程序 依次点击Analysis/Compare Means / Paired-Samples T Test, 打开配对样本t检验的对话窗口。 选择配对变量。从左侧变量列表中选定两个要进行检验的变量,此时,Current Selections栏下Variable 1和Variable 2后面会显示选定的两个变量,然后单击向右箭头按钮,将配对变量移入Paired Variables框中。如果有多组配对变量,则重复上述操作。 臵信区间和缺失值处理采用系统默认值。 点击OK,执行操作。 Paried-Samples T Test应用举例 某高校数学与统计学院期末考试成绩出来后,学院教务人员想知道复变函数论和实变函数论两门课之间是否具有显著性差异。请分析。 建立SPSS文件。 Paried-Samples T Test的操作步骤 依次点击Analysis/Compare Means / Paired-Samples T Test, 打开配对样本t检验的对话窗口。 从左侧变量列表中选定复变函数和实变函数两个变量并将它们移入Paried-Samples T Test框中。 点击OK,执行操作。 输出的结果及解释 配对样本t检验的输出结果包括配对样本的基本描述统计结果、配对样本的相关系数表和t检验结果。 表1输出结果从左至右依次是复变函数与实变函数考试成绩的平均值、人数、标准差、标准误。 表1 Paired Samples StatisticsMean Std. Std. N Deviation Error Mean 150 150 .99817 .88063 P复79.air 1 变函数 6400 实78.变函数 2267 表2输出结果从左至右依次为配对样本的人数、相关系数和显著水平。 表2 Paired Samples Correlations N Pair 1 复变函数 & 实变函数 150 Correlation .583 Sig. .000 表3输出的结果从左至右依次为两个配对样本平均数差值的均值、差值的标准差、差值的标准误、差值均值的95%臵信区间,以及t值、自度、双尾检验的p值。 表3 Paired Samples Test Mean Paired Differences SStd. td. 95% Confidence dSig. Deviation Error Interval of the t f (2-tailed) Mean Difference Lower Upper .-.air 变41333 1 函数 - 实变函数 86400 29395 12062 .636 49 结果的报告 对学生期末考试“复变函数”和“实变函数”成绩进行配对样本t检验的结果表明两门课的考试成绩没有显著性差异。 上一页 1 2 3 4 下一页 专题讲座 第二章 方差分析 一、单因素完全随机化设计 方差分析是英国统计学家Fisher在二十世纪20年代创立的,是他进行许多田间试验时发明的统计方法,之后这个方法被用于其他的领域,尤其是工业试验数据的分析中。注:方差分析处理的数据是经过一定的“设计”得到的试验数据。 下面我们先来介绍方差分析的一种单因素完全随机化设计。下面我们通过一个例子来加以说明。 假定某个农业地区原来不曾种植小麦,现在打算种植这种作物,各地已有过一些优良品种,但因本地区并无种植小麦的经验,不知道哪一个品种最适合本地区。为此进行一个田间试验,取一大块地将其分成形状大小都相同的小块。设供选择的品种有个。我们打算其中的小块种植品种1,小块种植品种2,等等,。的选取并无严格限制。分配数目定了,接着就要定出哪些小块分给哪些品种。对此,可以用随机化的方法来定。做法如下:取张纸片,上面分别写上数字1,2,,。把它混乱放入一个盒子里,然后一张一张地依次抽出来。最先抽出的个号码给品种1,其次抽出的个号码给品种2,以此类推当然,事先已把上述小块地充1到标了号。这个例子就是一个典型的单因素完全随机化设计。 所谓单因素完全随机化设计是指具有下面两个特点的实验设计: 第一,重复:即上述都大于1:每个品种至少种植在两块土地上。 第二,随机化:哪些小块土地分配于哪些品种完全凭随机,这种设计称为“完全随机化”。 在本例中,影响感兴趣的指标亩产量的因素只有一个,即种子品种。种子品种有个。每一个具体的品种,都称为品种这个因素的一个“水平”,故品种这个因素一共有个水平。本试验称为单因素水平的试验。称为水平的“重复度”。 二、单因素完全随机化试验的方差分析 设问题中涉及一个因素,有个水平,如上例的个种子品种。以记第个水平的第个观察值。如上例,是种植品种的第小块地上的亩产量, 是品种的平均亩产量。关心的问题是是否相同。如果相同,说明种子的品种对指标亩产量无影响;如果不同,说明种子的品种对指标亩产量有影响。检验问题是 令愈大,表示之间的差异愈大。可分解为两部分,一部分表示随机误差的影响,记为均值,;一部分表示因素的各水平理论,其中 的不同带来的影响,记为 在统计学上通常把上文的的平方和”,称为“总平方和”,称为“因素就称为“误差平方和”。而分解式称为“方差分析”。 当比值大时,否定;当比值小时,接受。在正态分布条件下,当成立时,服从自度为k-1和n-k的F分布,即其中样本数据可以算出下,计算p: p=P项目 自度 比 显著性 *,*,或不显著 误差 总和 若p值小于,用“*”表示;若p值介于和之间,用“*”表示; 若p值大于,表示因素的效应“不显著”。 例1:设上述品种试验中,包含有个品种,分别重复4、5和3次,数据为 品种1:390 ,410 ,372 ,385 。 品种2:375 ,348 ,354 ,364 ,362 。 品种3:413 ,383 ,408 。 全部12个数的算术平均为,总平方和为 其自度为。3个品种各自数据的算术平均,分别为,和,因此算出误差平方和为其自度为。品种平方和其自度为 因素的比为查表得 , 。 。于是有 , 可算出,因 > ,故品种效应是高度显著的。以上计算结果列成方差分析表如下: 自显比 9.著性 * 项目 品种 度 2 .68 误差 总和1 9 40 1187. 检验的结果表明:不同品种的产量之间的差异,在统计上高度显著。 三、两因素完全试验的方差分析 一般情况下,在一个试验中要考虑好几个对指标可能有影响的因素。例如在一项工业试验中,影响产品质量指标的因素可能有反应温度、反应压力、反应时间和某种催化剂的添加量。若反应温度有个不同的可能选择,其他三个因素分别有,和种不同的选择,则可供选择的试验组合一共有个试验也就称为一个种,而这试验。如果每一可能的组合都做一次试验,则试验称为是“完全”的。若只对一部分组合作试验,则称为“部分实施”。在实际应用中部分实践很常见,因为完全试验往往规模太大,为条件所不允许,且有时并无必要。要作部分实施,就有一个如何去选择那些实际进行试验的组合的问题。 为书写简便,这里讨论两因素完全试验的情况。设有两因素,分别有,个水平。的水平与的水平的组合记为,其试验结果记为, ,。表示的水平带来的产量影响,故称为因素的水平的效应,有类似的解释。令 总平方和SS为 其中,和分别表示因素和随机误差的影响。 检验问题是:成立表示因素对指标其实无影响; 成立表示因素B对指标其实无影响. 同理可得两因素完全试验的方差分析表。 两因素完全试验的方差分析表 项目 自度 比 显著性 “ *”,“*”或不显著 误 差 总 和 若p值小于,用“*”表示;若p值介于和之间,用“*”表示; 若p值大于,表示因素的效应“不显著”。 例2:在一个农业试验中,考虑4种不同的种子品种和)。试验数据为: 品种 施肥方法 1 2 2 0 3 0 4 0 1 2 329316 32531318 31732318 31037365 330 算出, , , 两因素完全试验的方差分析表 项目 自显比 著性 度 382误差 总和 1 16 2 3* 结论:只有品种因素达到了显著性,而施肥方法这个因素未达到显著性。 四、多因素正交表设计及方差分析 若一个试验中涉及4个因素分别有和各水平,在次试验,效应叠加的假定下,全面试验需要做在实际中往往很困难。若因素数目更多,则所需试验次数根本无法做到。因此,在实际中往往只做部分实施,在这里,只介绍一种叫做“正交表”的工具。 行号 列号 1 2 3 4 5 6 7 8 1 1 2 2 3 3 4 4 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 1 2 2 1 1 2 2 1 1 2 2 1 2 1 1 2 134 220 188 242 268 290 338 320 A B C D 1 2 正交表 3 4 5 试验结果 这个表一共有8行、5列。8表示如用这个表安排试验,则必须做8次试验,不能多也不能少。5表示最多能安排5个因素,不能多,可以少。 是正交表记号;表示表有 8行;表示:表中有1列含有数字1,2,3, 4,有4列含数字1,2。其所以称为正交表,是因为这表满足两个条件: 第一,每列中含有不同数字的个数一样。例如,第1列含不同数字1,2,3,4,每种2个,第25列都是含不同数字1,2,每种4个。 第二,任一列中同一数字那些位臵,在其他列中被该列所有不同数字占据,且个数相同。例如,第3列中数字1占据1,3,6,8行的位臵,而在第1列中,这4个位臵恰被该列不同数字1,2,3,4各占据1次。在第5列中。这4个位臵则被该列不同数字1,2各占据2次。 凡是满足这两个条件的表就叫做正交表。至于如何去构造出这种表,那涉及许多深刻的问题。实际上,专家们把已造出的有是用价值的正交表汇集起来附于种种统计学著作中,实用者按需要取用即可。 下面谈谈什么是正交表试验: 其一,因素的水平只能是4或2,为4的至多只能有1个,为2的至多4个。 其二, 若试验要分区组,则区组大小只能为2或4. 其三,设试验中涉及4种配方,2种温度,2种压力,并分两个区组。则配方这因子A必须标在第1列的头上,B、C和区组都是2水平,可在25列中任选3列标上,还有一个空白列。设选定表的14列,则设计的意义如下:每一行读A,B,C所在的三列。例如,第一行为。这表示第1号试验是:A,B,C都处在1水平,B,C都处在2水平,第七行为。表示A处在4水平,B1水平,C2水平,等等。区组划分则看到D这一列。同一数字属于一个区组。在这里,D列的数字1在1,4,5,8行,故第1,4,5,8号试验划在一个区组内,剩下的第2,3,6,7号试验划在一个区组内。 在任何一个正交表中,某因素水平i的效应的估计,等于该因素水平i的所有观察值的算术平均,减去全部观察值的算术平均。如A有个水平,其各水平的效应的估计记为,总试验次数为n,则误差平方和可以总平方和得。 减出各因素的平方和求例3 对上表做分析 解:首先算出全部试验值的算术平均及总平方和 其次,估计各因素A,B,C各水平的效应及区组效应:=-73 , 再次,算出各效应及区组平方和:误差平方和为, , , ,; , , ,; , 方差分析表项目 自度 A 72 B 2 C 2 D误差总和 32 648 8 2 3 .7 1 2592 显比 著性 1136.* 324 * 1 2312 289 * 1 1 7 648 8 81 结论:配方这个因素的效应达到高度显著,温度和压力这两个因素则达到显著,区组效应未达到显著。 上一页 1 2 3 4 下一页 专题讲座 第二章 方差分析 五、利用SPSS进行方差分析的实例操作 SPSS中方差分析功能项介绍 点击Analysis/Compare Means下面有个One-way ANOVA,这是单因素方差分析。 点击Analysis/General Linear Model下有Univariate为多因素方差分析,Multivariate为多元方差分析,Repeated Measures为重复测量方差分析,Variance Components为方差成分分析。 One-way ANOVA的操作选项 建立或打开数据文件 点击Analysis/Compare Means/One-way ANOVA,打开One-way ANOVA主对话窗口。 Dependent List为因变量框。选定因变量,点击向右箭头图标,将选定的因变量移入Dependent List中。 Factor为因素变量框。选定因素变量移入Factor框中。 Contrasts主要用于事先比较分析,即在方差分析之前或不对数据做方差分析时,对控制变量个水平上的观测变量的差异进行对比检验。 点击Contrasts键,打开对话窗口。 Polynomial复选项:趋势成分分析,即将组间偏差平方和分解为线性、二次、三次或更高次的趋势成分。操作如下:选中Polynomial,激活右边的Degree参数框点击Degree参数专心-专注-专业