《学生成绩评价及预测模型.docx》由会员分享,可在线阅读,更多相关《学生成绩评价及预测模型.docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学生成绩评价及预测模型学生成果评价及预料模型 摘要 学生学业成果的分析和评价, 是教学工作的重要环节, 也是学校常规管理的重要内容。科学地分析评价学生的学业成果, 不仅可以使老师精确驾驭学生的学习状况, 还可以使学生了解到自己的学习状况, 也能为教学管理、改进教学供应必要的依据分析。为了全面、客观、合理地评价学生的学习状况,本文通过在对基础数据进行统计分析的基础上,采纳聚类分析中的k-均值聚类分析法对612名学生的成果进行分类评价,建立了成果评价模型。首先,依据统计学学问,通过对附表所给的数据进行统计和整理,对612名学生的整体成果状况进行了具体分析说明。同时运用Excel软件画出学生成果波动
2、图、成果等级饼状分布图等,并对各图进行了相关分析和说明,最终得出学生总体成果分布属于负偏态分布,绝大多数学生成果分布在60-90分之间的结论。最终还运用非参数检验方法Kolmogorov-Smirnov检验、Shapiro- Wilk检验以及图示检验法(直方图、标准Q-Q图以及箱式检验图)对结论进行检验,运用SPSS软件进行绘图与计算,最终验证了学生成果分布为非正态分布,且为负偏态分布的结论是正确的。然后在数据分析的基础上上建立了基于快速聚类(k-均值聚类)分析的成果评价模型。在确定分类数为5类后,利用SPSS进行快速聚类分析计算,结果显示其聚类中心均值依次为:62.223755、89.029
3、319、54.237350、34.400759、14.932222,各类人数分别为231、286、84、8、3,分类结果科学合理。为了对612名学生后两个学期的学习状况进行预料,本文采纳灰色预料理论中基于时间序列的GM(1,1)一阶一元微分方程模型建立了成果预料模型,为了保证建模方法的可行性,先对数据列进行了必要的检验处理,并且通过残差检验和级比偏差值检验两种方法对灰色预料GM(1,1)模型进行检验,结果显示模型的预料结果能达到较高的要求。最终利用Matlab编程得出预料函数,计算每个学生第5、6学期的成果预料值以及前四个学期的拟合成果,并且运用Kolmogorov-Smirnov检验、Sha
4、piro- Wilk检验以及图示检验法对对第5、6学期成果预料值的正态性分布进行检验,得出学生成果的总体分布不听从正态分布,而是负偏态分布,与前四个学期的分析结果相吻合,因此可以判定预料结果是合理牢靠的,具有较高的可信度。本文还就学生的学习状况,对学校管理部门提出相关的建议。最终探讨了GM(1,1)模型的推广问题,通过添加平衡因子改进模型级比数列的计算方法,以及添加上限条件修改输出函数的方法改进了模型,使得模型具有更强的适应性和更广的适用范围。 关键字:成果预料 描述统计 k-均值聚类分析 灰色预料 GM(1,1) 负偏态分布 1. 问题重述 评价学生学习状况的目的是激励优秀学生努力学习取得更
5、好的成果,同时激励基础相对薄弱的学生树立信念,不断进步。 然而,现行的评价方式单纯的依据“肯定分数”评价学生的学习状况,忽视了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到激励作用。附件给出了612名学生连续四个学期的综合成果。1.请依据附件数据,对这些学生的整体状况进行分析说明; 2.请依据附件数据,建立数学模型,全面、客观、合理的评价这些学生的学习状况; 3.试依据你的模型,预料这些学生后两个学期的学习状况。4.依据你的模型分析,试给学校的管理部门写一篇短文,提出对学生学习状况评价的建议和改进方案。2. 模型的假设与符号说明 2.1 模型的假设 1.
6、假设每个学期的成果满分为100分; 2. 假设每位学生所处的学习考试环境相同; 3. 假设每位学生的学习实力基本保持不变; 4. 假设每次考试试卷的难度都是相同的。2.2 符号说明 表示第i个学生的初始成果数列 表示第i个学生一次累加成果数列 表示第i个学生第k个学期数列级比 表示第i个学生第k个学期数列均值 表示第i个学生的预料成果数列 表示第i个学生的预料的一次累加成果数列 表示第i个学生第k个学期的残差 表示第i个学生第k个学期的级比偏差 (注:其他符号在相关位置再作假设。) 3. 问题分析 3.1 背景分析 学生成果评价原则是指对学生成果评价活动的共同的、理性的相识。它是学生成果理论与
7、学生成果评价实践活动的纽带。学生成果评价理论从科学角度对学生成果的评价进行探讨,通常包括假设、概念、原理和原则等。学生成果评价实践是评价学生成果实践中所运用的原则、程序和方法。随着社会的发展,办学规模的不断扩大,教学质量的保证和提高的问题日益凸显,各种教学探讨和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,明显传统的评价方法忽视了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,建立一种科学的评价方法势在必行。3.2 问题一的分析:基本数据分析 依据统计学中描述统计方法,对这612名学生的整体成果状况进行具体分析
8、。其中包括每个学期整体成果的平均值、最大值、最小值、方差、标准差、差评率、优秀率等多项指标。通过对附表所给的数据进行统计整理并作出相应的波动图、直方图、饼状图等,可以更为直观地了解四个学期成果的分布状况。最终对学生的整体状况进行全面、客观、科学的分析说明。3.3 问题二的分析:成果评价模型的分析 传统方法中,对个体学生的成果进行评价的方法主要是基于基本的统计计算,比如均值、排序等。事实上,这些方法单从成果本上来讲基本能够反映学生的学习状况,但是其中也有许多局限性,比如排序评价,A学生与B学生的成果可能相差0.5分,但是经过排序后,就认为A学生比B学生优秀,这明显不是很合理。本文主要从实际动身,
9、以学生心理接受程度为依据,提出依据学习成果的实际分布状况进行分类的方法对学生学习状况进行评价。然而原委以什么标准进行分类呢?分成多少级好呢?分好的级别能够反映怎样的学习状况呢? 目前对于已知数据进行已知分类数或者未知分类数的方法有许多,常用的有聚类分析法。聚类分析是一种探究性的分析方法,在分类的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据动身,自动进行分类。聚类分析所运用方法的不同,经常会得到不同的结论。不同探讨者对于同一组数据进行聚类分析,所得到的聚类数未必一样。聚类分析中的k-均值聚类法,又叫迭代聚类法或者快速聚类法,可以事先给出分类数,聚类的结果也比较科学和合理,本文采纳该
10、方法作为成果评价模型的主要方法。采纳该方法进行聚类时,先给对象集一个粗糙的初始分类,然后用某种原则进行修改,直到分类比较合理为止。其详细步骤如下: 1原始数据的预处理:通过损失函数计算合理的分类数K 2将数据分成K个初始类,并计算各初始类的中心坐标 3通过合适的距离计算将数据重新分类,分类的原则是将样品划入离中心最近的类中,然后重新计算中心坐标 4重复步骤3,当聚类满意算法终止条件时停止计算 3.4 问题三的分析:成果预料模型的分析 现实中,预料问题有许多种求解模型,比如BP神经网络模型、一元线性回来模型、灰色预料模型等。对于问题三,已知一批学生的前四个学期的成果,预料其第五六学期的成果,特别
11、类似于灰箱过程。在灰色系统中,灰箱是已知部分数据,进而推想其他数据的一种模型。灰色预料是灰色系统的一个重要方面,它通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来找寻系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预料事物将来发展趋势的状况。灰色预料是指利用GM模型对系统行为特征的发展改变规律进行估计预料,同时也可以对行为特征的异样状况发生的时刻进行估计计算,以及对在特定时区内发生事务的将来时间分布状况做出探讨等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采纳的是灰色系统理论中的GM(1,1)
12、模型。3.4.1 灰色建模可行性检验:对原始数据进行预检验与预处理 为了保证建模方法的可行性,须要对已知数据列做必要的检验处理。设第i个学生第j个学期的成果为 计算数列的级比 假如全部的级比都落在可容覆盖,即(0.67032,1.39561)(在本文中,)范围内,则数列可以作为灰色模型GM(1,1)的数据进行灰色预料。否则,须要对数列做必要的变换处理,使其落入可容覆盖内。3.4.2 建立GM(1,1)灰色模型 对数列做一次累加生成1-AGO数列: 其中, 均值数列 则 于是可建立灰微分方程 转化为白化微分方程 记 则由最小二乘法,求得使 达到最小值的 (8) 于是可求解白化微分方程(7)得到预
13、料值为 (9) 且 3.4.3 预料值检验 3.4.3.1 残差检验 计算残差值 假如残差 则可认为预料结果达到一般要求; 假如残差 则可认为预料结果达到较高要求; 3.4.3.2 级比偏差值检验 计算级比偏差 假如级比偏差 则可认为预料结果达到一般要求; 假如级比偏差 则可认为预料结果达到较高要求; 利用Excel计算得到级比偏差检验数据(具体计算结果如表5(具体数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为0.0093441、-0.02402和0.0119905,表明绝大部分级比偏差值都满意 因此,可以说模型的预料结果能达到较高的要求。4. 模型的建立与求解 4.1
14、学生成果整体状况的总体分析 4.1.1 对学生成果的描述统计分析及结果说明 本文采纳统计学中描述统计的方法对学生总体成果的原始数据进行具体分析,得到了学生成果的基础数据,如表1所示: 表1 学生成果整体状况的描述统计 学期1成果 学期2成果 学期3成果 学期4成果 总数 612 612 612 612 均值 72.55 74.37 73.17 75.06 中值 74.32 76.64 74.19 76.54 众数 59.48* 78.33* 83.24 16.50* 标准差 9.50 10.60 9.01 10.24 方差 90.25 112.31 81.24 104.90 偏度 -1.24
15、-1.92 -1.94 -2.93 偏度的标准误 0.10 0.10 0.10 0.10 峰度 2.50 7.04 8.14 14.48 峰度的标准误 0.20 0.20 0.20 0.20 微小值 24.34 0.00 16.25 0.00 极大值 89.45 90.85 90.62 89.63 百分位数 25 67.94 69.44 68.89 70.95 50 74.32 76.64 74.19 76.54 75 79.41 81.85 79.20 81.55 (其中* 表示存在多个众数,显示最小的) 从描述统计结果可以知道,由于偏度值都为负值,因此可以推断学生每个学期的总体成果分布都属
16、于负偏态分布,即其波峰偏向于成果较高的右侧,说明学生的总体成果偏向于高分,且每个学期的偏度值的肯定值渐渐增大,因此偏态程度越来越严峻。峰度值为正值,且每个学期渐渐增大,说明高分层的学生数量渐渐增多。均值分数都在72-76分之间,可以推断学生的总体成果状况良好。极大值普遍保持在90分左右,说明高分层波动不大。为了更直观地观测成果分布状况,作出学生成果波动图: 图1 学生成果波动图 从图1可以清晰地看到,学生成果基本分布在七八非常之间。不过仅仅以此图进行分析说明过于笼统,因此为了更精确地刻画成果分布,本文依据现实状况,把学生成果根据如下评定方法划分为四个等级: I 90-100分 优 II 75-
17、90分 良 III 60-75分 中 IV 60分以下 差 据此可以做出成果等级饼状分布图: 图2 成果等级饼状分布图 从图2可以精确地知道,90%以上的学生成果都集中在良和中(即60-90分)两个等级之间,其中等级为良的人数占46%-57%,等级为中的人数占35%-48%,而差评的学生为数不多,在4%-10%之间。然而成果占优的学生比率特别低,且第一和第四学期一个都没有。详细数值如图3所示: 图3 成果等级分布柱状图 综合以上,可以总结出学生成果整体状况的分析说明: A. 学生总体成果分布属于负偏态分布; B. 学生总体成果良好; C. 绝大多数学生成果分布在60-90分之间; D. 90分
18、以上的学生数量甚少,每学期只有1-2个,有两个学期甚至一个都没有。E. 差评的学生为数不多,平均每学期只有43个,占总人数的6.9% 4.1.2 对结论的检验 首先,本文采纳非参数检验方法Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk检验(w检验)两种方法进行检验,运用SPSS计算得到表2,如下: 表2 正态性检验 学期 Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 学期1成果 0.079 612 0.000 0.926 612 0.000 学期2成果 0.098 612 0.000 0.869
19、 612 0.000 学期3成果 0.076 612 0.000 0.876 612 0.000 学期4成果 0.110 612 0.000 0.774 612 0.000 a. Lilliefors 显著水平修正 依据表2可知,D检验和W检验的显著性水平Sig.都微小,小于0.05,因此可以判定为非正态分布。然后,分别利用SPSS绘制直方图、Q-Q图以及箱式检验图对结果进行正态性检验,如图4、图5和图6(清楚效果图请查看附图1-附图12)所示: 图4 成果频次直方图 从图4 可以直观地看出,波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成果的总体分布并不听从正态分布,而是负偏态
20、分布。 图5 成果标准Q-Q检验图 从图5可以直观地看出,只有少部分数据集中在y=x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向y=x直线的左上方,因此可以推断负偏态分布的结论是正确的。 图6 成果箱式检验图 在图6的箱式检验图中,方框中的区域表示50%的数据所处的范围,方框的上线边界代表了四分位数间距,方框中间的粗线表示中位数,而方框以外的上下两条横线分别代表了极大值和微小值。假如观测数据听从正态分布,那么50%的数据应当落在纵轴中间位置。从图6可以明显地视察到,方框处于纵轴片上位置,因此可以判定学生成果分布为非正态分布,且为负偏态分布。 4.2 k-均值
21、聚类分析评价模型 4.2.1 确定分类数K 虽然从理论上说,分类的多少并不会对结果的合理性产生较大影响,但是会对结果的精确程度造成肯定程度的影响。因此,虽然k-均值聚类分析可以事先给定分类数目,但是为了使分类结果更为精确合理,本文依据统计学中损失函数的原理,利用Matlab编写了分类损失函数并画出图像(代码见附录二),通过视察图像来确定合理的分类数。分类损失函数图像如图7所示: 图7 分类损失函数图像 由于计算数值太多,因此图7显示的图像过于粗糙。由于左侧图像节点比较稀疏,而其他地方比较光滑稠密,因此选取左侧图像进行放大查看,如图8所示: 图8 放大后的损失函数图像 从图8可以看出,曲线在纵轴
22、4.4-5.2之间有少许拐点,因此,放大后分别对纵轴4.4-4.8以及纵轴4.8-5.2之间的图像进行再次放大,如图9所示: 图9 放大后的损失函数图像 从图9可以清晰地看到,大约在纵轴4.6和4.8处以及纵轴4.0和5.1处,图像有四个明显的拐点,因此分类数K取为4或者5都是合适的。由于图像上的观测数值稍偏向于5,因此本文选取K值为5,即分为5类进行聚类。4.2.2 利用SPSS进行快速聚类分析 以612名学生四个学期的成果数据为聚类变量,聚类数为5,迭代10次,运行SPSS进行聚类计算的结果如表3-表5所示,其中表6为最终的分类状况(由于篇幅有限,只列出部分数据,具体数据见附件17): 表
23、3 最终聚类中心 1 2 3 4 5 学期1成果 70.12173 79.43517 58.4838 57.21686 38.42292 学期2成果 72.8839 81.47749 57.86058 57.82471 18.32652 学期3成果 70.48539 79.39345 63.78376 46.91419 19.46546 学期4成果 72.61679 81.39656 67.13915 22.67073 21.21012 均值 71.5270 80.4257 61.8168 46.1566 24.3563 从聚类中心可以看出,五个类别的聚类中心均值分别为71.5270、80.4
24、257、61.8168、46.1566和24.3563。因此可以依据此结果把学生的状况分为5个类别,依次是:学习状况良好、学习状况很好、学习状况一般、学习状况牵强以及学习状况差。表4 每个聚类中的案例 聚类 总数 有效个数 缺失 1 231 231 0 2 286 286 0 3 84 84 0 4 8 8 0 5 3 3 0 总计 612 612 0 从表中数据可以看出,处于类别1(学习状况良好)和类别2(学习状况很好)的学生数量占了绝大部分比率,与负偏态分布的结论相吻合,说明分类具有合理性。表5 聚类成员(部分数据) 学生序号 学期1 学期2 学期3 学期4 均值 聚类 6 78.2750
25、 65.2946 76.0400 72.4900 73.0249 1 7 76.3250 75.4929 63.4350 66.5050 70.4395 1 9 69.1500 76.3571 71.0550 73.6400 72.5505 1 1 599 72.5833 77.1852 73.2632 76.4500 74.8704 1 601 81.4583 78.3333 68.9737 71.7000 75.1163 1 603 75.3958 76.4815 74.0263 75.3500 75.3134 1 607 74.5208 72.4815 75.2632 72.6000 7
26、3.7164 1 612 55.1875 73.2963 69.5000 73.7000 67.9209 1 均值 72.3594 74.3269 70.8687 72.9383 72.6233 聚类中心 70.1217 72.8839 70.4854 72.6168 71.5270 1 79.0000 74.8250 74.2900 76.9800 76.2738 2 2 75.6250 73.4036 80.5913 74.8450 76.1162 2 4 82.7500 83.2039 76.5066 80.8700 80.8326 2 5 76.1000 83.1161 77.5755
27、 83.2950 80.0216 2 2 610 80.6042 80.2222 81.4211 80.5500 80.6994 2 611 86.4792 87.2593 76.8158 86.4500 84.2511 2 均值 77.6142 80.5289 76.9848 81.1040 79.0580 聚类中心 79.4352 81.4775 79.3935 81.3966 80.4257 3 62.1203 59.2143 68.5019 68.8650 64.6754 3 18 53.5000 52.3714 63.2850 63.6150 58.1929 3 28 63.9000
28、 56.8786 60.1300 56.9900 59.4746 3 468 57.2653 59.2381 76.4000 79.3182 68.0554 3 3 500 54.8750 67.1852 64.9211 70.0000 64.2453 3 514 51.2083 56.3333 65.1842 66.3000 59.7565 3 543 42.4792 71.4074 69.8158 74.0976 64.4500 3 544 53.1250 73.0741 58.7895 74.1500 64.7846 3 均值 54.8091 61.9628 65.8784 69.167
29、0 62.9543 聚类中心 58.4838 57.8606 63.7838 67.1391 61.8168 8 60.9500 58.2321 55.9009 16.5000 47.8958 4 43 60.5000 47.2071 56.5050 16.5000 45.1780 4 62 59.4750 55.7143 57.0200 16.5000 47.1773 4 67 50.7000 44.0768 46.0321 36.8100 44.4047 4 273 49.6800 56.9464 38.2326 17.5946 40.6134 4 288 49.3673 63.9394
30、24.2963 0.0000 34.4008 4 557 68.6875 70.7407 64.9737 27.6279 58.0075 4 595 58.3750 65.7407 32.3529 49.8333 51.5755 4 均值 57.2169 57.8247 46.9142 22.6707 46.1566 聚类中心 57.2169 57.8247 46.9142 22.6707 46.1566 141 40.9500 28.6545 22.0526 19.4302 27.7719 5 222 24.3438 0.0000 16.2500 19.1351 14.9322 5 242
31、49.9750 26.3250 20.0938 25.0650 30.3647 5 均值 38.4229 18.3265 19.4655 21.2101 24.3563 聚类中心 38.4229 18.3265 19.4655 21.2101 24.3563 结论:大部分学生的学习状况良好,而少数学生的学习状况一般。值得留意的是,有11个学生处于危急的学习状况下,其中3个其四学期的平均分只有24.3563分,在百分制中属于极差的状况,须要引起高度重视。4.3 成果预料的灰色系统预料模型 灰色预料通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来找寻系统变动的规律
32、,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预料事物将来发展趋势的状况。灰色预料是指利用GM模型对系统行为特征的发展改变规律进行估计预料,同时也可以对行为特征的异样状况发生的时刻进行估计计算,以及对在特定时区内发生事务的将来时间分布状况做出探讨等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采纳的是灰色系统理论中的GM(1,1)模型。4.3.1 灰色建模可行性检验:对原始数据进行预检验与预处理 为了保证建模方法的可行性,须要对已知数据列做必要的检验处理。设第i个学生第j个学期的成果为 (1) 计算数列的级比 (2) 假如全部的级比都落在可
33、容覆盖,即(0.67032,1.39561)(在本文中,)范围内,则数列可以作为灰色模型GM(1,1)的数据进行灰色预料。否则,须要对数列做必要的变换处理,使其落入可容覆盖内。即取适当的常数C,作平移变换 则使数列的级比为 (3) 由于有两个成果为0的数据,因此在计算级比时,统一将其当作缺失值并做替换处理(用该学生成果非0的其他几门成果的均值代替),由于数据量极少,因此不影响整个模型的计算结果。之后运用Excel进行计算后得到每个学生的级比,并对其进行比较推断后证明全部数据均落在可容覆盖范围内(具体数据见附件6)。三个级比的均值依次为0.985193、024020066和0.988009465
34、。因此学生成果可以进行灰色模型GM(1,1)的数据进行灰色预料。4.3.2 建立GM(1,1)灰色模型 对数列做一次累加生成1-AGO数列: (4) 其中, 均值数列 则 (5) 于是可建立灰微分方程 (6) 转化为白化微分方程 (7) 记为 则由最小二乘法,求得使 达到最小值的 (8) 于是可求解白化微分方程(7)得到预料值为 (9) 且 其中的待求参数a和b则由公式(8)计算得到第i个学生待求参数和。将和代入方程(9),可得预料方程为 (10) 依据预料方程(10),写出Matlab代码(代码见附录一)即可计算每个学生第5、6学期的成果预料值。而当时,模型计算得出的是前四个学期的成果拟合值
35、。3.4.4 预料值检验 4.3.4.1 残差检验 计算残差值 假如残差 则可认为预料结果达到一般要求; 假如残差 则可认为预料结果达到较高要求; 利用Excel计算得到残差检验数据(具体计算结果如表4(具体数据见附件9)所示),前四个学期的残差均值为依次为3.87665E-15、0.007174、-0.02019和0.009094,表明绝大部分残差值都满意 因此,可以说模型的预料结果能达到较高的要求。表6 残差检验 序号 学期1 学期2 学期3 学期4 1 0 0.00727 -0.01438 0.006867 2 0 -0.02965 0.053528 -0.02854 3 6.8629E
36、-16 -0.0276 0.045447 -0.02037 4 0 0.021814 -0.04809 0.023116 5 -7.65631E-14 0.022604 -0.04838 0.022505 6 -1.0893E-15 -0.03859 0.063556 -0.03145 606 -2.45435E-15 0.040417 -0.0971 0.044616 607 8.9055E-14 -0.01253 0.024116 -0.01249 608 -1.28875E-15 0.012519 -0.02521 0.011835 609 0 0.021155 -0.04177 0.0
37、18548 610 7.93371E-15 -0.00431 0.008476 -0.00427 611 7.39473E-15 0.038155 -0.08711 0.038898 612 3.11574E-14 0.018233 -0.03835 0.01803 极大值 8.9055E-14 0.040417 0.063556 0.044616 微小值 -7.65631E-14 -0.03859 -0.0971 -0.03145 均值 3.87665E-15 0.007174 -0.02019 0.009094 4.3.4.2 级比偏差值检验 计算级比偏差 假如级比偏差 则可认为预料结果达
38、到一般要求; 假如级比偏差 则可认为预料结果达到较高要求; 利用Excel计算得到级比偏差检验数据(具体计算结果如表5(具体数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为0.0093441、-0.02402和0.0119905,表明绝大部分级比偏差值都满意 因此,可以说模型的预料结果能达到较高的要求。表7 级比偏差检验 学生序号 学期2 学期3 学期4 1 -0.063453 -0.007202 0.0349441 2 -0.035017 0.0891871 -0.076776 3 -0.088233 0.1355817 0.0052728 4 0.0128062 -0.
39、087539 0.0539557 5 0.0838972 -0.071422 0.0686659 607 -0.028557 0.0369637 -0.03668 608 -0.000503 -0.023485 0.0497997 609 0.0887206 -0.028807 0.0892973 610 -0.005779 0.0147259 -0.010813 611 0.011432 -0.135948 0.1114401 612 0.245978 -0.054619 0.0569878 极大值 0.5780174 0.7088546 0.5404 微小值 -2.235521 -1.63
40、1668 -2.455758 均值 0.0093441 -0.02402 0.0119905 3.4.5 成果预料结果 根Matlab的计算结果得到前四个学期的拟和成果和第五六学期的预料成果,如表6(具体数据见附件7)所示,这里只列出部分数据: 表8 前四个学期的拟和成果以及后两个学期的预料成果 序号 学期1 学期2 学期3 学期4 学期5 学期6 1 79 74.28105 75.35839 76.451 77.5559 78.6851 2 75.625 75.57985 76.27738 76.981 77.6906 78.4088 3 62.12031 60.84837 65.38867
41、 70.267 75.4345 81.1452 4 82.75 81.38893 80.18587 79.000 77.8277 76.6823 5 76.1 81.23729 81.3288 81.420 81.5121 81.6040 606 75.271 82.52417 80.40565 78.341 76.3127 74.3709 607 74.521 73.38923 73.44798 73.506 73.5656 73.6245 608 77.188 76.73123 77.83489 78.954 80.0856 81.2420 609 69.875 76.3499 78.98
42、251 81.705 84.4955 87.4376 610 80.604 80.56773 80.73086 80.894 81.0580 81.2223 611 86.479 83.92966 83.50739 83.087 82.6685 82.2533 612 55.188 71.95959 72.16508 72.371 72.5777 72.7851 极大值 89.45 89.7217649 88.88720 88.573 121.4161203 184.4182048 微小值 24.34375 18.8431815 18.42744 18.020 12.46689697 7.50
43、5105619 均值 72.55267 73.9235764 74.13855 74.616 75.36097283 76.39383968 其中后两个学期的极大值出现异样,为了精确地找出异样值,以第五学期为主要关键字,第六学期为次要关键字对预料结果进行排序,结果如表7所示: 表9 对第五六学期预料成果排序后的结果 学生序号 学期1 学期2 学期3 学期4 学期5 学期6 273 49.6800 57.1430 34.4002 20.7090 12.4669 7.5051 141 40.9500 28.1524 22.9959 18.7838 15.3433 12.5329 222 24.34
44、38 18.8432 18.4274 18.0209 17.6233 17.2345 575 82.4790 77.5616 81.9690 86.6268 91.5493 96.7515 319 76.6730 75.2519 80.3982 85.8965 91.7708 98.0469 282 71.4490 66.2493 74.1560 83.0063 92.9128 104.0017 468 57.2650 62.1179 71.1230 81.4337 93.2390 106.7558 301 56.5100 44.7196 58.1344 75.5733 98.2434 127
45、.7141 348 40.0000 31.9959 46.8560 68.6178 100.4867 147.1567 387 36.6040 40.9471 55.2672 74.5953 100.6828 135.8937 346 54.9800 44.5643 58.7419 77.4298 102.0631 134.5331 307 52.3510 34.6493 52.6286 79.9372 121.4161 184.4182 从表7可以便利地看到,第五学期348、387、346、307号学生以及第六学期282、468、301、348、387、346、307这几位同学的成果超出了1
46、00分,且307同学第六学期的分数值超过了180分。出现此问题主要是因为级比值过低,即成果逐学期递增的趋势偏大,其级比均值为0.84742371,而其他学生的级比均值为0.997654299,两者相差0.150230589,导致在预料的时候超出100分。模型在计算的时候并未就预料值做范围限制,且100分制的成果模式属于现实世界中的人为规定,并不能为灰色预料模型所识别,因此也没有必要对此做限制。3.4.6 成果预料结果检验 4.3.6.1 对预料成果的正态性检验如下: 表10 正态性检验 学期 Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df
47、 Sig. 学期1成果 0.079 612 0.000 0.926 612 0.000 学期2成果 0.093 612 0.000 0.905 612 0.000 学期3成果 0.079 612 0.000 0.882 612 0.000 学期4成果 0.099 612 0.000 0.823 612 0.000 学期5成果 0.111 612 0.000 0.849 612 0.000 学期6成果 0.103 612 0.000 0.862 612 0.000 依据表7可知,D检验和w检验的显著性水平Sig.都微小,小于0.05,因此可以判定为非正态分布。 4.3.6.2 图示法检验 运用直方图、标准Q-Q检验图和箱式检验图(清楚图片见附图13-附图18)对预料成果进行检验如下: 图10 预料成果频次直方图 从图7 可以直观地看出,在100分以内的成果分布中,两个学期的波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成果的总体分布并不听从正态分布,而是负偏态分布。 而学期六的波峰干脆看起来略微偏向于左侧,这是因为GM预料模型的预料值有极少量数据偏大,在作图时并未剔除这几个数据。假如细致视察图7中的右图可以发觉,成果大于100
限制150内