基于多层次模糊分析综合评价法的课堂教学评价数学模型.doc
基于多层次模糊分析综合评价法的课堂教学评价数学模型摘要:本文将采取多层次模糊综合评价法对课堂教学进行量化的评价,并给出评价等级。它首先通过参考信息工程大学的本科人才培养目标,教师队伍发展的指导思想,结合现实的教学情况,制定了一套完整的评价指标体系,并且将反应课堂质量的因素按照层次分类并对其重要性进行量化,得到一系列各层次的权值矩阵。通过对学员问卷调查最终得到了模糊判断矩阵计算出数字化的模糊关系矩阵,通过多层的复合运算, 最终确定评价对象所属等级。文中将看到此模型在制定评价指标体系中的权值分配反应的我校教学转型思想和“三基四能”培养目标,通过构建四项评价机制“教员互评”、“教员自评”、“学员评价”、“专家评价”比较完整地科学地评价了一门课程,并能经改进后能够做到跟踪调查,反馈意见,据此模型给出我们对我校我院的教学方式的一些意见。本模型经过些许修改可以适用于任何一种评价模型。基于多层次模糊分析综合评价法的课堂教学评价数学模型问题的提出以及分析课堂的教学质量评价,是我院全面提高教学质量,调节教学行为,优化教师队伍结构 , 促进教学水平提高,使师资队伍的管理系统化、科学化的一项有效措施。近几年,我校大力推进教育转型,深化编制体制改革,对课堂教学质量提出了更高的要求。课堂教学评估是一项实践性很强的工作,需要一定的科学理论为依据,方法为基础。本文将结合我校教育转型和“三基四能”人才培育方案,通过建立教师教学质量评估体系的层次结构图 ,构建模糊一致判断矩阵并计算出各指标权重,通过对不同的全体(学员、教员、专家)问卷调查的统计分析,分别得到模糊判断矩阵,算出在不同全体的评价分值,在对各评价分值通过加权计算得到该课堂的最终结果。 (一)模型假设、层次构建以及符号定义一、模型假设(1)在对课堂模型评价过程中,教员自评能够诚实守信、以人格为重,对自己教学的长处和不足给出客观的评价,教师互评中教员没有互相考虑,互相照顾。(2)学生评价在课程考试之前进行,由专家安排人员组织学员认真填写测评表,学员能够自主地按照自己的意愿实事求是地给出自己的评价。(3)所有的问卷调查表都能够回收,没有出现丢失和篡改现象。(4)专家评价由专家评价小组施行,专家评价小组依据平时的听课、召开学生座谈会、检查学生作业、学生试卷、教师教案以及查看教学报告等情况进行评价。(5)出现以下情况者直接定义为不合格:1、多次出现教学事故2、参与测评的学生有半数对其教学效果的综评价为不合格者直接判断为不合格。二、课堂教学评价层次。课堂质量绝对不能仅仅只从期末成绩的好坏来判断,从我校教学转型的方向和本科培养应用型人才的目标来看,一个良好的课堂应该包括教学目标的科学准确、德育渗透,教学内容重点突出、层次清晰、延拓性强,教学方法注重启迪、手段多样、体现互动,教学素质过硬可靠、熟练规范,教学效果气氛活跃、落实目标。同时在军校本科教学中,答疑这一方面是地方大学、军校研究生阶段所没有的,所以课堂评价中应该还要包括教员答疑的出勤率、以及答疑效果。我们的课堂教学模型的评价的功能应从注重甄别与选拔转向激励、反馈与调整;评价内容应从过分注重学业成绩转向注重多方面发展的潜能;评价主体应从单一转向多元,即由学员、教员自己、教员同事、专家一起参与评价。所以,我们构建了如下的层次模型: 三、符号体系的建立以及相关公式。根据以上的层次模型我们定义如下的符号体系以及与算法有关的相关公式:1、在一级评价指标(对应第二层次)中,设因素教员自评、教员互评、专家测评、学员评价分别为A1,A2,A3,A4,得到一级指标因素的集合为:A= A1,A2,A3,A4。2、在二级评价指标(对应第三层次)中,设因素教学目标、教学内容、教学方法、教学素质、教学效果、答疑分别B1,B2,B3,B4,B5,B6,得到二级指标因素的集合为B= B1,B2,B3,B4,B5,B6。3、在三级评价指标(对应第四层次)中,设隶属二级指标Bi(i=1,2,3,4,5,6)的三级指标为结合Ci1,Ci2,Ci3,Ci4,Ci5,记为Ci Ci1,Ci2,Ci3,Ci4,Ci5,很明显,隶属于二级指标Bi(i=1,2,3,4,5,6)的三级指标集合Ci包含的元素有没有达到六项的,在此我们做如下处理:对缺项的集合Ci的缺项直接省略,如C1记作为 C11,C12,对应教学准确,符合实际。4、对于评价等级我们定义为四级:优秀(90-100)、良好(80-90)、及格(60-80)、不及格(060)。分别记为V1,V2,V3,V4,我们建立评价集合V V1,V2,V3,V4。5、定义评价指标体系的权重。在我们的模型中,权重至关重要,直接影响综合评价的结果,这里我们权重的求法构造成对比较矩阵确定。假设有某一集合A= A1,A2,A3,A4,A5,A6(此处随便举一例,不同于一级指标因素集合)为例,我们建立如下的模糊一致判断矩阵: 其中aij表示因素Ai与因素Aj具有模糊关系“Ai比Aj重要”的隶属度。尺度aij含 义1Ai与Aj的影响相同3Ai比Aj的影响稍强5Ai比Aj的影响强7Ai比Aj的影响明显的强9Ai比Aj的影响绝对的强2,4,6,8Ai与Aj的影响之比在上述两个相邻等级之间1,1/2,···,1/9Ai与Aj的影响之比为上面的互反数根据相关理论,我们可以求出最大特征根对应的特征向量W几位此集合的权值向量,在此文的计算中我们采取的Matlab软件进行求解。同时我们引入Saaty的层次分析法中对不一致性的定义及求取不一致矩阵的权向量的方法。Saaty将CI=(d-n)/(n-1)定义为一致性指标,其中,d表示A的最大特征根,n表示A的阶数。并引入随机一致性指标RI,其数值如下随机一致性指标RI的数值n1234567891011RI000.580.901.121.241.321.411.451.491.51对于n>=3的成对比较矩阵A,将它的一致性指标CI与同阶(指n相同)的随机一致性指标RI之比称为一致性比率CR,当CR=CI/RI<0.1时认为A的不一致程度在容许范围之内,可用其特征向量作为权向量。根据上述说明,我们可以得到一级因素指标向量集的权值向量为WA=WA1,WA2,WA3,WA4二级因素指标集的权值向量为WB=w1,w2,w3,w4,w5,w6,同理我们可以得到三级因素各指标集权值向量WB1=w11,w12。WB2=w21,w22,w23,w24。WB3=w31,w32,w33,w34,w35。 WB4=w31,w32,w33,w34 。WB5=w51,w52,w53,w54,w55。WB6=w61,w62。6、定义第四层次的综合判断矩阵Rjk(j=1,2,3,4,分别代表来自教员自评、教员互评、专家测评、学员评价的调查问卷构造的综合判断矩阵)。 根据我们从问卷调查收集的原始信息,经过Excel软件的处理得到了对课堂评价的6个三级指标集每一因素的优秀率、良好率、及格率以及不及格率。如下Rk(k=1,2,3,4,5,6):其中rk11 ,rk12, rk13 ,rk14分别表示对于隶属于二级指标因素BK的三级因素Ck1的优秀率、良好率、及格率以及不及格率7、定义第三层次的综合判断矩阵P。第三层次的每一因素的综合判断矩阵Pji=Rji*WBi(i=1,2,3,4,5,6)最终可以得到Pj=pj1,pj2,pj3,pj4,pj5,pj6T。(j=1,2,3,4,分别代表来自教员自评、教员互评、专家测评、学员评价的第四层次综合判断矩阵得到的第三层次的综合判断矩阵)8、我们的第二层次的综合判断矩阵S1,S2,S3,S4。对于第二层次的教员自评、教员互评、专家测评、学员评价我们都可以计算出它的综合判断矩阵S1,S2,S3,S4。其计算方法为Sj=WB*Pj=w1,w2,w3,w4,w5,w6* p1,p2,p3,p4,p5,p6T9、评价等级以及分数对应表。等级优秀良好及格不及格分数段9010080-9060-8045-60代表分数95857053分数向量为Q=95,85,70,53T。10、计算第二层次分别来自教员自评、教员互评、专家测评、学员评价的分数Q1,Q2,Q3,Q4.Qi=Si*Q(i=1,2,3,4)11,最后的结果Result=Q1,Q2,Q3,Q4* WA=Q1,Q2,Q3,Q4* WA1,WA2,WA3,WA4。(二)算法分析和求解首先,我们对来自学生的问卷调查问卷进行处理,得到来自学生评价的分数值S4(1) 由收集过来的针对学生的问卷调查,对课堂层次模型的第四层次的22项指标进行等级测评,利用EXCEL对评测结果进行数据统计、分析。可以得到隶属于第三层次的5个模糊判断矩阵。供学生调查使用二级指标三级指标评价等级优秀良好合格不合格课堂教学质量评测教学目标科学准确 符合实际18373312德育渗透 自然得体21442114教学内容重点突出 滩点突破3055150层次清晰 把握联系2343340信息广泛 注重实践1940338容量恰当 学法指导2133424教学方法创设情景 激发兴趣2344321启发思维 培养能力2532394体现双主 师生互动4434220教学手段 恰当实用2346292面向全体 因材施教20412811教学素质教态自然 情绪饱满3343240语言准确 板书规范3541240组织调控 灵活有效19413010操作技术 熟练规范3433285教学效果兴趣浓厚 思维活跃23452210积极表达 大胆质疑3233450生动活泼 气氛热烈3443230能力方法 都有所得3647170教学目标 得到落实4136230答疑准时到场 出勤率高802000充分利用 答疑解惑762400对于二级指标教学目标因素,有如下统计:教学目标科学准确 符合实际0.180.370.330.12德育渗透 自然得体0.210.440.210.14据此可以得到如下的教学目标模糊判断矩阵R41(4表示基于学员的调查问卷数据): 同理,我们可以得到教学内容模糊判断矩阵R42、教学方法模糊判断矩阵R43、教学素质模糊判断矩阵R44、教学效果模糊判断矩阵R45、答疑模糊判断矩阵R46(2) 确定二级指标和三级指标的权重向量。以隶属与教学目标的两因素“科学准确,符合实际”和“德育渗透,自然得体”为例,我们首先建立它的成对对比矩阵: 根据上文所给公式可以计算得到权值向量WB1=0.5,0.5。我们依据军校课堂的特点以及我校教育转型的相关精神和“三基四能”人才培养方案(具体说明将在第五部分给出),给出相应的成对对比矩阵,并求出相应的权值向量如下:WB20.25,0.25,0.25,0.25,WB30.3,0.25,0.25,0.05,0.1,WB40.2,0.3,0.3,0.2,WB50.2,0.2,0.1,0.2,0.2,0.1,WB60.4,0.6,所有的成对向量矩阵都是满足一致性判断标准的,即CR0.1。对于二级指标,它的成对对比矩阵为判断矩阵为:计算可得CR =0.0783,满足一致性要求。同时权向量为WB=(0.0837,0.3121,0.1551,0.1128,0.2728,0.0635)对于一级指标,它的成对判断矩阵为:计算可得CR=0.0878,WA=(0.1215,0.1127,0.2928,0.4730)(3)计算二级指标的综合判断矩阵P.根据上文所给公式Pji=Rji*WBi,我们依次计算出: P41=0.1950 0.4050 0.2700 0.1300P42=0.2325 0.4275 0.3200 0.0200P43=0.2830 0.3695 0.3050 0.0305P44= 0.2960 0.3980 0.2660 0.0400P45=0.3205 0.4180 0.2565 0.0250P46=0.7760 0.2240 0 0最终得到二级指标的综合判断矩阵:(4)得到一级因素中的学生评价的综合判断矩阵S4=WB*P4,经过Matlab计算即为:S4=0.3029 0.3978 0.2698 0.0332(5)计算基于学生问卷数据的评价分数Q4。Q4=S4*Q,即为Q4=0.3029 0.3978 0.2698 0.0332* 95,85,70,53T=83.2341 (5)同理我们可以计算出来自教员自评、教员互评、专家评价的分数S1,S2,S3。以下给出来自专家组(假设专家组的人数为10人)的问卷调查表供专家组使用二级指标三级指标评价等级优秀良好合格不合格课堂教学质量评测教学目标科学准确 符合实际6410德育渗透 自然得体7300教学内容重点突出 滩点突破5410层次清晰 把握联系5320信息广泛 注重实践72 10容量恰当 学法指导8200教学方法创设情景 激发兴趣3430启发思维 培养能力5230体现双主 师生互动4420教学手段 恰当实用2620面向全体 因材施教7120教学素质教态自然 情绪饱满3340语言准确 板书规范5140组织调控 灵活有效3430操作技术 熟练规范5320教学效果兴趣浓厚 思维活跃3520积极表达 大胆质疑2350生动活泼 气氛热烈4330能力方法 都有所得6310教学目标 得到落实 5320答疑准时到场 出勤率高6220充分利用 答疑解惑7210采用同样的方法我们计算出S3=,同理我们继续分析问卷调查可以得到S1,S2.(6)计算最终评价结果:result=S1,S2,S3,S4*WA。 (三)关于模型中各权重的阐述对于不同对象,一堂课的好坏评价标准是不一样的,各标准所占权重也不同。因而我们加了第二层,以期从不同角度来考察课堂效果,使本模型更具科学性及合理性。在课堂教学中,学生与教师关系最密切,对教师教学行为的观察最直接,体会也最深切,因而“学生评价”在教学效果评价体系中占有最重要的地位,相对于其余三项的权值最大。同时,同一门课的教员在一起工作,工作上有相通之处,所以教员互评也可以作为一个评价量。另外,专家组的评价和教员自评也应该作为因素考虑进去。所以第二层就包括了学员评价、教员自评、教员互评、专家评价四项指标。其中学员自评和专家评价由于其本身客观性,可占较大权重。教员自评与互评可使教员在课堂教学评价体系中不至处于被动地位,保护了教员的积极性及自主性,使整个评价体系更完整科学。在第三层,除教学目标,教学内容,教学方法,教学素质,教学效果这几项常规评价课堂教学效果的准则外,我们又增加了答疑这一项。答疑课是军校教学的特色。地方大学的教师完成一天的教学工作后不会花大量的时间为学生进行专门的答疑辅导。而军校学员由于其自习时间的统一性,学校会安排教员进行额外的答疑课。因而答疑也应包括在评价指标内。(四)模型改进跟踪模型的构建为了长期对某教员的课堂教学进行跟踪评价,并给出该教员个性化的督导意见,我们需要对我们的指标体系和评价模型进行些许变化.在第二层次方面,我们将移去专家评价和教员互评。第一,专家组进行评价时,主要依据来自教员的教学报告和平时的课堂听课。而事实上,专家组的听课的次数和教员写的教学报告的数量都很少,如果进行跟踪调查的话,收集的原始数据不能很好的反应课堂教学在短时间内的变化,所以我们可以降低专家评价的权重,为了简化模型,我们不妨去掉这一指标。第二,同专家组类似,在教员互评方面,教员之间的互相印象在很长一段时间应该是较为固定的,如果进行长期的跟踪评价,来自教员评价的分数几乎是一样的,所以应该剔除。在第三层次方面,我们认为,对于一门课程来说,其教学目的在课程开始之初就已经确立了,所以在跟踪评价中教学目的可以剔除。在教学素质方面,我院聘请的教员的教学素质还是相当高的,并且其教学素质在长期内是稳定的,所以也可以剔除。同理答疑对提出督导意见意义也不大,可以剔除。同时,为了能够给给教员提出更好的意见,学员评价的地位应该突出,权值应该增加。个性化意见的主要方面集中在教学内容和教学方法上,所以我们重新建立层次模型,并且给出了相应的指标权值,按照上述方法就可以更加有效的进行跟踪评级了。(五)不足和改进之处我们通过多层次模糊分析法建立教师教学质量评估体系的结构图,通过对比较阵的一致性检验,给出各指标的权重,避免了人为的主观性决策。通过对来自问卷调查到的原始数据的统计分析、标准化处理, 给出了教师教学质量评估的最后得分。总的来说,此模型是能够科学地客观地评价课堂质量的,能够体现我校教育转型精神和“三基四能”人才培养方案的要求。不过我们的模型也存在一些问题:1. 数据量太少,缺乏科学性。可尝试让教员对不同队的学员讲同一堂课,进而得到问卷调查表,以扩大数据量。并采用长期调查的方式提高各评价系数的准确性。2. 未用计算机软件很好实现整个模型的求解过程,运算量大,运算复杂,对进一步推广该模型造成了限制。3. 量化规则虽采用了逐项比较,但仍太笼统,不够细化。并且有些指标不能用确切的数字概括,可用一个合适的范围来表示,但这必然会为之后的矩阵权向量计算增加难度。4. 可以再增加更多的评价指标提高模型的科学性。