改进的混合遗传算法的组卷系统模型及算法.pdf
《改进的混合遗传算法的组卷系统模型及算法.pdf》由会员分享,可在线阅读,更多相关《改进的混合遗传算法的组卷系统模型及算法.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、?第 27卷 第 1期2009年 2月?贵州师范大学学报(自然科学版)JournalofGuizhou Nor malUniversity(Natural Sciences)?Vo.l 27.No.1Feb.2009文章编号:1004?5570(2009)01-0085-05改进的混合遗传算法的组卷系统模型及算法*罗?佳,张仁津*,张贵明(贵州师范大学 数学与计算机科学学院,贵州 贵阳?550001)摘要:在基本遗传算法基础之上,针对试题库组卷系统对算法进行改进,设计了一种运用于组卷系统的数学模型和混合遗传算法,从而提高组卷质量和系统的通用性。关键词:遗传算法;组卷系统;混合遗传算法;算法;模
2、型中图分类号:TP301.6?文献标识码:AResearch ofmodel and algorithms of test paper generationsystem of i mproved hybrid genetic algorithmsLUO Jia,ZHANG Ren-jin,ZHANG Gu-im i ng(School ofM athematics and Co mputer Science,GuizhouNormalUniversity,Guiyang,Guizhou 550001,China)Abstract:This article i mproved algorithm
3、s of test paper generation syste m on the basis of basic geneticalgorithms,and designed one kind of model of mathematics and hybrid genetic algorith m s applied ingeneration system of test paper.It can i mprove the quality of test paper and the versatility of systemconsequently.Key words:genetic alg
4、orithms;generation system of test paper;hybrid genetic algorith m s;algo-rithm s;model0?引言遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。它非常适合解决多目标优化的群体搜索问题,具有简单、鲁棒性强、全局寻优等特点。组卷是从题库中抽取出满足用户要求的试题生成试卷,要求试卷在知识点、题型、难度等方面达到用户需求。而试卷各约束条件之间又是相互制约的,即组卷是一种多目标优化问题,因此用遗传算法实现组卷可取得良好的效果。用遗传算法进行组卷已不是一种新兴的技术,实际上一些学者已经
5、开发出基于遗传算法的组卷系统。这些系统普遍能在可接受的时间内成功生成具有一定质量的试卷。这些系统的实现为后人的研究奠定了基础,研究者功不可没,但笔者认为很多系统仍有一定缺陷。如文献 1中,作者提出的适应度函数公式 f=10?c+?t+50?q+40?r+85*收稿日期:2008-09-25基金项目:贵州师范大学学生科研基金资助。作者简介:罗?佳(1978-),女,贵州省贵阳市人,讲师,在读研究生,研究方向:计算机辅助教育、人机交互和智能计算等。*通讯作者:张仁津(1963-),男,教授,研究方向:计算机辅助教育,软件理论与应用等。0.25?ni=1Ei,其中的系数是在实验中获得。这类系统对试题
6、库的依赖性较大,若题量及难度等属性值分布改变,组卷效果不一定理想。又如文献 2中作者将试题属性设为题型、考查点、难度系数和题分,笔者认为较少的试题属性对提高组卷速度较有利,但试题属性太少又不能全面反映试题质量,从而影响组卷的客观性、科学性及试卷质量。为此,笔者考虑从增强系统通用性及生成试卷质量两方面建立组卷系统模型,以此来改进基于遗传算法的组卷系统。1?基本遗传算法(SGA)SGA首先生成一定规模的初始种群,接着个体以一定的概率进行交叉、变异,实现个体结构重组,再按预设的评价函数选择复制优秀个体组成新一代种群,循环该过程,直到找到满足条件的最优解。其算法如下:(1)群体编码;(2)生成初始群体
7、;(3)群体中个体适应度设计及计算;(4)对个体进行选择、交叉和变异操作;(5)计算新个体的适应度值;(6)判断是否满足退出循环的条件,若找到满足条件的解或达到最大循环次数则结束循环;否则转向(4)继续循环。因此基本遗传算法可定义为一个 8元组:SGA=(C,E,P0,M,?,?,?,T)其中 C为个体的编码方法;E 为个体适应度评价函数;P0为初始群体;M 为群体大小;?为选择算子;?为交叉算子;?为变异算子;T 为算法终止条件。2?组卷问题的数学模型已开发出的众多遗传算法组卷系统不具备通用性是因为,对遗传算法控制参数的选择目前还没有合理的理论依据,在遗传算法的实际应用中,需要经多次试算才能
8、确定这些参数合理的取值大小或取值范围,而开发者又是基于特定数据库进行测试获得控制参数值,因而不具备通用性。为了使系统具有一定的通用性,即组卷不依赖于特定题库,这就要求控制参数值和数据库中各种题型题量、试题属性值无太大关系。这也需要反复实验来确定控制参数取值大小,所不同的是,本系统的数据库构造要求试题具备一定规模和完备性(即题型、题量、各题型试题属性分布在一定范围内),且用户输入的约束条件与题库中试题满足一定比例,就可生成科学合理的试卷。为了生成高质量试卷,题库中的试题属性应尽可能包含影响组卷质量的属性。在此,我们给定以下的约束条件,包括:分值、知识点、难度、区分度、曝光度、最后一次抽题时间、答
9、题时间。这 7项属性就决定了一套试卷的属性分别用 a1 a7表示,若一套试卷有 m 道试题,则决定一份试卷的指标可用一个 m?7的矩阵表示如下:S=a11?a12?a17a21?a22?a27?am 1?am 2?am7这是问题求解的目标状态矩阵,该矩阵应满足如下约束条件:(1)试卷总分 sjzf=?TXi=1ti,应尽可能满足用户给定的试卷分数约束,其中 ti表示第 i种题型的实际分值,TX 表示试卷中的题型数;(2)试卷知识点 sjzsd=?ZSDi=1ai,其中 ai表示试卷中包含的第 i个知识点的实际分值,ZSD为试卷知识点的总数;(3)试卷难度 sjnd=1-?mi=1(1-ai3)
10、?ai1)/?mi=1ai1,应尽可能满足用户给定的试卷难度值。在此,试卷难度分成 5 个级别:容易(0 0?2),较容易(0.2 0.4),中等(0.4 0.6),较难(0?6 0.8)和难(0.8 1.0);(4)试 卷 区 分 度sjqfd=?mi=1(ai4?ai1)/?mi-1ai1,应尽可能满足用户给定的试卷区分度值。试题区分度一般是由该题的成绩与整个测验成绩之间的相关程度来表示。相关度高,表明区分度高;相关度低,表明区分度低。经过大量的研究,伊贝尔的分组法区分度指标提出了一种评价标准:区分度在 0.4以上的,评价最高,在 0.30 0.39为较好;在 0.20 0.29为尚可,使
11、用时需作改进;在86?贵州师范大学学报(自然科学版)?第 27卷?0.19以下的为劣,需要淘汰或加以修改。因此把区分度分成 3个级别:0.20 0.29、0.30 0.39和0.4以上。(5)试卷曝光度 sjbgd=?mi=1ai5/m,应尽可能小。曝光度用整数表示,试题库中试题曝光度初始值为 0,组卷选中的试题曝光度增 1,系统预设一最大曝光度值,当试题曝光度值达预设值时,曝光度值不再增加。(6)试卷中试题最后一次抽题时间 sjctsj=?mi=1ai6/m,该值应尽可能小。最后一次抽题时间用整数表示,试题库中试题的最后一次抽题时间初始值全为MT(预设的最大值),每生成一次试卷,被抽取的试题
12、该属性值被置为 0,其它未被抽取的试题该属性值通通增 1。若某试题该值已为 MT,则该题对应的曝光度值被置为 0。(7)答题时间 sjdtsj=?mi=1ai7,应尽可能满足用户给定的试卷答题时间约束。3?组卷问题的数学求解?遗传算法改进思想3.1?个体的编码纵观前人研究成果,利用遗传算法进行组卷常见的编码方案有两种:二进制编码和实数编码。利用二进制编码在进行交叉和变异时非常方便,但由于二进制编码串过长、搜索空间过大,在组卷中采用效率较低。本文采用分段实数编码方法,即将试卷按题型分别用实数进行编码。从前人的研究成果看,这种编码方案适用而有效。3.2?适应度函数适应度函数值是评判个体(试卷)优劣
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 混合 遗传 算法 系统 模型
限制150内