决策树分类算法在教学分析中的应用论文26668.docx
《决策树分类算法在教学分析中的应用论文26668.docx》由会员分享,可在线阅读,更多相关《决策树分类算法在教学分析中的应用论文26668.docx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、安徽新华学院2015届本科毕业论文(设计)本科毕业论论文(设设计)(题目:决决策树分分类算法法在教学学分析中中的应用用)姓 名: 学 号: 1144215512004 专 业: 计算算机科学学与技术术院 系: 信息工工程学院院指导老师: 袁袁张露 职称学历: 助助教/研研究生 完成时间:教务处制安徽新华学学院本科科毕业论论文(设设计)独独创承诺诺书本人按照毕毕业论文文(设计计)进度度计划积积极开展展实验(调调查)研研究活动动,实事事求是地地做好实实验(调调查)记记录,所所呈交的的毕业论论文(设设计)是是我个人人在导师师指导下下进行的的研究工工作及取取得的研研究成果果。据我我所知,除除文中特特别
2、加以以标注引引用参考考文献资资料外,论论文(设设计)中中所有数数据均为为自己研研究成果果,不包包含其他他人已经经发表或或撰写过过的研究究成果。与与我一同同工作的的同志对对本研究究所做的的工作已已在论文文中作了了明确说说明并表表示谢意意。毕业论文(设设计)作作者签名名:日期:决策树分类类算法在在教学分分析中的的应用摘 要要随着信息科科技的高高速发展展,人们们对于积积累的海海量数据据量的处处理工作作也日益益增重,需需求是发发明之母母,数据据挖掘技技术就是是为了顺顺应这种种需求而而发展起起来的一一种数据据处理技技术。数据挖掘技技术又称称数据库库中的知知识发现现,是从从一个大大规模的的数据库库的数据据
3、中有效效地、隐隐含的、以以前未知知的、有有潜在使使用价值值的信息息的过程程。在学学生管理理以及教教学科学学化的今今天,传传统的教教学分析析已经不不能适应应社会发发展的需需求。学生信息数数据不断断的增多多,教学学分析工工作也日日益加重重。学生生信息数数据量不不断的增增多,对对之前所所累计的的大量学学生考试试成绩数数据运用用数据挖挖掘技术术进行分分析挖掘掘是具有有重大的的意义的的,这样样可以把把所挖掘掘分析出出来的信信息反馈馈用于指指导学校校的教学学分析,从从而提高高学生的的学习成成绩。本文通过学学生成绩绩信息运运用数据据挖掘技技术,对对所采集集的数据据进行预预处理,运运用决策策树分类类算法中中的
4、C44.5算算法对成成绩进行行分析得得到了成成绩分析析决策树树,分析析研究出出有用的的信息找找到影响响学生的的因素,发发现某些些规律的的存在,用用以指导导学校教教学分析析工作的的开展。关键词:数数据挖掘掘;学生生成绩;决策树树 IIAppliicattionn off deecissionn trree in commputter graade exaaminnatiion anaalyssisAbstrracttWith thee raapidd deevellopmmentt off Innforrmattionn Teechnnoloogy, peeoplle aare faccingg
5、 muuch morre wworkk looad in deaalinng wwithh thhe aaccuumullateed mmasss daata. Hoowevver, Daata Minningg Teechnniquue iis aa kiind of datta pproccesssingg teechnniquue tthatt foolloows thiis cchannge. Inn reecennt yyearrs, colllegges andd ottherr innstiituttionns oof hhighher eduucattionn haad iin
6、crreassed theeir enrrolllmennts, moore andd moore stuudennts gott ennrollledd annd cconssequuenttly, thhe sstuddentts innforrmattionn daata poool ggetss muuch bigggerr. HHoweeverr, tthe traadittionnal datta pproccesssingg teechnnoloogy cannt aaccoommoodatte iitseelf to stuudy andd annalyyze thee acc
7、cummulaatedd maass datta aat aa deeepeer lleveel aany morre, whiile Datta MMiniing Tecchniiquee caan ssolvve tthesse pprobblemms mmuchh beetteer.The iincrreassingg daata basse oof tthe stuudennts conncluudess muuch, liike stuudennts teest scoore. Wiith thee raapidd deevellopmmentt off coompuuterr te
8、echnnoloogy, Coompuuterr Raank Exaaminnatiion beccomees mmoree annd mmoree poopullar; heencee, tthe datta bbasee off sttudeentss teest scoore beccomees mmuchh biiggeer. So, too usse DDataa Miininng TTechhniqque to minne tthe acccumuulatted masss CCRE scoore is of greeat meaaninng wwithh reegarrdinng
9、 tto tthe impprovvemeent of thee sttudeentss sccoree onn CRRE, sinnce peooplee caan aapplly tthe ressultts oof ddataa miininng iin sschoool commputter teaachiing ressearrch. Thiss paaperr inntennds to shoow tthe usee off Daata Minningg Teechnniquue iin tthe anaalyssis of stuudennts sccoree innforrma
10、ttionn inn Coompuuterr Raank Exaaminnatiion, frrom thee prretrreattmennt oon tthe colllecctedd daata to thee usse oof ddeciisioon ttreee teechnniquue iin ddataa annalyysiss. TThiss emmplooys ID33 allgorrithhm iin ddeciisioon ttreee teechnniquue tto gget thee deecissionn trree of thee sttudeentss ssc
11、orre. Theen bby aanallyziing thee ussefuul iinfoormaatioon tto ffindd ouut tthe eleemennts thaat ccan infflueencee CRRE sscorre aand thee ruuless inn thhesee innfluuencces to insstruuct schhooll teeachhingg woork. Keywoordss:Datta mminiing;commputter exaaminnatiion;deccisiion treee;SSqlSServver22008
12、8III目 录录1 绪 论11.1研究究背景与与意义11.2数据据挖掘的的产生11.3数据据挖掘的的国内外外研究现现状21.4论文文研究内内容及结结构安排排32 数据挖挖掘技术术42.1数据据挖掘的的概念42.1.11 数据据挖掘的的定义42.2 数数据挖掘掘的过程程42.2.11 数据据对象确确立阶段段52.2.22数据预预处理阶阶段52.2.22数据挖挖掘阶段段62.2.33结果的的解释和和评估阶阶段62.3数据据挖掘的的主要方方法62.4数据据挖掘的的功能102.5数据据挖掘的的系统结结构122.6数据据挖掘应应用的成成功案例例132.7本章章小结143 决策树树技术153.1决策策树简
13、介介153.2决策策树的主主要算法法163.2.11 IDD3算法法163.2.22 C44.5算算法173.3决策策树剪枝枝183.3.11决策树树剪枝的的方法183.4本章章小结204 决策树树在计算算机等级级考试成成绩分析析中的应应用214.1成绩绩分析方方法的依依据214.2 决决策树算算法在计计算机等等级考试试成绩分分析中的的应用214.2.11 确定定对象集集目标214.2.22 数据据的采集集224.2.33 数据据预处理理234.2.44 数据据挖掘工工作的展展开244.2.55结果分分析275总结与展展望295.1研究究结果295.2后续续研究与与展望29参考文献321 绪
14、论1.1研究究背景与与意义无论在企业业应用领领域,还还是在科科学领域域,数据据挖掘技技术有着着广泛的的应用价价值。在企业应用用领域,用用于制定定好的市市场策略略以及企企业的关关键性决决策。在在商业方方面,数据挖掘技技术可以以增强企企业的竞竞争优势势,缩短短销售周周期,降降低生产产成本,有有助于制定市场计计划和销销售策略略,并已已经成为为电子商商务中的的关键技技术。近年来,随随着我国国高等教教育的飞飞速发展展,高校校的教学学管理信信息不断断增多。教教学工作作信息化化有了很很大的进进步,好好多高校校在管理理学生和和教师信信息方面面有了很很好的方方式。比比如我校校的教务务系统,这这些系统统为老师师和
15、学生生提供了了很好的的帮助。这这些系统统中积累累了大量量的数据据。目前前的这些些数据库库系统虽虽然基本本上都可可以实现现数据的的录入、修修改、统统计、查查询等功功能,但但是这些些数据所所隐藏的的价值并并没有被被充分的的挖掘和和利用,信信息资源源的浪费费还是比比较严重重的。随着数据挖挖掘技术术的不断断扩展,许许多高校校为了避避免信息息浪费,已已经将数数据挖掘掘技术应应用于高高校的教教学分析析中。数数据挖掘掘技术的的应用将将对提高高学生成成绩和提提高教学学水平起起到很好好的指导导作用。为了提高教教学质量量,将数数据挖掘掘技术引引入到高高校学生生成绩分分析中,对对这些数数据进行行深入的的挖掘和和合理
16、的的分析,从从而挖掘掘出传统统的分析析方法所所无法得得出的结结论。进进而利用用分析结结果引导导教学的的开展,从从而有利利于提高高教学质质量。本文主要是是基于如如下背景景开展的的:以安安徽新华华学院历历届学生生成绩为为背景,首首先学习习数据挖挖掘的理理论知识识以及决决策树技技术,然然后建立立新华学学院学生生成绩数数据库,并并利用数数据挖掘掘技术中中的决策策树对自自己建立立的数据据库进行行深入的的挖掘。最最后对自自己的挖挖掘结果果进行分分析,得得到影响响学生成成绩的因因素。从从而更好好的辅助助今后学学校的教教学分析析工作。1.2数据据挖掘的的国内外外研究现现状1989年年8月在在美国召召开的第第十
17、一届届国际人人工智能能联合会会议的专专题讨论论会上,与与数据挖挖掘(DDatee Miininng)极极为相似似的术语语从数数据库中中发现知知识一词词被提出出。19993年年以后,美美国计算算机协会会美年都都举行了了专门研研究探讨讨数据挖挖掘技术术的会议议,会议议的规模模也发展展成为国国际学术术大会,并并且在各各个领域域里取得得了很多多研究成成果。最最近,GGarttnerr Grroupp的一次次高级技技术调查查将数据据挖掘和和人工智智能列为为“未来来三到五五年内将将对工业业产生深深远影响响的五大大关键技技术”之之首,并并且还将将并行处处理体系系和数据据挖掘列列为未来来五年内内投资焦焦点的十
18、十大新兴兴技术前前两位。1根据最近Gartner的HPC研究表明,“随着数据捕获、传输和存储技术的快速发展,大型系统用户将更多地需要采用新技术来挖掘市场以外的价值,采用更为广阔的并行处理系统来创建新的商业增长点。”国外研究数数据挖掘掘的组织织、机构构或大学学很多。比比较著名名的如卡卡内基梅梅隆大学学、斯坦坦福大学学、麻省省理工学学院。著著名的研研究机构构如:AACM、KDNNet、NCDDM等。国国外比较较著名的的挖掘工工具:IBMM公司的的Inttellligeent Minner 、SASS公司的的Entterpprisse MMineer、SGII公司的的SettMinner、SPSSS
19、公司司的Cllemeentiine、Oraaclee Daarwiin等。不少的软件在国外得到了广泛的应用,并收到了明显的效益。与国外相比比,国内内对DMMKD的的研究稍稍晚,没没有形成成整体力力量。119933年国家家自然科科学基金金首次支支持我们们对该领领域的研研究项目目。目前前,国内内的许多多科研单单位和高高等院校校竞相开开展知识识发现的的基础理理论及其其应用研研究,这这些单位位包括清清华大学学、中科科院计算算技术研研究所、空空军第三三研究所所、海军军装备论论证中心心等。其其中,北北京系统统工程研研究所对对模糊方方法在知知识发现现中的应应用进行行了较深深入的研研究,北北京大学学也在开开展
20、对数数据立方方体代数数的研究究,华中中理工大大学、复复旦大学学、浙江江大学、中中国科技技大学、中中科院数数学研究究所、吉吉林大学学等单位位开展了了对关联联规则开开采算法法的优化化和改造造;南京京大学、四四川联合合大学和和上海交交通大学学等单位位探讨、研研究了非非结构化化数据的的知识发发现以及及Webb数据挖挖掘。1.3论文文研究内内容及结结构安排排本课题的主主要工作作是将数数据挖掘掘技术和和学校的的信息管管理系统统相结合合,新华华学院多多年来的的信息化化教学管管理工作作积累了了大量的的教学数数据,从从新华学学院的数数据库中中收集学学生的考考试成绩绩信息。利利用数据据挖掘技技术对这这些数据据进行
21、分分析,获获得影响响学生成成绩的因因素,更更好的辅辅助学校校如何提提高学生生成绩以以及提高高教学质质量。本课题根据据指导老老师提供供的111级学生生成绩的的信息,建建立安徽徽新华学学院111级学生生成绩库库,采用用数据挖挖掘技术术对成绩绩库进行行挖掘。通通过对实实验结果果进行深深入分析析,获得得影响学学生考试试成绩的的因素,辅辅助教师师在以后后的教学学工作中中采用更更恰当的的教学方方式,指指导学生生应该具具有什么么样的学学习态度度,从而而提高学学生考试试成绩。 论论文结构构如下:第一章 绪论。 主要介介绍了论论文的研研究背景景与意义义,叙述述了国内内外数据据挖掘技技术的研研究现状状。第二章 数
22、据挖挖掘的基基础知识识。 主要叙叙述了数数据挖掘掘的定义义、数据据挖掘的的过程以以及数据据挖掘的的方法。第三章 决策树树。 主主要简要要介绍了了决策树树以及决决策树的的经典算算法。第四章 决策树树在计算算机等级级考试成成绩分析析中的应应用第五章 总结与与展望。总总结本篇篇论文并并展望今今后论文文的继续续研究方方向内容容方向。2 数据挖挖掘技术术2.1数据据挖掘的的概念2.1.11数据挖挖掘的背背景随着信息技技术的高高速发展展,人们们积累的的数据量量急剧增增长,如如何从海海量的数数据中提提取有用用的知识识成为当当务之急急。数据据库技术术的成熟熟以及数数据应用用的普及及,虽然然目前的的数据库库系统
23、可可以高效效的实现现数据的的录入、查查询、统统计的功功能,但但无法发发现数据据中潜在在的信息息和价值值,无法法利用这这些数据据来预测测未来的的发展趋趋势。于于是,新新的问题题就被提提出来了了:人类类如何在在这浩瀚瀚的数据据中及时时发现有有用的知知识,提提高数据据的利用用率呢?在不懈懈的努力力下,从从数据库库中发现现知识(KKnowwleddge Disscovveryy inn Daatebbasees)及及其核心心技术数据据挖掘(DDatee Miininng)便便应运而而生,并并得以蓬蓬勃的发发展,越越来越显显出其强强大的生生命力。2.1.11 数据据挖掘的的定义数据挖掘(Datta MM
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策树 分类 算法 在教 分析 中的 应用 论文 26668
限制150内