决策树分类算法在教学分析中的应用论文25214.docx
《决策树分类算法在教学分析中的应用论文25214.docx》由会员分享,可在线阅读,更多相关《决策树分类算法在教学分析中的应用论文25214.docx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、安徽新华学院2015届本科毕业论文(设计)本科毕业论论文(设计计)(题目:决决策树分类类算法在教教学分析中中的应用)姓 名: 学 号: 1114215512044 专 业: 计算机科科学与技术术院 系: 信息息工程学院院指导老师: 袁张露 职称学历: 助教/研究生 完成时间:教务处制安徽新华学学院本科毕毕业论文(设设计)独创创承诺书本人按照毕毕业论文(设设计)进度度计划积极极开展实验验(调查)研研究活动,实实事求是地地做好实验验(调查)记记录,所呈呈交的毕业业论文(设设计)是我我个人在导导师指导下下进行的研研究工作及及取得的研研究成果。据据我所知,除除文中特别别加以标注注引用参考考文献资料料外
2、,论文文(设计)中中所有数据据均为自己己研究成果果,不包含含其他人已已经发表或或撰写过的的研究成果果。与我一一同工作的的同志对本本研究所做做的工作已已在论文中中作了明确确说明并表表示谢意。毕业论文(设设计)作者者签名:日期:决策树分类类算法在教教学分析中中的应用摘 要要随着信息科科技的高速速发展,人人们对于积积累的海量量数据量的的处理工作作也日益增增重,需求求是发明之之母,数据据挖掘技术术就是为了了顺应这种种需求而发发展起来的的一种数据据处理技术术。数据挖掘技技术又称数数据库中的的知识发现现,是从一一个大规模模的数据库库的数据中中有效地、隐隐含的、以以前未知的的、有潜在在使用价值值的信息的的过
3、程。在在学生管理理以及教学学科学化的的今天,传传统的教学学分析已经经不能适应应社会发展展的需求。学生信息数数据不断的的增多,教教学分析工工作也日益益加重。学学生信息数数据量不断断的增多,对对之前所累累计的大量量学生考试试成绩数据据运用数据据挖掘技术术进行分析析挖掘是具具有重大的的意义的,这这样可以把把所挖掘分分析出来的的信息反馈馈用于指导导学校的教教学分析,从从而提高学学生的学习习成绩。本文通过学学生成绩信信息运用数数据挖掘技技术,对所所采集的数数据进行预预处理,运运用决策树树分类算法法中的C44.5算法法对成绩进进行分析得得到了成绩绩分析决策策树,分析析研究出有有用的信息息找到影响响学生的因
4、因素,发现现某些规律律的存在,用用以指导学学校教学分分析工作的的开展。关键词:数数据挖掘;学生成绩绩;决策树树 IAppliicatiion oof deecisiion ttree in ccompuuter gradde exxaminnatioon annalyssisAbstrractWith the rapiid deeveloopmennt off Infformaationn Tecchnollogy, peoople are faciing mmuch moree worrk looad iin deealinng wiith tthe aaccummulatted mmass
5、 dataa. Hooweveer, DData Miniing TTechnniquee is a kiind oof daata pproceessinng teechniique thatt folllowss thiis chhangee. Inn reccent yearrs, ccolleeges and otheer innstittutioons oof hiigherr eduucatiion hhad iincreeasedd theeir eenrolllmennts, moree andd morre sttudennts ggot eenrollled and con
6、ssequeentlyy, thhe sttudennts infformaationn datta poool ggets muchh biggger. Howweverr, thhe trradittionaal daata pproceessinng teechnoologyy cannt acccommmodatte ittselff to studdy annd annalyzze thhe acccumuulateed maass ddata at aa deeeper leveel anny moore, whille Daata MMininng Teechniique can
7、 solvve thhese probblemss mucch beetterr.The iincreeasinng daata bbase of tthe sstudeents conccludees muuch, likee stuudentts tesst sccore. Witth thhe raapid deveelopmment of ccompuuter techhnoloogy, Compputerr Rannk Exxaminnatioon beecomees moore aand mmore popuular; hennce, the dataa basse off stu
8、udentts tesst sccore becoomes muchh biggger. So, to use Dataa Minning Techhniquue too minne thhe acccumuulateed maass CCRE sscoree is of ggreatt meaaningg witth reegardding to tthe iimproovemeent oof thhe sttudennts scoore oon CRRE, ssincee peoople can applly thhe reesultts off datta miiningg in sch
9、oool ccompuuter teacchingg ressearcch. Thiss papper iintennds tto shhow tthe uuse oof Daata MMininng Teechniique in tthe aanalyysis of sstudeents scoore iinforrmatiion iin Coomputter RRank Examminattion, froom thhe prretreeatmeent oon thhe coolleccted dataa to the use of ddecission treee tecchniqque
10、 iin daata aanalyysis. Thiis emmployys IDD3 allgoriithm in ddecission treee tecchniqque tto geet thhe deecisiion ttree of tthe sstudeents scoore. Thenn by anallyzinng thhe ussefull infformaationn to findd outt thee eleementts thhat ccan iinfluuencee CREE scoore aand tthe rruless in thesse innflueenc
11、ess to insttructt schhool teacchingg worrk. Keywoords:Dataa minning;compputerr exaaminaationn;deccisioon trree;SSqlSeerverr20088III目 录录1 绪 论11.1研究究背景与意意义11.2数据据挖掘的产产生11.3数据据挖掘的国国内外研究究现状21.4论文文研究内容容及结构安安排32 数据挖挖掘技术42.1数据据挖掘的概概念42.1.11 数据挖挖掘的定义义42.2 数数据挖掘的的过程42.2.11 数据对对象确立阶阶段52.2.22数据预处处理阶段52.2.22数据挖
12、掘掘阶段62.2.33结果的解解释和评估估阶段62.3数据据挖掘的主主要方法62.4数据据挖掘的功功能102.5数据据挖掘的系系统结构122.6数据据挖掘应用用的成功案案例132.7本章章小结143 决策树树技术153.1决策策树简介153.2决策策树的主要要算法163.2.11 ID33算法163.2.22 C4.5算法173.3决策策树剪枝183.3.11决策树剪剪枝的方法法183.4本章章小结204 决策树树在计算机机等级考试试成绩分析析中的应用用214.1成绩绩分析方法法的依据214.2 决决策树算法法在计算机机等级考试试成绩分析析中的应用用214.2.11 确定对对象集目标标214.
13、2.22 数据的的采集224.2.33 数据预预处理234.2.44 数据挖挖掘工作的的展开244.2.55结果分析析275总结与展展望295.1研究究结果295.2后续续研究与展展望29参考文献321 绪 论1.1研究究背景与意意义无论在企业业应用领域域,还是在在科学领域域,数据挖挖掘技术有有着广泛的的应用价值值。在企业应用用领域,用用于制定好好的市场策策略以及企企业的关键键性决策。在在商业方面面,数据挖掘技技术可以增增强企业的的竞争优势势,缩短销销售周期,降降低生产成成本,有助助于制定市场计计划和销售售策略,并并已经成为为电子商务务中的关键键技术。近年来,随随着我国高高等教育的的飞速发展展
14、,高校的的教学管理理信息不断断增多。教教学工作信信息化有了了很大的进进步,好多多高校在管管理学生和和教师信息息方面有了了很好的方方式。比如如我校的教教务系统,这这些系统为为老师和学学生提供了了很好的帮帮助。这些些系统中积积累了大量量的数据。目目前的这些些数据库系系统虽然基基本上都可可以实现数数据的录入入、修改、统统计、查询询等功能,但但是这些数数据所隐藏藏的价值并并没有被充充分的挖掘掘和利用,信信息资源的的浪费还是是比较严重重的。随着数据挖挖掘技术的的不断扩展展,许多高高校为了避避免信息浪浪费,已经经将数据挖挖掘技术应应用于高校校的教学分分析中。数数据挖掘技技术的应用用将对提高高学生成绩绩和提
15、高教教学水平起起到很好的的指导作用用。为了提高教教学质量,将将数据挖掘掘技术引入入到高校学学生成绩分分析中,对对这些数据据进行深入入的挖掘和和合理的分分析,从而而挖掘出传传统的分析析方法所无无法得出的的结论。进进而利用分分析结果引引导教学的的开展,从从而有利于于提高教学学质量。本文主要是是基于如下下背景开展展的:以安安徽新华学学院历届学学生成绩为为背景,首首先学习数数据挖掘的的理论知识识以及决策策树技术,然然后建立新新华学院学学生成绩数数据库,并并利用数据据挖掘技术术中的决策策树对自己己建立的数数据库进行行深入的挖挖掘。最后后对自己的的挖掘结果果进行分析析,得到影影响学生成成绩的因素素。从而更
16、更好的辅助助今后学校校的教学分分析工作。1.2数据据挖掘的国国内外研究究现状1989年年8月在美美国召开的的第十一届届国际人工工智能联合合会议的专专题讨论会会上,与数数据挖掘(DDate Miniing)极极为相似的的术语从数据库库中发现知知识一词被被提出。11993年年以后,美美国计算机机协会美年年都举行了了专门研究究探讨数据据挖掘技术术的会议,会会议的规模模也发展成成为国际学学术大会,并并且在各个个领域里取取得了很多多研究成果果。最近,Gaartneer Grroup的的一次高级级技术调查查将数据挖挖掘和人工工智能列为为“未来三三到五年内内将对工业业产生深远远影响的五五大关键技技术”之首首
17、,并且还还将并行处处理体系和和数据挖掘掘列为未来来五年内投投资焦点的的十大新兴兴技术前两两位。11根据最最近Garrtnerr的HPCC研究表明明,“随着着数据捕获获、传输和和存储技术术的快速发发展,大型型系统用户户将更多地地需要采用用新技术来来挖掘市场场以外的价价值,采用用更为广阔阔的并行处处理系统来来创建新的的商业增长长点。”国外研究数数据挖掘的的组织、机机构或大学学很多。比比较著名的的如卡内基基梅隆大学学、斯坦福福大学、麻麻省理工学学院。著名名的研究机机构如:AACM、KDNeet、NCDMM等。国外外比较著名名的挖掘工工具:IBM公司司的Inttelliigentt Minner 、S
18、AS公司司的Entterprrise Mineer、SGI公司司的SettMineer、SPSSS公司的Cllemenntinee、Oraccle DDarwiin等。不不少的软件件在国外得得到了广泛泛的应用,并并收到了明明显的效益益。与国外相比比,国内对对DMKDD的研究稍稍晚,没有有形成整体体力量。11993年年国家自然然科学基金金首次支持持我们对该该领域的研研究项目。目目前,国内内的许多科科研单位和和高等院校校竞相开展展知识发现现的基础理理论及其应应用研究,这这些单位包包括清华大大学、中科科院计算技技术研究所所、空军第第三研究所所、海军装装备论证中中心等。其其中,北京京系统工程程研究所对
19、对模糊方法法在知识发发现中的应应用进行了了较深入的的研究,北北京大学也也在开展对对数据立方方体代数的的研究,华华中理工大大学、复旦旦大学、浙浙江大学、中中国科技大大学、中科科院数学研研究所、吉吉林大学等等单位开展展了对关联联规则开采采算法的优优化和改造造;南京大大学、四川川联合大学学和上海交交通大学等等单位探讨讨、研究了了非结构化化数据的知知识发现以以及Webb数据挖掘掘。1.3论文文研究内容容及结构安安排本课题的主主要工作是是将数据挖挖掘技术和和学校的信信息管理系系统相结合合,新华学学院多年来来的信息化化教学管理理工作积累累了大量的的教学数据据,从新华华学院的数数据库中收收集学生的的考试成绩
20、绩信息。利利用数据挖挖掘技术对对这些数据据进行分析析,获得影影响学生成成绩的因素素,更好的的辅助学校校如何提高高学生成绩绩以及提高高教学质量量。本课题根据据指导老师师提供的111级学生生成绩的信信息,建立立安徽新华华学院111级学生成成绩库,采采用数据挖挖掘技术对对成绩库进进行挖掘。通通过对实验验结果进行行深入分析析,获得影影响学生考考试成绩的的因素,辅辅助教师在在以后的教教学工作中中采用更恰恰当的教学学方式,指指导学生应应该具有什什么样的学学习态度,从从而提高学学生考试成成绩。 论论文结构如如下:第一章 绪论。 主要介绍绍了论文的的研究背景景与意义,叙叙述了国内内外数据挖挖掘技术的的研究现状
21、状。第二章 数据挖掘掘的基础知知识。 主要叙述述了数据挖挖掘的定义义、数据挖挖掘的过程程以及数据据挖掘的方方法。第三章 决策树。 主要简要要介绍了决决策树以及及决策树的的经典算法法。第四章 决策树在在计算机等等级考试成成绩分析中中的应用第五章 总结与展展望。总结结本篇论文文并展望今今后论文的的继续研究究方向内容容方向。2 数据挖挖掘技术2.1数据据挖掘的概概念2.1.11数据挖掘掘的背景随着信息技技术的高速速发展,人人们积累的的数据量急急剧增长,如如何从海量量的数据中中提取有用用的知识成成为当务之之急。数据据库技术的的成熟以及及数据应用用的普及,虽虽然目前的的数据库系系统可以高高效的实现现数据
22、的录录入、查询询、统计的的功能,但但无法发现现数据中潜潜在的信息息和价值,无无法利用这这些数据来来预测未来来的发展趋趋势。于是是,新的问问题就被提提出来了:人类如何何在这浩瀚瀚的数据中中及时发现现有用的知知识,提高高数据的利利用率呢?在不懈的的努力下,从从数据库中中发现知识识(Knoowleddge DDiscooveryy in Dateebasees)及其其核心技术术数据挖挖掘(Daate MMininng)便应应运而生,并并得以蓬勃勃的发展,越越来越显出出其强大的的生命力。2.1.11 数据挖挖掘的定义义数据挖掘(Dataa Minning),又译为为资料探勘勘、数据采采矿。它是是数据库
23、中中的知识发发现(Knnowleedge Disccoverry inn Dattebasses,简简称:KDDD),是是目前人工工智能和数数据库领域域研究的热热点问题,数数据挖掘一一般是指从从大量的数数据中通过过算法搜索索隐藏于其其中信息的的过程。所所谓数据挖挖掘是指从大量的的、不完全全的、有噪噪声的、模模糊的、随随机的数据据中自动搜搜索隐藏于于其中的有有着特殊关关系的信息息,提取隐隐含在其中中的,人们事先先不知道的的、但又是是潜在有用用的信息和和知识的过过程5。2.2 数数据挖掘的的过程数据挖掘(Dataa Minning)的过程可可以分为以以下几个部部分:理解解数据和数数据的来源源(un
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策树 分类 算法 在教 分析 中的 应用 论文 25214
限制150内