基于数据挖掘的学生就业管理系统(共27页).docx





《基于数据挖掘的学生就业管理系统(共27页).docx》由会员分享,可在线阅读,更多相关《基于数据挖掘的学生就业管理系统(共27页).docx(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上考试成绩任课教师陕西科技大学研究生考试试卷考试科目 智能信息处理与数据挖掘专 业 计算机应用技术学 号 考生姓名 李丰考生类别 学术硕士注 意 事 项1. 试题随试卷交回;2. 试卷评阅后,一周内送交研究生秘书处保存;3. 考生类别为学术硕士、专业学位硕士、在职人员攻读硕士学位。摘要随着计算机的普及应用和升级发展,数据挖掘作为一个新兴的、多学科交叉的应用领域,正在各行各业的以信息分析为基础的决策支持系统活动中扮演着越来越重要的角色。 数据仓库挖掘作为数据挖掘的一个重要研究分支,其主要目的是用于发现数据集中项之间的相关联系,即关联规则。数据挖掘是从大型数据库中提取知识信
2、息的主要手段,由于形式简单、易于理解,因此,数据仓库挖掘已广泛应用各个领域,用来检验行业内长期形成的知识模式,或发现隐藏的新规律。 随着我国教育改革的不断深入,高等教育得到了长足的发展。当前,在各类学校中,学校的数据库建设已较完善,数据库中存储着大量的教育教学信息。据调查,这些隐藏着大量教育信息的历史数据没有被很好地利用,没有好好挖掘隐藏在这些数据中的教育规律。致使在一些学校专业区分性不大,专业课设置没有明显的区分。毕业的学生却很难找到适合本专业的工作。究其原因,除了课程设置不能跟上,学生的实际能力不能被培养到实际用人单位所要求的标准等原因外,还存在着很多隐藏在背后的因。最终造成了学生在接受完
3、四、五年教育后,良好素质没有被开发,能力不够。而具有实际工作能力的学生被专业或某些未被发现的因素所限制,本文研究从大量的学校教育信息中挖掘出正确的、可靠的、可信的关联规则。 本文利用数据仓库技术、OLAP 技术、数据挖掘技术分析学校毕业生就业数据。通过对已毕业学生的专业、生源地、成绩及就业时间等信息进行联机分析与数据挖掘,从不同角度、不同层次寻找出学生就业与否的内在原因,发现学生对学校专业设置的需求,从而达到为专业设置和教育教学提供决策支持。AbstractAs computer being wildly used and upgraded, the data mining growing i
4、nto a new rising and multi-disciplinary application field are playing a more and more important role in the information analysis of decision support system. Association mining is an important research branch of the data mining, and it aims at discovering the relationship among items in a data set. T
5、he data mining is the main measure of deriving knowledge from large databases. Because of its simple form and it can be easily understood, association mining has been successfully applied to many fields. It not only can test the knowledge modes exiting in the industry, but also can find some new rul
6、es hidden.As education innovation in China being enhanced, higher education in been significantly developed.At present, in all kinds of schools,the school database has been well constructed and has stored enormous education and teaching information. According to some researches, the historical data
7、with a large number of educational information of historical data has not been well used or dig the education rules hidden in the database out. Consequently, the majors of a number of higher education schools have little distinction,and the course schedules have no clear distinction.Graduates are ha
8、rd to find suitable job according with their education experience.To analyze the reasons, besides current curriculum can not be kept up with the actual employers requirement,there are also many hidden reasons,which result in lackness of students ability after three to five-year education.However, so
9、me competent students have been constrained by majors or some undiscovered factors. The purpose of this article is to dig out correct,reliable and credible correlative rules from a large amount of education information.Based on data warehouse,OLAP technology and data mining,this thesis analyzes high
10、er education school graduates employment data.Through students major, students location,education experience and employed time,on-line analysis and data mining has been carried out to find out that internal reason of employment status of the student from different aspects and different levels and di
11、scover major arrangement requirements from the students,which could offer a decision-making support for course design and education method.目录摘要Abstract第一章 引言1.1研究的背景、目的和意义1.2数据挖掘的含义1.3国内外发展和研究现状第二章 学生就业管理系统数据仓库的设计与实现2.1确定指导主题2.2就业数据仓库建模第三章 数据挖掘在学生就业中的应用3.1数据挖掘应用流程3.2数据挖掘应用流程第四章 总结附录-代码一 引言1.1研究的背景、目
12、的和意义世界在进步,人类在发展,各项技术都在不断的发展和完善,当然数据库技术也不会例外,储存在数据库中的数据量也在不断的增大,当然这也是得益于互联网的出现,互联网的出现使人类的信息交流不再受到空间的限制,让所有人可以通过互联网十分方便的交换各种数据信息。在互联网不断的发展过程中,人们拿到的数据也像滚雪球一样,越来越大,大量数据的背后隐藏着许多重要的信息,人们通过对其深入的分析,希望能从中得到那些十分重要或有价值的数据信息。数据库系统并不能自动的找出十分重要或有价值的数据信息,这就孕育出来数据挖掘。从这个词的意思不难理解,人们拥有着大量的数据信息,要从大量的数据信息中找出隐藏在其中的十分重要或有
13、价值的数据信息,就需要不断的进行掘。在现在数据挖掘已经被广泛的运用在各个领域,并且都取得的令人满意的效果。 在我们国家教育改革的不断发展深入的过程中,高等教育也在大踏步的前进,高等院校如雨后春笋般的在增长。随着教育信息化的推进,几乎所有学校的办公室、教室都配有电脑,而且绝大多数的学校都建设有自己的校园网络,学校的所有数据信息都能在网络上查询到。这些数据信息里面我们将其分为三大类:第一类是学校的行政管理信息:如重要会议通知、教学简报、各种活动报道等;第二类是教学信息:如课程安排、任课教师情况、教学质量检查情况等;第三类是学生信息:如学生的基本资料、每学期成绩、表彰获奖情况等。在这三类信息中学生信
14、息本该最为重要,但却得不到重视,只是在学期末寄发成绩单时才被使用。通过数据挖掘技术所发现的专业、家庭经济状况、地域分布与就业的关系,合理的引导学生选择专业,最终提高学生的就业率。从而对高等教育及其教学改革具有一定的指导性意义。1.2数据挖掘的含义数据挖掘(data mining)又称数据库中的知识发现(Knowledge Discovery in Database,简称KDD),比较公认的 定义是由U.M.Fayyad等人提出的:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据集中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识的过程,提取的知识表示为概念(Con
15、cepts)、规 则(Rules)、规律(Regularities)、模式(Patterns)等形式。数据 挖掘是一种决策支持过程,分析各组织原有的数据,做出归纳的推理,从中挖掘出潜在的模式,为管理人员决策提供支持。1.3 国内外发展和研究现状相应地,数据挖掘在国外商场、金融(信用评估,欺诈监测)、电讯、科学、保险等领域早已有不同层次的应用。数据挖掘在商业领域有丰富应用:客户关系 管理、欺诈检测、供应链分析、医疗分析、文件分析(文本挖 掘)、决策支持系统和财务分析。而在政府方面的应用主 要有财务管理、人力资源管理、欺诈侦测、分析社会现象、打击恐怖主义、处理人们对政府数据的访问。国内数据挖掘还是
16、一个很新的研究课题,并处于一个初步应用的层次,但它所固有的为企业创造巨大经济效益的潜力,已使其很快有了许多成功的应用,具有代表性的应用领域有市 场预测、投资、制造业、金融、通讯等,数据挖掘目前还在国家资助(975,863,基金)的科研项目中有着重要的应用价值。 我国数据挖掘研究与开发的总体水平相当于数据库技术在20世纪70年代所处的地位,迫切需要类似于关系模式、DBMS系统和SQL查询语言等理论和方法的指导,才能使数据挖掘这项技术的应用得以普遍推广。预计在未来一段时间数据挖掘的研究焦点可能会集中到以下几个方面:(1)发现语言的形式化描述,即研究专门用于知识发现的数据挖掘语言;(2)寻求数据挖掘
17、 过程中的可视化方法,使知识发现的过程能够被用户理解,也便于在知识发现的过程中进行人机交互;(3)研究在网络环境下的数据挖掘技术(Web Mining),特别是在因特网上建立DM服务器,并且与数据库服务器配合,实现 Web Mining;(4)加强对各种非结构化数据的开采(Data Mining for Audio& Video),如对文本数据、图形数据、视频 图像数据、声音数据乃至综合多媒体数据的开采;(5)处理的数据将会涉及到更多的数据类型;(6)交互式发现;(7)知识的维护更新。1.4数据挖掘的基本技术(1)聚类/分割。聚类或分割是一种将数据分组方法类(或集群)是有着相似的模式或特征。各
18、专题组从数据确定,而不是依赖预定义类分类。零售商可以利用聚类发现类似情况在他们的客户群存在,使他们能够创建和理解它们销售和市场的不同群体。(2)关联分析。寻找大量数据中项集之间的关联或相关联系。例如通过对交易数据的分析,我们可能得出30%-40%购买纸尿布的男性顾客会同时购买啤酒这样的关联规则。关联规则广泛用于购物篮或事务数据分析。(3)序列模式。序列模式分析和关联分析类似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。序列模式分析描述的问题是:在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个交易序列数据库上,返回该
19、数据库中出现的高频序列。(4)人工神经网络和遗传算法。人工神经网络在数据挖掘中也扮演着非常重要的角色。人工神经网络可通过示例学习,形成描述复杂非线性系统的非线性函数,这实际上是得到了客观规律的定量描人工述。目前在数据挖掘中,最常使用的两种神经网络是BP网络和RBF网络。2、 学生就业管理系统数据仓库的设计与实现 建立学生就业数据仓库首先要根据学生就业数据仓库这个主题进行建模,主题明确后,才能根据主题确定需要的表;建模完成后紧接着就是对就业数据仓库进行设计,包括设计多维数据分析的事实表和维表;完成设计后就要加载数据,在这个过程中要设计数据加载程序,包含将集成的细节数据转化成不同综合层次的数据综合
20、功能和将数据清洗、转化和集成的装载功能;最后进行数据质量评估。 2.1确定指导主题确定指导主题实际就是划分范围,根据范围选取数据明确分析目的。就业指导分析关注的四个指导主题是成绩、专业、生源结构、就业时间的影响分析。1. 成绩影响分析。高等院校学生不仅在学校课程中学习文化知识,还要学习更多的专业技能,提高学生的整体素质,为毕业后能尽快参加工作、走向社会做好准备。因此,学生在学校的表现和智力成果由德育成绩和智育成绩组成,包括平时成绩和参加学校组织的技能比赛的获奖情况。在面临就业时,德育和智育成绩高低对学生的就业就会产生一定的影响,这是值得分析的一个问题。通过考察智育、德育等的因素,可以找出社会需
21、要什么样的职业技能人才。2. 专业影响分析。雇主需要什么样的专业技能人才,在一定程度成为了高等院校开设专业的一种向导。可以通过各专业的学生就业的形势的分析可进一步指导学校对专业的设置。3. 生源结构影响分析。由于是全国范围的录取,所以学生会来自全国各地,每个人的家庭经济条件都不一样。这些来自不同区域、不同类型的学生对他们就业区域、就业岗位、待遇都有不同的要求。所以对生源结构的整体分析,可以为毕业生实习、就业提供有意义的指导。4. 就业时间影响分析。在大环境的变动,同时影响到学生的就业率和就业质量。所以对就业时间与专业的分析,很容易获得哪些专业易于就业提出指导性建议。2.2就业数据仓库建模数据仓
22、库就是将从不同数据源中提取出来的数据全部存储到数据仓库中,数据存储的量很大,而且对数据查询的要求也相当高。一般的的数据建模都是从概念建模、逻辑建模、物理建模这样的自上而下的建模方式。概念建模主要是以信息打包的方式;逻辑建模的方式多采用星型建模方法和雪花建模方法;物理建模主要是以3NF和星型建模方式。 2.2.1概念建模概念模型是一个概念性的工具。服务于目标设计系统、收集信息等,在与用户沟通的过程中来定义数据仓库需要访问的信息,包括当前、将来和历史相关的数据信息。可以在需求分析阶段,确定操作数据、数据源以及一些附加数据,设计容易理解的数据模型,有效地完成查询和数据之间的映射。在本项目中使用的信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 学生 就业 管理 系统 27

限制150内