高等教育事业统计数据挖掘分析.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《高等教育事业统计数据挖掘分析.docx》由会员分享,可在线阅读,更多相关《高等教育事业统计数据挖掘分析.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高等教育事业统计数据挖掘分析摘要:基于目前我国高等教育统计分析中存在数据更新速度缓慢、数据分析滞后、数据反应率低等问题,运用大数据思维,将大数据思维与小数据研究相结合,重点关注数据挖掘技术在高等教育统计数据中的运用。比照国内外研究现状,提出我国高校存在对数据挖掘重视度不高、数据挖掘技术在高等教育统计数据中的运用不充分、适应于高等教育老师与学生特点的数据挖掘技术应用欠缺等问题,并提出了解决的方案。关键词:教育统计;大数据;数据挖掘目前,我国每年教育事业统计工作要求调查指标1.6万项,涵盖范围为全国50多万所各级各类学校和机构,数据量高达55亿条1。其中,高等教育统计是我国教育事业统计工作的重要组
2、成部分之一,每年10月份开场通过单位收集、层层上报的方式汇总2。面对采集的海量数据,怎样将其有效利用,转化为指导高校建设、高等教育管理的参考根据是亟待解决的问题。一、我国高等教育统计数据分析现状2015年教育部对1991年的(中国教育监测与评价统计指标体系(试行))进行了修订和完善,修订后的指标体系分为综合教育程度、国民接受学校教育状况、学校办学条件、教育经费、科学研究等5类共102项指标,其中涉及高校的指标为54项3。教育主管部门和各学校力求管理好数据、分析好数据、利用好数据,覆盖采集、统计、分析、诊断、决策等全流程,以便更好地为领导决策服务、为学校发展服务。从拍脑袋决策到用数据讲话,统计数
3、据在教育管理中意义重大。但各高校在详细统计经过中,普遍存在机械上报的情况,缺乏适应性微观统计指标设计。同时,对已统计数据缺乏深化分析,大部分仅停留在简单描绘和讲明上,并未真正发挥统计数据的反应作用,数据利用率较差。其主要表如今下面几个方面:一是高校的教育统计多数是被动地完成报表任务,数据统计人员多是兼职的,服务方向仍然是以为上级服务为主,教育统计仍以搜集整理内部数据为主,未能主动地根据教育管理需要进行采集,把统计与学校工作相结合,把统计信息自觉地用于决策和日常工作。二是目前统计的口径较多,每年度都有高等教育事业统计、教学基本状态数据采集、固定资产投资报表等各级各类报表,上级下达的归口部门不同,
4、时间节点的要求也不一样。这导致学校不同部门给出的数据出入很大,也有学校为了应对检查和评估,捏造数据,使得统计数据失真。三是数据统计之后基本上停留在数据阶段,分析数据、利用数据进行决策的意识和能力很弱。二、大数据思维导入2012年联合国的(大数据发展:机遇与挑战)中明确指出,大数据时代已经来临,大数据的出现将会对社会各个领域产生重要的影响4。近年来,我国高度重视大数据研究,2015年,中共十八届五中全会初次提出“施行国家大数据战略,将大数据战略正式上升为国家战略;2016年,“十三五规划纲要对大数据战略进行进一步细化,提出方向性目的和任务;2017年,中共报告提出要“推动互联网、大数据、人工智能
5、和实体经济深度融合。简单来讲,大数据思维就是把一切可记录的事实都作为数据并从中寻找有价值信息的思维5。主要体如今下面四个方面。第一,非构造化数据也是数据。大数据的数据;更为多样,相比传通通计学中数据通过简单测量记录的方式采集,大数据的“数据化方式使得非构造化数据提取成为可能,为愈加客观分析反应结果提供有力支撑。第二,数据是动态变化的。不同于一次性的静态数据,大数据会因数据更新而发生动态变化。例如,我国每年的教育统计工作会得到大量的数据,但其作为一次性调查,无法实现数据的实时更新和跟踪比拟,使得数据分析存在滞后性,无法准确给予政策支持和建议。第三,数据样本等于数据总体。大数据强调要分析与事物相关
6、的所有数据6,增大数据覆盖面,将“假设验证转变为“发现总结7,实现数据全面汇总,不遗漏个体化特征数据。第四,数据通过挖掘才有价值。大数据的数据容量大且冗杂,并非所有数据都是有效数据、都能直观呈现出相关性。故需要根据分析目的,运用数据挖掘技术,剔除无用、虚假、错误的数据,进而获取有价值的信息。将大数据思维运用到我国高等教育统计数据分析中,可有效解决数据更新速度缓慢、数据分析滞后、数据反应率低等问题,但并不代表大数据就完全取代小数据研究。首先,大数据体现的互相关系就是由诸多小数据综合而成的;其次,加强小数据研究,能较好地筛除无效数据,进而促使大数据研究结论更为准确。因而,我们要基于大数据研究小数据
7、,基于小数据挖掘大数据5。三、我国高等教育数据挖掘现状(一)教育数据挖掘数据挖掘(DM)指的是从大量数据中提取出隐含的、具有潜在价值的信息与形式的经过89。数据挖掘研究主要分为基础理论研究和应用研究,基础理论研究的重点是数据挖掘的方法、功能以及系统和软件的建设等10,而应用研究则更倾向于成果应用,教育数据挖掘(EDM)指的就是数据挖掘在教育领域的应用。利用数据挖掘技术,能够使教育领域中的大量原始数据的潜在价值得到有效开发,在理论数据和实践应用中建立严密联络,实现透过冗杂的数据,提取价值信息,进而合理预测、有针对性地施行决策的良性循环。(二)我国高等教育数据挖掘研究方法omero和Ventura
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高等教育 事业 统计数据 挖掘 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内