基于大数据技术的水库移民后扶监测研究_余小高.docx
《基于大数据技术的水库移民后扶监测研究_余小高.docx》由会员分享,可在线阅读,更多相关《基于大数据技术的水库移民后扶监测研究_余小高.docx(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 科 技 创 业 基于大数据技术的水库移民后扶监测研究 余 小 筒 (湖北经济学院湖北武汉 430205) 摘要:为了解决水库移民后期扶持政策实施监测的数据量大、处理效率低等问题,提高数 据采集精确度,探讨了大数据技术在水库移民后期扶持政策监测中的应用。首先简述了大数据 的基本特点和关键技术,并将这些技术应用到水库移民后期扶持政策实施监测中,指出水库移 民后期政策扶持监测的数据符合大数据特征;其次提出了基于大数据技术的水库移民后期扶持 政策实施监测信息系统的体系架构,并介绍了数据处理过程;最后分析了研宄成果的实际应用, 达到了良好的效果。应用结果表明,研宄成果能够提高数据处理效率和精确度,解决
2、移民后扶监 测中存在的数据处理问题,为移民后扶政策的实施提供决策支持。 关键词:大数据技术;水库移民;数据处理 中图分类号: D632.4 文献标识码 : A doi : 10.3969/j.issn.l665-2272.2016.05.007 0引言 根据国务院关于完善大中型 水库移民后期扶持政策的意见 2006年 17号文件 (注: “ 后期扶 持政策 ”简称 “ 后扶 ” ),实施大中型 水库移民后期扶持政策监测评估 工作是有政策依据的。国家发改 委、财政部和水利部在 2011年联 合出台了 1033号文件关于开展 大中型水库移民后期扶持监测评 估工作的诵知,为监测评估的指标 体系、内容
3、和方法等进行了界定,同 时为保证大中型水库后期扶持政 策实施提供了监督和管理的依据。 目前,监测评估工作具体实施过程 中普遍存在着许多不容忽视的问 题: 样本选择不够合理,存在一 定的随意性,缺乏连续性; 评估 主体的能力需要提高,部分基层干 部人员工作态度不积极,工作效 率 不高,难以系统性地收集资料; 各地后扶监测评估不深入,走形 式,不能突出地方特色,监测方法 有待提高。这些问题对后扶政策实 施效果的客观评价产生了不容忽 视的影响,因此,对监测评估方式 方法等讲行研宄是非常必要的,也 是迫在眉睫的。本文以湖北省大中 型水库移民后期扶持政策实施监 测为切入点展开研宄。 水库移民后扶监测需要
4、采集、 存储、处理大量的移民人口数据、 直补资金、后扶项目、两区项目、专 项资金项目、移民培训项目、其他 资金项目等的各种信息,这些数据 不仅量大,而且结构差异性大。监 测中,需要提供 各种报表和统计分 析,为各级管理者提供决策支持。 因此,将大数据技术应用到大中型 水库移民后扶监测中,能够客观地 和全方位采集、存储后扶监测数 据,采用科学的数据处理方法,解 决当前水库移民后扶监测评估存 在的问题,更好地为后扶政策的实 施提供决策参考。 1大数据概述 当今计算机和网络已经深入 到人们生活的方方面面,不同领 域、不同行业、不同岗位、不同层次 的人们,可以利用计算机、移动终 端采集、使用这些数据,
5、这些特征 很有利于水库移民监测中数据的 采集和相互印证,达到客观和公 正。近年来,各种移动平台、公共网 络平台、专业网络平台和电子商务 等的迅速发展,极大地推动了数据 以指数级的方式增长。在这种背景 下, “ 大数据 ” 概念应运而生。大数 据指的是数据量规模巨大,数据呈 异构型,目前主流工具无法正常处 理。综合业界的研宄成果,大数据 具有以下 4个特征 : 数据量巨大, 不能用常规的方式存储; 数据结 构呈多样性,除包含结构化数据外, 还有大量的非结构化数据; 数据 的利用价值低,无法用常规的方法 在海量的数据中发现有价值的数 据; 实时性,虽然数据量巨大,数 据处理效率的实时性要求高 。
6、水库移民后扶监测数据来源 广泛,比如后扶人口、规划、年度计 划、扶持资金、后扶项目、两区项 目、专项资金、移民培训,等等。这 *基金项目:湖北省教育厅人文社科重点课题(编号 : 15D 086) 作者简介:余小高( 1969-),男,教授,博士,研究方向:大数据、水库移民后扶。 收稿日期: 2016-01-11 18 科技创业月刊 2016年第 5期 基于大数据技术的水库移民后扶监测研宄 科技论坛 些数据具有如下特征: 数据源 多、类型丰富; 数据量巨大; 数 据实时性。根据后扶监测数据特 征,在水库移民后扶监测中,主要 应用的大数据关键技术有 4个方 面: 数据采集。利用该技术可以 各种数据
7、源中的各种类型数据,通 过手机、平板电脑、各种传感器、计 算机网络等获取大量数据。 分布 式文件存储技术。该技术框架主要 包 括 云 计 算 、 Google的 GFS、 bigTable 及 Hadoop 的 HDFS 等。水 库移民后扶数据量巨大,无法用常 规的方法存储,因此可以利用大数 据存储技术解决存储问题。 并行 处理 技术。 MapReduce是目前最出 色的并行处理技术,能够解决水库 移民后扶监测数据处理的实时性 和连续性,提高数据处理效率和精 确度。 大数据挖掘技术。在常规 数据挖掘技术的基础上,大数据挖 掘技术需要开发、研宄出新的算 法。目前,可用Hive、 Mah0Ut等算
8、法 对大数据进行挖掘,解决数据量巨 大,但价值低的问题,充分挖掘出 有用的信息。 2后扶监测体系架构 基于大数据技术的水库移民 后扶监测体系架构如图 1所示,共 分为四层, S卩:数据采集和展现层、 数据应用层、数据存储层、云计算 平台层。其中,数据应用层分为四 个部分,分别为数据共享管理、数 据交换中心、平台监控和决策支 持。利用大数据的存储技术来构建 数据中心,通过大数据挖掘等技 术,实现了大中型水库移民后期扶 持的决策支持功能。数据服务功能 可以提供各种接口和系统总线,数 据交换中心利用数据交换技术,将 后扶人口,后扶资金管理,后扶项 目建设等不同子系统提供的数据, 根据它们不同的特征,
9、存储到数据 中心。 统架构各层的工作机制如下。 (1) 数据采集和展现层。在移 民后扶监测体系的数据采集层,利 用大数据的采集技术,通过手机、 平板电脑等移动终端和各种数码 设备等工具,有效而全面地采集移 民后扶的各类数据,保证数据的有 效性、全面性、实时性和精确性。 (2) 云计算平台层。该层采用 云计算的分布式处理技术,构建系 统基础平台,为移民后扶监测大数 据的应用提供最基本的物理平台。 (3) 数据存储层。该层利用了 HADOOP中的 HDFS存储技术存 储,整合了移民后扶监测中各种数 据库和数据资源,存储移民后扶 监测中的各类结构化和非结构化 数据。 (4) 数据应用层。该层采用大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 技术 水库 移民 监测 研究 余小高
限制150内