国土资源大数据存储技术研究及实现.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《国土资源大数据存储技术研究及实现.docx》由会员分享,可在线阅读,更多相关《国土资源大数据存储技术研究及实现.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、国土资源大数据存储技术研究及实现摘要:本文对国土资源数据构造、云存储、海量空间数据管理等方面进行理论研究和关键技术分析,探索合适国土云环境下国土资源大数据存储管理的构造模型、组织规范、存储环境和安全体系,借助云计算、大数据的新技术、新理念为国土资源一张图云存储提供技术参考和实现推广。关键词:国土资源;大数据;云存储;地理信息随着高精度、高频度、大范围的超海量地理空间数据呈爆炸式增长,怎样有效的组织和管理这些海量异构的国土资源大数据,以便让国土资源各业务部门能够快速高效的利用其数据信息,是目前急待解决的难题。与此同时,云计算和大数据技术的兴起,给新一代空间信息基础设施体系架构的发展带来了希望,其
2、分布式存储及并行计算的特征非常合适应对海量数据存储以及大规模数据处理等问题,这就为国土资源海量空间数据的存储与处理提供了解决方案1。本文利用国土云环境,面向国土资源一张图海量空间数据云存储技术展开研究,以提升国土资源数据存储的高效性、可靠性和扩展性,为解决超大规模海量国土资源数据存储的难题,保障国土资源数据的及时更新、实现真正意义上的“一数一源,为国土资源数据高效存储与分享交换提供了思路。2总体架构分析通过GIS数据中心集成开发、网络通信以及信息化技术,以国土资源的各类专题数据为基础,以数据库管理和数据提供利用为目的的信息化标准规范体系和各级互通、共建分享的综合数据管理利用服务体系,建设国土资
3、源云存储管理系统。基于SOA架构的数据中心集成开发平台,实现专题业务模块的服务化、组件化、定制化管理;开发整合海量土地、矿产、地质灾祸专题数据和数据应用,实现多年度、多专题、多比例尺、全区域的空间数据库分布式运行和综合管理;进一步利用国家、省、市、县四级的数据交换体系,实现系统内的信息分享和效能监督。其总体架构图如图1所示。3基础设施体系研究对于硬件设计方面采取分层设计的思想,分析硬件系统的组成部分,通过对系统分解,找到最合理的服务环境,发挥出硬件设备最优异的性能,并提供安全服务2。国土云通过应用云计算虚拟化技术,减少信息化设备的冗余数量,节省大量的空间,便于硬件资源的有效利用,根据用户的实际
4、需要对其进行合理分配。国土云环境包括了数据存储区域、计算服务区域、局域网区域以及核心网络区域四大模块。如图2所示:4数据存储与组织模型研究通过把构造化与非构造化的信息数据统一格式、统一基准并空间化,导入到分布式文件系统HDFS中,导入完成后分布式文件系统自动触发档案内容提取流程,将办公文档、pdf、图片、视频等非构造化数据中的内容提取出来,根据特定的约束方式存到HBase构建的内容库中,同时将构造化数据到GIS服务集群中,供数据管理层提取和访问3。4.1数据组织模型大数据中心数据库至下而上进行划分为物理层、逻辑层以及逻辑字库层。逻辑字库包含了基础类、参考系、专业类以及管理类等数据;逻辑层主要用
5、来描绘国土资源数据的专题图件,细分包括防灾管理数据、地政管理数据以及矿政管理数据;物理层主要用来描绘另外两层的关键要素,数据逻辑设计如图3所示:大数据中心核心库数据需要把多种符合要求的数据根据顺序入库,由各类不同专题的业务数据组织构建。在现行的市县级国土资源数据管理体系中,分为市州级和区县级进行不同级别的管理,中心数据库把县级数据集当做最小的管理单元,结合业务实际需求,选择适宜的粒度有机统一的进行管理。如图4所示:大数据中心核心数据库采用逐层管理的方式,对于不同类型的数据使用的描绘格式也有所不同,与之对应的数据元信息也有多种格式,因而在数据元数据进行入库管理之前,首先应该建立一套完好的数据标准
6、,以此确保所有数据能够正确入库。在核心数据库中,每个元数据都对应了一个数据形式,刚开场创立数据集的时候,应该先把一样的文件形式进行解析,并把获得的数据参加到数据元库中。在入库的经过中还应该提供具体的日志信息,对数据的类型、格式以及时间等内容进行统计,到达大幅度提高数据录入的效率和准确性4。4.2数据存储模型空间大数据可考虑采用GIS平台进行管理,非空间大数据组织根据一定的方式和规则对多源大数据进行归并、存储、处理的经过。根据非空间大数据种类较多等特性,大数据中心提供多种存储方式来支撑非空间大数据的存储组织。非空间大数据的存储主要采用Hadoop分布式文件系统,存储策略主要包括三部分内容:首先根
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国土资源 数据 存储 技术研究 实现
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内