智慧新区数据融合服务平台项目总体框架设计.doc
《智慧新区数据融合服务平台项目总体框架设计.doc》由会员分享,可在线阅读,更多相关《智慧新区数据融合服务平台项目总体框架设计.doc(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、智智智慧慧慧新新新区区区数数数据据据融融融合合合服服服务务务平平平台台台项项项目目目总总总体体体框框框架架架设设设计计计1.11.1项目总体架构项目总体架构1.1.1总体架构图总体架构图总体架构如下图所示:1.1.1.11.1.1.1 数据交换层数据交换层数据交换是指不同部门按照业务需求,确定信息交换流 程,在部门间实现具有主动推送特点的连续、实时信息传 输。 典型的应用有公文交换、部门间基础信息交换、综合治 税信息交换、信用信息交换、社会保障信息交换等。信息 交换有集中交换、分布交换与混合交换等三种模式。数据 交换的主要任务是实现数据的发送与接收,对参与者的合 法性进行验证,并通过与数据传输
2、中间件的配合,实现可 靠的数据交换。 数据可靠传输的目的是实现传输过程中的“不错、不丢、 不重”。数据传输的可靠性由所选定的中间件软件保证,通 过数据传输中的数据压缩/解压缩以及断点续传等功能,保 证数据交换的可靠性。数据交换总体架构如下图所示:1.1.1.21.1.1.2 数据加工与处理层数据加工与处理层不同委办局交换而来的数据经过数据清洗、比对、融合 环节,为无锡智慧新区数据融合服务平台打造信息完整、 结构清晰合理、数据准确及时的权威数据库。1.1.1.2.11.1.1.2.1数据清洗由于信息共享平台数据采集部门较多,各个数据采集部 门的信息化建设程度各异,数据维护程度也各自不同,信 息共
3、享平台对从各个数据采集部门采集回来的数据进行规 范性清洗,屏蔽数据采集过程中,数据格式错误、无用甚 至对信息共享平台有危害的数据。为信息共享平台建设数 据服务中心提供前期的一个数据过滤。1.1.1.2.21.1.1.2.2数据比对数据比对主要是对采集回来的各类数据,进行关键字段 的比较核对,形成各类型属性数据在主表上的挂靠,同时 也将采集过来的各个类型属性数据中信息错误或有差异的 数据进行更正、统一。 针对已经采集并清洗后的数据,分类同地理、自然人口、 组织单位三大库主表进行数据比对,比对上的数据,分主 表和附属信息表存储,包括新增、修改。主表信息,累计 增加,附属表比对上后携带主表 id 存
4、储。无法比对上的附 属表信息作为异常数据存储,以便统计和后期反馈。 数据比对主要分为程序比对和人工比对两种手段,程序 无法识别的数据由人工进行核实。1.1.1.2.3异常数据反馈异常数据反馈功能,将数据采集、清洗、比对同数据采 集部门形成互动。将清洗和比对工作中发现的异常数据反馈给数据提供部门,提醒数据提供部门核实的同时,也帮 助提高部门自身业务数据准确性。1.1.1.31.1.1.3 数据数据融合层融合层数据共享平台在完成数据比对,形成地理信息、自然人 口、组织单位三大对象数据结构体系后,通过地理信息库 标准地址和自然人口身份证号码进行三大库整合,使三大 相对独立的对象进行关联,有效的实现地
5、理、人口、组织 单位的紧密结合,从而构成完整的无锡新区基础信息数据 库,数据融合的过程如下图所示:(1)主体对象表抽取)主体对象表抽取对各个部门采集数据进行清洗后,将信息过后的数据分 主次抽取,抽取地理、人口、组织单位三大主体对象,形 成主体库。 其中地理信息库主表,主要由地理信息构成,以地址信 息 id 为主键,详细地址信息为主要字段,形成地址信息库 主表。 自然人口信息库主表,主要由公安自然人口信息构成, 以人口信息 id(或身份证号)为主键,以自然人口地址信息、自然人姓名、性别等信息为主要字段,形成自然人口 信息库主表。 组织单位信息库主表,主要由工商企业登记信息、编办 事业单位信息、民
6、政社会团体、民办非企业单位及质监局 的组织机构代码颁证信息构成,以组织单位 id 为主键,以 工商注册号、组织机构代码证、组织单位名称、注册地址、 办公地址等信息为主要字段,形成组织单位信息库主表。 (2)主题表关联)主题表关联各主题库通过对应的主题表中的主键相互关联,如组织单位主题表通过企业地址与地址信息主题表关联、人口主题表通过人员居住地址与地理信息主题表关联、自然人主题表通过身份证号与组织单位主题表关联。(3)业务属性信息关联)业务属性信息关联 以主题表关联形成了数据关联融合的整体框架,各业务 属性信息之间也需要通过相应的主键进行关联,如自然人 口民政、劳动、计生、卫生信息等为属性专题数
7、据表,通 过身份证号与自然人主题表关联。(4)属性信息与地理信息的关联)属性信息与地理信息的关联属性信息与地理信息的关联地址编码主要通过地址编码实现。地址编码的过程通常包括两个明确的步骤,即地址标准化和地址匹配。地址标准化是指在进行地址编码之前,将道路地址处理为一种熟悉的、常用的格式,纠正道路和地址名称的形式等。目前宁波市规划局已经采集了 20 多万条标准地址数据,具备了地址匹配的基础条件。地址匹配指确定具体地址事件的空间位置,并且将其绘制在地图上,最终目标是为给定地址,如:企业地址、人员居住地址等返回最准确的匹配结果,并通过 GIS 服务器在地图上找到并标明每条地址所对应的位置。地址编码的方
8、式有 3 种:定位到道路、定位到区域以及定位到道路和定位到区域相结合的方式。定位到道路:是通过道路名和门牌号码进行匹配,在参考主题中每一个路段都具有道路名和起止门牌号码信息,在地理编码时,首先首先根据地址信息中道路名找到参考主题中相同名称的路段,然后根据地址信息中的门牌号及每个路段的起止门牌号码信息找到门牌号所在路段,最后根据门牌号及该路段的起止门牌号码信息进行内插确定该记录在该路段上的位置。定位到区域:将地址中具有区域属性的记录与地图地址相应属性的区域记录进行比较,如果匹配成功,则将待查地址区域以点要素形式生成在地图的相应区域内。定位到区域以及定位到道路和定位到区域相结合的方式:是将上述两个
9、方法折中的方式来实现的。采用地址编码的优点:信息自动匹配,信息自动关联融合,减少了人力物力开销。缺点:匹配信息存在不准确现象,系统实现过程复杂。1.1.1.41.1.1.4 数据仓库数据仓库层层随着无锡智慧新区数据融合服务平台将越来越多的部门 数据收集整合起来,信息共享平台数据内容越来越复杂,更多的数据信息无法得到有效的分析利用。而随着社会信 息化的快速发展,平台用户决策任务越来越重,决策频率 也越来越高,原始的数据分析已经无法负荷这种大量度、 高频率、多维度的决策支持工作,为此信息共享平台引入 数据仓库技术。 数据仓库是一个面向主题、集成的、非易失的、随时间 变化的数据集合,能够对平台数据进
10、行分类、元数据抽取、 数据统计、模型搭建、历史数据存储等操作,为智能分析 提供多角度、多层次、多时间面的数据支持,方便智能分 析中数据统计,利用数据仓库,新的分析需求无需从原始 数据进行重新归总统计,可直接利用初步综合数据或中度 综合数据甚至高度综合数据,从而节约数据分析时间,快 速支持用户决策,同时也节约了分析系统设计开发成本。 数据仓库还存放了大量的历史统计静态数据,对于以时 间为主线的环比、同比、趋势等分析可提供直接的数据支 持,不需向原始的数据分析那样去调用原始的历史数据来 重复统计,也解决有些数据无历史数据记录的弊端。1.1.1.51.1.1.5 数据应用层数据应用层应用系统是数据融
11、合服务平台建设的目的,通过应用系统的建设,充分发挥基础人口、组织单位库和地理信息库融合以及多部门信息整合的优势,满足以往做不好或者不能做的业务应用,以各种灵活的方式为用户提供应用服务,例如部门共享应用、智慧社区、政府应用、领导桌面、智能分析、权限管理、全面审计、数据目录、单点登录、公众服务等。1.1.2架构优势架构优势(1)不脱离国家基础资源库标准规范体系,充分利用已有的建设成果;(2)提供了更加深入的数据融合功能,为城市的综合管理、委办局的协同工作、智慧应用的全面服务奠定了基础;(3)提供了便捷的数据利用方式,能够使云计算中心的信息资源得到有效的利用;(4)数据的收集、清洗、比对、核查、建库
12、形成了完整的闭环,保证了数据的完整性和现势性;(5)采用先进的技术,保证了服务良好的扩展性和实用性;(6)以空间位置信息为枢纽组织全区的基础数据,具有直观性和广泛的业务关联性,极大的提升了数据利用的效率和范围。1.1.3建设内容建设内容本项目的建设内容包括对需要采集的信息资源的梳理和建设基础数据库,同时建设保证基础数据库数据持续更新及利用的数据交换系统、数据加工处理系统、数据目录系统、数据综合展现系统、数据分析挖掘系统、数据共享服务系统、统一管理系统、数据标准规范体系和安全体系等,具体包括:(1) 信息资源梳理针对城市各委办局信息资源的现状进行摸底调研,制定统一的信息资源标准规范,并参照标准规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 新区 数据 融合 服务 平台 项目 总体 框架 设计
限制150内