《大数据分析平台技术要求》.pdf
《《大数据分析平台技术要求》.pdf》由会员分享,可在线阅读,更多相关《《大数据分析平台技术要求》.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据分析平台技术要求 大数据分析平台技术要求 1.技术构架需求 采用平台化策略,全面建立先进、安全、可靠、灵活、方便扩展、便于部署、操作简单、易于维护、互联互通、信息共享的软件。技术构架的基本要求:采用多层体系结构,应用软件系统具有相对的独立性,不依赖任何特定的操作系统、特定的数据库系统、特定的中间件应用服务器和特定的硬件环境,便于系统今后的在不同的系统平台、不同的硬件环境下安装、部署、升级移植,保证系统具有一定的可伸缩性和可扩展性。实现 B(浏览器)/A(应用服务器)/D(数据库服务器)应用模式。采用平台化和构件化技术,实现系统能够根据需要方便地进行扩展。大数据分析平台技术要求 2.功能指
2、标需求 2.1 基础平台 本项目的基础平台包括:元数据管理平台、数据交换平台、应用支撑平台。按照 SOA 的体系架构,实现对 XX 数据资源中心的服务化、构件化、定制化管理。2.1.1 元数据管理平台 根据 XX 的业务需求,制定统一的技术元数据和业务元数据标准,覆盖多种来源统计数据采集、加工、清洗、加载、多维生成、分析利用、发布、归档等各个环节,建立相应的管理维护机制,梳理并加载各种元数据。具体实施内容包括:根据业务特点,制定元数据标准,要满足元数据在口径、分类等方面的历史变化。支持对元数据的管理,包括:定义、添加、删除、查询和修改等操作,支持对派生元数据的管理,如派生指标、代码重新组合等,
3、对元数据管理实行权限控制。通过元数据,实现对各类业务数据的统一管理和利用,包括:基础数据管理:建立各类业务数据与元数据的映射关系,实现统一的数据查询、处理、报表管理。ETL:通过元数据获取 ETL 规则的描述信息,包括字段映射、数据转换、数据转换、数据清洗、数据加载规则以及错误处理等。大数据分析平台技术要求 数据仓库:利用元数据实现对数据仓库结构的描述,包括仓库模式、视图、维、层次结构维度描述、多维查询的描述、立方体(CUBE)的结构等。元数据版本控制及追溯、操作日志管理。2.1.2 数据交换平台 结合元数据管理模块并完成二次开发,构建统一的数据交换平台。实现统计数据从一套表采集平台,通过数据
4、抽取、清洗和转换等操作,最终加载到数据仓库中,完成整个数据交换过程的配置、管理和监控功能。具体要求包括:支持多种数据格式的数据交换,如关系型数据库:MS-SQLServer、MYSQL、Oracle、DB2 等;文件格式:DBF、Excel、Txt、Cvs 等。支持数据交换规则的描述,包括字段映射、数据转换、数据转换、数据清洗、数据加载规则以及错误处理等。支持数据交换任务的发布与执行监控,如任务的执行计划制定、定期执行、人工执行、结果反馈、异常监控。支持增量抽取的处理方式,增量加载的处理方式;支持元数据的管理,能提供动态的影响分析,能与前端报表系统结合,分析报表到业务系统的血缘分析关系;具有灵
5、活的可编程性、模块化的设计能力,数据处理流程,客户自定义脚本和函数等具备可重用性;支持断点续传及异常数据审核、回滚等交换机制。大数据分析平台技术要求 提供数据交换日志审计功能。2.1.3 应用支撑平台 作为系统的支撑平台,需要支持如下功能:用户及权限管理,包括:用户及组织架构维护,权限管理与分配等功能。统一工作门户,包括:门户菜单、栏目管理与维护,门户展现、个性化制定、单点登录等功能。统一消息,要求提供通讯录管理,消息收发、状态监控等服务接口,支持手机短信、即时消息、系统消息。统一日志,提供统一的日志存储、管理、查询、监控、审计等功能,方便的集成到各应用平台和子系统模块中。2.2 主题集市管理
6、子系统 主题集市的管理是业务数据采集、存储、查询、分析等一切应用的基础,如何提供方便完善的主题集市管理功能,是数据仓库建设成功与否的重要基石。具体要求如下:支持主题集市方便的复制、备份、调整,并支持对集市描述信息的版本管控。提供业务指标的增删改操作,以及对应的存储设计与字段的映射关系管理,并提供完整的指标生命周期管控,指标统计口径调整过程和追溯功能。支持派生指标的设置与维护,满足前后计算的两种统计模式。大数据分析平台技术要求 支持指标审核关系的自由设置,同时提供常规的审核公式函数库。提供图形化的报表表样配置工具,要求做到设计报表表样的所见即所得。提供维度(统计分类标准)管理,支持维度层级管理,
7、唯独项基本信息描述,包括:唯一标识、名称、显示名称、排序属性等。1.1 信息报送子系统 为 XX 部门间信息报送提供统一规范的填报任务管理功能,实现指标管理、分组目录管理、报表表样管理以及调查样本抽取及管理工作,并提供调查任务发布、信息报送、数据审核、归档以及任务监控等功能。信息报送子系统基于信息报送平台,结合实际的数据填报采集业务,实现任务发布、信息报送、数据审核、信息归档、任务监控、报送情况统计。2.3 数据资源管理子系统 建立数据资源管理子系统,为历年各业务系统的数据以及其它部门的数据提供一个统一的数据查询、处理、审核、统计等数据处理工作的平台,具体包括:2.3.1 数据库建设与管理 在
8、元数据的统一管理下,对历年各业务系统进行梳理和加载,形成统一业务存储的数据格式;支持从各业务系统和软件中获取数据,支持从关系型数据库、EXCEL、大数据分析平台技术要求 DBF、TXT 等数据格式中获取数据;支持从其它政府部门的交换文件中获取数据,如教育部、工信部、党校等,并提供相同指标不同数据的解决方案。2.3.2 数据浏览与处理 对各类数据按统一方式进行浏览与处理维护工作,包括:对不同来源的原始数据进行分类分层次展示,比如按数据类型、时间(年、月)、专业等属性及其不同的组合方式进行展示;通过可视化工具,按照报表制度样式设计原始报表,实现对单个企业数据的查询、审核和修改;实现对基础数据的快速
9、定位和展示功能;实现对基础数据的条件筛选和导出功能;对各类数据提供统一的审核、修改、删除、计算,以及数据导出、导入、备份、恢复等基本数据处理功能;支持对各种操作进行日志和审计功能。2.3.3 查询统计 提供可视化工具进行数据的各类查询统计,实现:条件查询、模糊查询、组合查询、关键字搜索;对结果进行各类排序、TOP N;基本统计(总量、均值、最大最小等);支持各种类型发布,包括生成 EXCEL、HTML 等功能;大数据分析平台技术要求 提供各种图形、报表展示。2.5 统计数据分析与应用子系统 针对已有的基层微观数据和综合数据,系统需要提供以目标为需求导向的主题创建维护模块与统计分析工具,并利用工
10、具,依据业务处室的要求以及领导所关心的 KPI 指标,在零开发的方式下制定相应的专题分析模块,包括:2.5.2 多维数据在线分析 在元数据的统一管理下,用户根据不同的关注领域创建各种主题和立方体(CUBE),灵活进行报表、指标的各种维度的分类组合展示,提供可视化工具进行维度、指标的配置;根据用户需求,定制各类固定报表、图表,提供查看、打印、导出功能;支持多维动态分析,提供钻取和切片功能,支持钻取到每个对象的细部数据,支持渐变维的管理与分析;业务分析,为业务人员提供如过滤、排序、分布、行列互换以及一些基本统计分析功能。2.5.3 即席查询 提供各种向导式界面、图形查询生成器、提示窗口等,通过简单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据分析平台技术要求 数据 分析 平台 技术 要求
限制150内