一体化智能化公共数据平台(数据资源体系)建设方案.docx
《一体化智能化公共数据平台(数据资源体系)建设方案.docx》由会员分享,可在线阅读,更多相关《一体化智能化公共数据平台(数据资源体系)建设方案.docx(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一体化智能化公共数据平台(数据资源体系)建设方案址、接入时间、接入状态应用系统负责人等详情权限管理主要提供用户、角色管理功能人员驻场人员驻场服务提供人员驻场服务,实现与省级及区县部门数据治理问题对接。3统一用户体系升级组织 架构 及人 员信 息获 取组织架构 及人员信 息获取通过全量获取的方式拉取组织架 构及人员信息,采用实时更新的 方式推送用户信息统一身份 认证 对接前端单点插件集成前端单点插件集成后端单点用户信息解析后端单点用户信息解析数据迁移开发用户权限部门功能,给个人 用户设置部门用户目录管理权 限。将目录从原有的易和部门用 户对应到idaas的用户上。在用 户权限部门功能中根据部门提
2、供 的人员,配置用户权限部门。将1011与易和部门绑定的目录,切换到 idaas部门上。用户用idaas账 号登录,检查目录,查漏补缺共享 域与 IDaa S统 一用 户中 心的 对接与IDaaS统一用户中心的对接共享域将完成与IMaS统一用户 中心的对接工作;获取易和与浙 政钉用户关联关系,与部门确认 更新关联关系。同时,针对历史 用户数据,做好数据映射,本地 数据存储易和ID、浙政钉ID4统计分析统计分析统计分析通过对省回流目录、本地目录、 数据接口数据的统计分析,对目 前各县、市(区)目录数量情况 进行可视化展示;以时间、部门、 目录为维度,展现目录归集率、 接口调用量、部门调用量、开放
3、 数据量、汇聚数据总数等情况; 通过对数据归集过程的监控,对 目前一体化智能化公共数据平台 归集全流程进行可视化展示;以 时间、地区、部门、目录为维度,展现目录归集率、日归集数据量、 市本级部门数据量排名、汇聚数 据总数、月归集数据量、区县归 集数据量等情况;通过多维度的 统计分析2、公共数据共享域2、公共数据共享域1对接 IRS资源管 理系 统对接 IRS资源管 理系 统对接IRS资源管理系统由级公共数据服务平台负责对接 IRS【数据资源开通通知接口】, 统一接收IRS完成数据审批后向 对应的数据资源平台发送IRS流 程单编码和应用ID2区县 专区 建设 及服 务用户权限管理升级可视化分区可
4、视化分区增加区县权限共享市场分区共享市场分区增加区县权限应用管控权限应用管控权限增加区县权限接口服务审批权接口服务审批权增加区县权限安全检测权限安全检测权限增加区县权限区县 共享 技术 实施接口开发接口开发服务是基于区县业务部 门提出的明确且具体的接口需求, 将数据治理后产生的优质数据及 专题库内的专题数据开发成接口,1213服务注册到数据共享平台上。接口注册将已开发的接口注册到数据共享 平台区县专区上。由数据共享平台 作为区县公共数据的统一出口,实 现数据在部门间、应用内的安全流 转。接口申请根据区县各级业务部门数据使用 需求,协助各部门进行接口使用材 料的准备,主要包括接口使用申请 填写讲
5、解、初步判断接口使用申请 是否合规,接口使用申请通过后的 接口封装、接口配置等接口审批在区县专区建设规划中提供接口审批服务,根据受限接口和非受限接口申请情况分别建立相应审批流程接口应用统计提供接口应用统计服务,对区县专 区接口共享服务情况进行统计,包 括接口调用量、接口申请审批办理 实效性、接口应用服务场景等进行 统计3日志分析系统分析规那么梳理分析规那么梳理模型搭建模型搭建规那么管理规那么管理异常总览异常总览分析规那么梳理.异常调用分析以被 调用的接口为主线,主要从日调用 量、非工作时间调用、瞬时调用三 个时间维度对应用对应接口的异 常调用进行分析;敏感调用分析。 主要从接口的敏感等级以及从
6、接 口出参中的敏感数据两个角度进 行分析。针对异常分析规那么进行模型搭建, 包含异常调用分析模型、敏感调用 分析模型两大类。异常调用分析模 型的底层异常指标主要分为异常 调用量、非工作时间调用、敏感调 用分析三大类。敏感调用分析模型 主要针对个人信息进行安全分级 评估,并对接口进行敏感等级标 注。规那么列表进行检索、规那么配置和对 不适用规那么的应用进行增删改查 操包含调用异常统计总量、报警情况 统计、部门报警情况列表、报警应14用明细异常分析异常分析由条件筛选、异常应用列表、查看详情等模块组成异常查询异常查询异常查询以调用时间异常、日调用 量异常、瞬时调用异常、敏感信息 调用、调用阀域(IP
7、)异常报警处理报警处理报警处理模块包括未处理列表功能和已处理列表功能日志查询日志查询系统将以列表的形式展示接口名称、调用应用、部门、appkey等信息日志服务日志服务提供日志分析人工服务,包括分析、跟踪、整改催促等3、公共数据开放域3、公共数据开放域1开放平台(企 业侧) 建设数据开放实验室门户数据开放实验室门户数据开放实验室入口,展示数据开放平台简介、工作流程注册登陆用户注册、登陆、认证支持合作方注册、登陆和密码找 回及密码修改。浙里办账号体系打通支持与浙里办合作方账号体系打通,支持浙里办的合作方账号15登录实名认证支持合作方实名认证(浙里办)数据资源申请数据资源申请支持合作方提交申请材料(
8、“四个一”流程)、查看申请进度,反应等数据资源目录支持合作方查看数据资源目录数据服务管理数据服务管理支持合作方查看当前所有数据服务的基本信息、当前状态数据服务发布在数据服务开发完成后,提交发布数据服务申请,审批通过后完成数据服务的发布平台用户管理子账号创立支持合作方管理员创立平台的子账号子账号管理支持合作方管理员管理平台的子账号开放平台(运 营侧) 建设合作方管理待审核合作方支持运营人员新增合作方、审核 合作方的基本信息、通过合作方 名称或联系人的相关信息查询 待审核合作方的基本信息。合作方信息查询支持运营人员通过合作方名称、联系人信息查询合作方的基本16信息合作方申请管理提供合作方信息审核、
9、管理、“四 个一”申请材料审核、管理等功 能。云资源账号维护支持运营人员在合作方数据资 源申请审核通过后,维护ODPS 相关云账号的信息,并与ODLAB 的合作方做关联。服务上架管理数据服务创 建在合作方完成数据服务开发,提 交数据服务发布申请时使用。支 持运营人员填写数据服务名称、 类型、地址等信息,并由运营人 员后台同步脚本至ODPS环境。数据服务展示在合作方完成数据开发,提交数 据服务发布申请,经审批后,提供数据服务结果查看功能数据服务配置为运营人员提供数据服务生成API配置的工作流。数据服务发 布选配,支持运营人员进行导出表 的申请和实际导出表至RDS的操 作。(如需以API形式发布至
10、网 关,那么进行相应的数据服务上架17网关的发布操作)资源管理数据资源对接1、公开数据、受限数据的目录 快捷对接,并能经由运营人员确 认是否纳入数据资源管理。经确 认后,自动完成数据资源对接。2、开放域系统承接用户自有数 据开放目录平台的对接。数据资源管理使用图表、列表展7K经由运营人 员确认后的数据资源情况,包含 且不限于基本信息、来源信息、 数据更新状态、关联应用数量。网关管理应用关系维护提供应用及各类API关系维护功 能,包含是否校验、是否限流、 限流次数等应用日志各类应用API调用次数等应用日 志查看,包括:调用次数等,并提供基础日志查询功能来源API第三方来源支持多平台的鉴权 逻辑维
11、护,来源API将多平台的 接口注册在网关上,出口 API可 以对来源API设置出口规那么,包出口 API第三方来源18括映射关系,脱敏规那么,限流规 那么等。网关提供基础的日志查询 功能API管理数据源管理提供对多来源的数据源进行管理。API创立提供API数据服务生成功能,将 多数据源的数据快速定义成API 接口。脱敏管理脱敏函数管理定义脱敏函数的相关设置,针对不同的对象设置不同脱敏规那么。定义脱敏函数,对存储的数据进行静态脱敏处理。用户权限管理用户管理管理后台创立账号、分配角色,实现运营管理账号创立以及管理权限管理管理后台创立角色,分配页面访 问权限、功能使用权限,支持对 角色的编辑数据授权
12、系统建设个人数据授权系统(端)个人数据宝(端)提供数据宝授权端,可在浙里办 /微信等多端上架应用。提供对 接认证登陆、授权列表、档案中 心(个人)等功能。实现受限开19(一)建设背景3(二)建设规模3(三)建设概述3(四)工程建设清单4(五)建设内容51、公共数据基础域52、公共数据共享域123、公共数据开放域154、公共数据安全域235、数据N仓4320放数据的可用不可见。企业数据授权系统(端)企业数据宝(端)提供数据宝授权端,可在浙里办 /微信等多端上架应用。提供对 接认证登陆、授权列表、档案中 心(企业)等功能。实现受限开 放数据的可用不可见。数据授权管理模块授权场景配置配置授权场景,定
13、义数据合作类 型、授权模式、API数据包及管 理授权场景下的合作方应用。授权模式配置配置授权的有效期或计次模式 相关类型和参数。个档数据服务个档数据服务提供个档标准数据服务(以省开放域为准)企档数据服务企档数据服务提供企档标准数据服务(以省开放域为准)数据沙箱系统建设脱敏核心服务脱敏中间件结合网关,在出口 API处调用脱 敏服务,完成对接口参数的脱敏 处理。脱敏工具箱在0DPS中,根据业务需求提供遮挡类、假名类、信息转换类等 漂白函数。开发生开发生产环提供2套-4套环境标准别离方21产环境别离方案境别离方案案可供选择。基础网关服务API接口及网关搭建搭建满足数据开放场景需求的API接口平台及对
14、应的网关环境,数据接口打通发布数据沙箱的模型结果可以申请 同步到RDS关系型数据库中,运 维人员使用工具,将RDS的数据 生成接口并注册到数据网关上数据合规性校验数据合规性校验是对数据出口 内容的最后一道关卡,是数据安 全的最后保障,可分为两局部: 一是数据校验,对开放出口数据 进行合规性校验,保障数据明细 不透出,个体信息不泄露;二是 代码校验,对企业操作代码执行 日志进行记录对代码进行检测, 防止敏感操作。开放门户升级开放门户升级开放门户升级对接数林指数评价结果,对开放 门户进行功能升级,提升指数排 名提供在线问题解答、受限数据集申请、可视化分析6开放 门户 管理 端建 设开放门户管理端设
15、计开放门户管理端设计管理端,从目录管理、资源管理、 网站审核、开放统计、政策管理、 问卷管理、系统管理区县特 色开放 目录区县特色开放目录区县特色开放目录可对信息资 源名称、信息资源代码、信息资 源摘要、信息资源格式、标签、 数据领域、行业分类进行管理梳理出各区县开放数据集,并在7区县开放专区开放数据集发布开放数据集发布开放平台区县专区进行展示。用 户可进行数据集的查询、查看、 预览、下载等操作,还可对数据 集进行订阅、收藏、纠错及评论建设开放数开放数据接梳理出各区县开放数据接口,并据接口口在开放平台区县专区进行展示。开放平 台区县 管理端 用户权 限开放平台区 县管理端用 户权限对开放平台的
16、用户权限体系进 行升级,与浙江省统一用户进行 对接。接入区县级用户,在开放 后台新增区县级管理员角色。22区县目录管理区县目录管理区县管理员可通过领域、场景、 时间等维度的筛选对平台内数 据开放资源目录进行精准定位, 并对区县所属的开放目录进行 审核、发布、查看、删除等操作。区县开 放资源 管理区县开放资源管理要包括数据集管理、接口管理, 为区县管理员提供开放数据集 的发布、撤回和开放接口的发 布、撤回的能力区县审核管理区县审核管理主要包括数据集下载审核、接口注册审核、接口申请审核区县开放统计看板区县开放统计看板管理端中新增区县开放统计的 看板,对各区县的数据开放与其 使用情况进行统计并做可视
17、化 展示,展示内容包括目录审核统 计、数据集下载统计、接口申请 统计、开放领域统计、开放数据 统计等板块4、公共数据安全域4、公共数据安全域序号内容指标项详细要求231公 共 数 据 入 侵 防 御 系 统 建 设入侵防御 防护目标对公共数据平台上部署的公共数据库提供入侵防 御服务同时要求能够支持ORACLE (含12C、18C、 190、MYSQL、SQLSERVER DB2、GBASE、HIVE、 达梦、PG、优炫、人大金仓、神舟通用、MongoDB. SYBASE 巨杉、上海热璞、HANA、informix、cache OceanBase RDS-Mysql RDS-PG、 TIDB M
18、ariadb Greenplum PostgreSQL EnterpriseDB GaussDB、 K-DB、 HBase redis TDSQL、 teledb Vertica 等主流数据库、国产数据库、大数据平台等。部署方式在政务云平台上采用反向代理方式接入数据库。SQL语句学习能力能够自主学习业务和数据库的交互SQL语句,识 别安全SQL;内置机器模型,通过学习的SQL语句 形成应用SQL白名单,设置自动激活模式,在学 习到一定时间后,SQL白名单自动执行生效。SQL注入防护可以检测SQL访问语句是否含有SQL注入特征, 能够对正常SQL特征及SQL注入特征双重防护, 防止SQL注入工具
19、。虚拟补丁防护根据CVE漏洞提供的数据库漏洞形成数据库漏洞 虚拟补丁,同时服务团队需要具备CVE漏洞挖掘 能力,能够提供数据库漏洞挖掘服务,要求在本 次工程中提供不少于1600个数据库漏洞虚拟补 To24入侵防护 策略定制 服务能够针对已建设的数据安全监管平台对公共数据 资产梳理形成的敏感数据集合进行访问管理,提 供访问授权服务,业务访问前先通过入侵防御服 务配置合适的访问权限,通过授权才可以访问, 不具备访问权限的操作,明确阻断拒绝并提供错 误信号。在入侵防御过程中设置敏感标签身份,使之具备 合法访问指定敏感数据的权限。未明确注册的身 份,默认表示为不合法身份,不能访问任何敏感 表格。对数据
20、行数(阀值)进行精细管控,超出阀值的行 为进行阻断或拦截,防止数据大量泄漏。支持访问频次控制,防止一定时间内的高频次访 问。识别真实应用程序,防止假冒应用访问数据库。入侵防御防护能力对数据库访问流量的峰值SQL吞吐不低于50000 条语句/秒,峰值QPS吞吐量70000,响应延时小于 1毫秒,在线SQL存储160亿条。本次服务要求针 对60个数据库实例提供入侵防御服务。2数 据 防数据识别系统内置多种数据内容识别规那么,支持内置规那么 根据行业特性自主添加。支持多种文件编码格式。25泄 漏 系 统 建 设内置图片内容识别。支持识别多层压缩文件、嵌套文件的内容,嵌套 层数可自定义。支持关键字对规
21、那么识别,能够设置关键字间距。关键字匹配支持次数匹配,支持去重匹配支持识别故意打乱的关键字支持英文识别忽略大小写支持全字匹配支持简体繁体自适应支持词典规那么识别支持正那么表达式规那么识别,支持次数匹配,支持 去重匹配。支持通过数据标识符对数据本身的规那么和校验功 能进行判断,支持二次校验进行更精确识别。支持通过后处理脚本对发现的敏感数据进行进一步校验,提高准确率支持结构化数据指纹,结构化数据指纹可指定具体敏感的数据列支持非结构化数据指纹,非结构化数据指纹识别 依据指纹匹配的百分比(相似度)进行响应,匹 配百分比可设置支持图章26支持基于自然语义的机器学习结果进行内容识别。支持位置识别,须包含但
22、不限于以下位置识别方式:(1)识别文档正文、页眉页脚、文本框、office 宏等各种不同位置中的敏感内容(2)识别office正文、批注、模板等位置的敏 感内容(3)对于office、pdf类嵌套文件,支持按组件 粒度或文件粒度进行敏感内容识别(4)对于excel文件,支持按工作表或工作薄进 行内容识别(5)支持识别邮件标题、正文、附件等位置的敏 感内容(6)支持人员、组织、设备、IP、URL、电子邮 件地址进行识别支持数据属性识别,须包含但不限于以下数据属 性识别方式:(1)支持识别常见的文件类型,包括office办 公软件(doc、docx xls xlsx ppt pptx wps vi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一体化 智能化 公共 数据 平台 资源 体系 建设 方案
限制150内