大数据背景下公安数据分析平台建设.docx
《大数据背景下公安数据分析平台建设.docx》由会员分享,可在线阅读,更多相关《大数据背景下公安数据分析平台建设.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据背景下公安数据分析平台建设大数据背景下公安数据分析平台建设随着公安信息化的高速发展,公安各级部门积累了海量的业务数据。怎样快速挖掘其内在价值,已成为公安信息化迫切需要解决的关键问题。因而,需要运用科技手段,提高公安部门的信息侦查、数据采集、智能分析、经侦调度、精准预测分析能力,构建符合公安实战所需要的智能大数据支撑体系。一、建设目的面向公安实战需求开展数据的深度整合和综合利用,构建一套基于大数据的统一数据收集、存储、分析、挖掘、应用的综合平台,实现下面目的:l数据资源大整合,构建齐全、鲜活的数据集市。抽取、清洗、转换、聚集跨地区、跨警种的各类数据,组建由公安内部、外部数据、互联网数据等组
2、成的基础数据库;面向信息检索、数据分析和专题应用需求重新构建的专题数据库;构成数据齐全、归类明晰的数据集市。l构建高效处理、安全存储的大数据平台。采用云计算架构,构建大数据平台。通过云计算、分布式存储、分布式计算、内存计算等技术手段提高数据处理能力,提高对非构造化数据,大容量数据的存储及处理能力,知足各类应用数据处理要求。l构建标准化、多样化、高效的数据分享平台。根据统一标准,分类别封装通用的数据访问、数据互操作、应用功能类、数据交换、信息布控等接口,通过服务总线形式提供,并由分享门户展现,知足基层数据分享需求。l深化数据应用,构建切合实战的数据应用平台。根据一线实战需求的共性,开发部分通用的
3、数据应用,譬如云搜索、信息比对、信息布控、背景审查等。借助大数据高效数据处理能力,开发对数据的深度应用,譬如智能碰撞、关系人挖掘、情报线索分析等。二、建设内容建设方案分为数据资源、数据服务、数据应用三个层面,整体架构如下:图1:架构图一数据资源层1、数据收集1数据源数据源主要包括公安内部和外部数据。其中,公安内部数据以警务综合信息应用平台和业务系统为主要数据来源,实现不同警种业务数据的标准整合;公安外部数据通过部门间分享服务平台获取的社会单位数据为主要数据来源,包含互联网数据和其他多媒体数据的获取,实现外部单位各类数据的标准化整合。2收集模块建设统一的数据收集模块,实现基于标准表单、文本数据及
4、相关视频、图像、语音等多媒体数据的批量导入、逐条录入和维护管理等系统功能,并进行自动分类,导入收集资源库。在收集入库的经过中,根据背景信息、动态信息、关系信息、特征信息的要素进行分类,建立规范化的数据描绘方法和清洗转换规则,实现社会数据资源的规范化建库。主体建立包含背景信息库、动态信息库、关系信息库、特征信息库等数据收集资源库。2、数据预处理通过数据预处理工作,能够使残缺的数据完好,并将错误的数据纠正,多余的数据去除,进而将所需的数据挑选出来,并且进行数据集成。实现对抽取的数据资源进行加工的能力,例如空值校验转化、字符串操作、字符串替换、新增字段、添加JSON字段、表码映射等。基于特征要素模型
5、,实现对文本内容的全文解析,并能够将文本中涉及到对象特征,诸如:身份证、手机号码、电子邮箱、QQ号码、车牌等特征要素转化为构造化数据进行存储。3、数据存储l对象建库对于所各类纷繁复杂的公安数据资源,主要构成基础数据库、全文检索库、对象主题库、碰撞分析库、关联分析库来进行存储管理。l构造化存储对于所收集会聚的数据资源,主要以构造化数据维护且总量有限,采用Oracle关系型数据库来进行存储管理。l非构造化存储HDFS分布式文件系统是Hadoop架构的支撑性平台,作为HBaseHIVE等大数据库的分布式运行系统,为其提供存储扩展能力、容错能力、吞吐能力等。HDFS本身也合适存储单个文件体积较大的内容
6、,如视频文件、音频文件、历史数据归档打包文件等等。在本项目的基础库设计中,对于非构造化数据,主要是以文本、视频、图片为主,拟采用HDFS作为外部收集文本、视频、图像的存储容器,并利用HBase为各个文件实体构建索引及相关描绘信息,为资源的进一步检索及调用奠定基础。在对数据的关联整合经过中的关键词标签数据和索引信息,其存储管理形式可根据详细数据量情况选择确定。4、数据管理1数据标准管理主要是根据上级部门提供的标准详细标准的内容有:数据元、限定词、数据项,创立本地的数据标准规范,详细内容包括有:数据元管理、同义词管理、限定词管理、标准数据项管理。2数据资源管理数据资源管理用于数据资源的统一管理,以
7、实现数据资产的有效管理,提升数据资产管理及运营能力,辅助建立数据资源资产化管理机制、数据资源运行维护管理机制、数据质量提升机制。数据资源管理系统主要包括数据资源注册、数据资源编目、数据质量管理和数据运行监控。3数据质量管理数据质量管理提供数据质量问题发现、数据质量问题监测及跟踪、数据质量分析、问题数据应用等功能,帮助用户了解数据质量情况,发现数据质量问题,持续监测数据质量,分析数据质量趋势和比照情况,跟踪问题数据修复情况,进而辅助用户建立数据质量提升机制。不同来源的数据在基础数据资源库进行清洗、整合,通过数据资源注册功能,实现各类数据源及数据资源统一注册管理,提供丰富的元数据信息。5、数据分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 背景 公安 分析 平台 建设
限制150内