可视化技术下的市场监管大数据分析系统(共4609字).doc
《可视化技术下的市场监管大数据分析系统(共4609字).doc》由会员分享,可在线阅读,更多相关《可视化技术下的市场监管大数据分析系统(共4609字).doc(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、可视化技术下的市场监管大数据分析系统(共4609字)摘要:为提高机构改革期间市场监管部门工作效率,本文提出了一种基于可视化技术的市场监管大数据分析系统。系统将源自多个部门的数据进行清洗后存入数据仓库,通过J2EE平台调用数据分析模型对数据进行分析,并通过可视化工具以图、表等形式对结果进行可视化输出。实用结果表明,该系统提供了有效的决策参考,提高了市场监管干部的工作效率。关键词:大数据;可视化;数据仓库;市场监管引言运用大数据技术来加强对市场主体的服务和监管,是促进政府职能转变、简政放权和优化服务的有效手段,也是近年来的发展趋势1。国务院办公厅的国务院办公厅关于运用大数据加强对市场主体服务和监管
2、的若干意见中要求,各级政府部门都要充分认识运用大数据技术加强对市场主体服务和监管的重要性,通过运用大数据技术来提高对市场主体的服务水平、加强和改进新形势下的市场监管能力,并以此为动力推进政府和社会信息资源的开放和共享,提高政府部门运用大数据技术的水平。为了进一步加强和改进市场监管方法,提升市场监管部门的市场主体服务能力,顺应大数据时代潮流,运用大数据技术加强对市场主体的服务和监管,促进政府职能转变,做好简政放权和优化服务,在现有软硬件资源的基础上,整合原工商、质监、食药监、物价、知识产权等相关部门各个业务系统的数据,建设基于可视化技术的市场监管大数据分析系统。基于可视化技术的市场监管大数据分析
3、系统由数据仓库、大数据分析软件及相关软硬件设备组成。1系统架构系统采用松耦合、高聚合、多层次和面向服务的体系结构,坚持功能实用、接口规范和高响应时效的原则,采用J2EE架构和多服务器、虚拟化和集群化的部署方式。支持Oracle、mysql、SqlServer、DB2等主流数据库,支持Hadoop分布式系统基础架构。采用了兼容性较好的B/S模式,并结合当前科技创新工作的要求,支持Linux系统客户端下的火狐、谷歌等主流浏览器。系统的基本架构如图1所示。系统的数据源来自原工商、质监、食药监、物价、知识产权等多个部门不同厂家、不同版本的业务软件,经过数据清洗模块对各部门的数据进行整理、清洗,存入数据
4、仓库。J2EE平台调用数据分析模型接口对数据仓库中的数据进行分析,并通过可视化工具以图、表等形式对结果进行可视化输出。2数据预处理由于数据源所在的数据产生部门、数据库厂商和版本各不相同,数据库中表结构的差异较大,必须先对从各数据源中抽取的数据进行预处理,将清洗整理过的数据存储到数据仓库中,才能把数据完整、有效地提供给数据分析模块进行分析,并对分析产生的结果进行可视化输出。2.1源数据抽取针对多部门不同的数据库系统,都开发了相应的数据库接口进行数据抽取,对于未采用数据库进行存储的数据,则通过从软件用户端界面手动导入的方法进行抽取。抽取到的源数据保存在前置数据库中。前置数据库提供了自定义表结构功能
5、,用户可通过数据导入模块自行定义表结构和数据表中的字段属性,以便灵活导入未经过事先定义的数据。以市场监管工作中的反不正当竞争监管数据为例,通过数据抽取模块将行政执法的基本数据(案件号,案件名称,当事人,案值,处罚金额,立案时间等)导入系统后,系统将数据自动转化并存储至前置库的数据表中,数据表中相关字段的属性自动根据导入的字段类型进行判断,若表中部分字段内容缺失,系统先以默认值填充,待数据清洗时进一步处理。前置库中的行政执法信息数据如表1所示。2.2数据清洗数据清洗是对前置库中的数据进行校验和审查的过程2。数据清洗的目的是删除前置库中的重复信息、纠正错误数据,并将字段值的单位进行统一3-6。来自
6、各部门的历史数据往往存在数据重复、无效值、空值等实际情况,需要对其进行数据清洗后再存储到数据仓库中以供进一步分析展示使用。对源数据的数据清洗主要采用以下方法进行。对源数据中属性值均相等的数据视为重复信息,将其进行合并处理,只保留一条重复的数据。对源数据中的存在空值的不完整信息,若某个属性存在的空值过多,且该属性对所展示的问题不是特别重要,则删除该属性;若该属性仅存在少量空值,则判断该属性与其它属性间的相关性,存在相关性的根据其他属性的值和相关规则推测该属性的值,无法推测的保留空值。若处理后的某条数据存在的空值仍然过多,则将此条数据删除,否则保留此条数据并保留空值。对源数据中日期等格式不规范的数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 可视化 技术 市场监管 数据 分析 系统 4609
限制150内