《社保大数据分析平台建设方案.docx》由会员分享,可在线阅读,更多相关《社保大数据分析平台建设方案.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、社保大数据分析平台建设方案当前位置:文档视界社保大数据分析平台建设方案社保大数据分析平台建设方案一、建设背景目前,XX市“金保工程业务系统基于联机事务处理OLTP,主要解决了日常业务经办的问题,但随着社保数据不断积累,数据量呈现海量存储特征,随着公共服务的不断推进,非构造化数据量也迅猛增加,这些情况导致社保的统计分析能力不断下降,普遍存在业务报表分散、统计查询不便、效率低下的问题,另一方面,随着基金平衡压力剧增,管理层基于海量数据的主题分析、预测分析、政策仿真需求日渐增加,现有的传统数据库平台和核心业务平台难以知足上述这些需求,亟待使用大数据技术来破解难题。二、项目建设总体要求2.1总体建设思
2、路及目的针对人社部门中社保业务数据分析和利用最为迫切的特点,作为XX市“智慧人社平台的重要组成部分,拟在我市“金保工程应用系统数据基础上,运用大数据技术,建立XX市社保大数据系统平台,建立完好的社保数据指标体系,实现对社保数据的综合统计分析,实现社保业务关键指标的主题分析、关联分析,建立数据分析模型,来协助社保政策部门、基金监管部门、经办部门进行政策调整仿真,分析预测社保基金运行的走向,辅助实现社保基金的“开源和“节流,辅助实现“应保尽保、应收尽收,帮助“堵塞漏洞2.2本项目建设目的1建设社保大数据综合统计分析基础平台框架;2建设社保大数据综合统计分析系统;3建设养老保险关联分析系统;4建设医
3、疗保险关联分析系统。3.1项目解决需求3.1.1建设社保大数据综合统计分析基础平台框架采用先进的混搭架构形式,运用大数据技术,结合数据仓库的设计形式,采用分布式计算+分布式数据存储的技术架构框架来实现基础平台框架,本期主要工作包括:1根据平台技术架构及应用部署架构完成系统环境搭建。2将“金保工程业务系统的数据通过ETL工具或同步工具,抽取到MPP数据仓库。3完成数据质量分析,进行数据预处理,重点包括数据清理、数据集成、数据规约、数据变换等。4初步完成基础建模,在MPP数据仓库中构建数据集市。5通过ETL工具将MPP数据仓库中明细数据抽取到Hadoop中,同时将爬虫过来的数据存储到Hadoop中
4、。6MPP数据仓库作为数据集市支撑上层数据分析和服务,Hadoop提供非构造化数据的存储和管理,同时提供社保明细数据查询。其中数据抽取部分,可根据源系统的特点采用不同的数据收集方式。数据收集方式包括:(1变更数据抽取:在业务系统部署监控程序,业务系统数据一有变化,就实时从业务系统获取变更数据,保障了业务监控和决策的快速反响。合适的数据源:人社的核心业务系统。(2批量增量数据抽取:定期从数据源中增量抽取数据。合适的数据源:人社的核心业务系统在无法采用变更数据抽取时。(3数据交换平台:人社部门与其它数据提供方确定数据交换接口和规范,通过数据交换平台以文件数据交换的形式获取。合适的数据源:政府部门相
5、关数据资源、社会部门相关数据资源、互联网数据资源。(4网络爬虫:自动的抓取互联网信息的程序。对于如公共服务网站的信息能够利用网络爬虫抓取数据。(5API接口:按需求订制开发API接口供数据需求方获取数据。-为重要的数据抽取方式,必须保证不影响原有核心业务系统的正常运行,需要原核心系统开发商配合完成的工作由建设方负责协调,配合工作若产生的相关费用须由中标商承当。3.1.2建设社保大数据综合统计分析系统按原有统计口径重新开发现有“金保工程系统中的各类综合统计汇总查询功能,并确保数据的准确、一致。根据业务部门实际需求,根据统计分析系统设计要求,设计开发各类可定制化的条件查询统计汇总功能,其主要统计分
6、析对象应至少包括:1参保人员分析参保人群在各险种间参保、缴费的比照统计分析情况。基于参保人口的当前信息和历史信息如年龄、性别、在职或退休、生存状态等,根据生育率、生命表等,利用年龄移算,分析参保人口的现状、预测人口趋势。通过参保人口的分析与预测,能够了解辖区内参保人口现状年龄构造、性别构造、在职与退休人员比例、期望寿命等,了解参保人口和老龄化的演化趋势。通过系统内外数据比对联动,分析查询人员社保变化轨迹,提炼人员标签,进行个体特征分析,并提供应“智慧人社公共服务平台查询;针对人群特征比对,挖掘全民参保扩面空间,分析政策补贴拉动社保征缴的可行性。2参保单位参保缴费率分析:按区域、单位类型、经济类
7、型、从属关系、行业等分析不同企业的参保缴费情况。欠费情况分析:分析欠费规模、欠费企业特征。缴费基数分析:比拟分析同类企业的缴费基础,与社平工资、行业指导工资的差异。针对缴费基数根据最低缴费工资水平缴费的现象进行分析。企业经营状况分析:根据企业的人员规模、工资规模、人员流动情况、缴费情况分析企业的经营状况。通过系统内外数据比对联动,分析单位社保变化轨迹,提炼单位标签,实现特征分析,并提供应“智慧人社公共服务平台查询。3基金收支根据需求订制开发统计查询功能,用于实时、动态、准确地分析各社会保险基金的收入、支出和结余情况,同比、环比变化情况,以及对应的安全支付级别。4考核指标类数据分析详细按业务部门
8、提供表样,应基本涵盖现行社保的统计报表及决策部门需要的统计分析报表。5医疗保险待遇统计分析根据XX医保政策,有针对性地对历年医保待遇数据进行统计分析,设计和构建综合性的医保基金运行状况的指标体系,结合专家经历和大数据技术,从基金收入、支出、结余、监管、管理等多维度全面、综合的考察、监测医保基金运行的状况。展示上应多采用图标形式,方便业务人员寻找其中的规律,分析离散点的成因。内容上应至少包括:医保费用分布情况,各待遇段人数分布情况;医保费用按医保项目分布情况,如药品、检查、化验等的占比统计分析;参保人医保待遇分析,如人均费用、均次费用、年人均就诊次数、人均住院天数、就诊率、各类参保人如按年龄、在
9、职/退休状态、文化程度、收入状况的医保费用和项目使用情况等;各类诊疗类型的医保待遇分析,如门急诊、住院等的医保费用使用情况分析。3.1.3建设养老保险关联分析系统按关联分析系统设计要求,建立指标体系,从多维构造化的角度处理对社会保险基金产生影响的政策、宏观经济方面的因素,为进一步挖掘事件与社保基金之间的深层关系打好基础,详细包括:1养老基金参保征缴指标体系基金征缴是养老基金主要来源,因而加强基金征缴力度,防备其中风险,有利于保障养老基金的总体稳定,对养老基金征缴产生影响的因素主要有:养老保险参保率(实际参保人数/养老保险制度覆盖人群的人数100%);养老基金征缴率(实际缴费人数/应缴费人数10
10、0%);缴费基数;养老保险缴费率;养老补缴/中断;养老账户;利率等。2养老基金支付指标体系养老基金支付主要受下面因素影响:奉养率(领取养老金职工人数/在职职工人数X100%);隐性负债率(隐性负债/养老基金总额100%);养老保险替代率(统筹区内同期养老金人均领取数/在岗职工人均工资数100%)。3养老基金违法违规指标体系基金冒领比率(基金冒领总额/应收统筹养老基金总额);养老基金偷缴漏缴率(偷缴漏缴额/应收统筹养老基金总额)。3.1.4建设医疗保险关联分析系统按关联分析系统设计要求,建立指标体系,从多维构造化的角度处理对职工和居民医疗保险基金产生影响的政策、宏观经济方面的因素,详细包括:1医
11、疗费用实时预警监测通过实时计算技术,对医保基金、医院的结算情况进行实时监控;利用时序预测方法,预测将来若干月度的基金结算规模。2医保支付比例调整辅助决策构建医疗保险报销参数调整的模型,针对不同医疗机构等级、就诊类型、人员类别等调整报销比例,测算各类人群的医疗负担,受益受损情况,以及对医保支出的影响。3医保药品目录的调整利用大数据手段,帮助业务部门在诊疗记录、医保支付记录中挑选使用广泛、疗效确切但未纳入目录的药品,或者,挑选已纳入目录但效果未到达预期的药品,为提出目录调整动议提供数据支撑4居保个人缴费与财政补贴标准测算利用历史结算数据,构建居保缴费水平、财政补贴与医保支出的测算模型,为标准调整提供决策根据。5医保季度分析报告基于大数据,自动生成季度报告所需的指标数值。三、项目建设主要内容与要求3.1系统总体建设方案本项目充分利用现有金保工程数据中心资源,采用先进的混搭架构形式,运用大数据技术,结合数据仓库的设计形式,采用分布式计算+分布式数据存储的技术架构框架来实现基础平台框架,同时建立一套完备的数据标准和数据治理体系。基于平台提供的数据分析、数据挖掘、数据专题等服务能力,实现社保大数据综合统计分析、养老保险关联分析、医疗保险关联分析三大系统,通过PC和移动双门户进行接入访问。当前位置:文档视界社保大数据分析平台建设方案社保大数据分析平台建设方案
限制150内