数字化大数据平台规划汇报方案.pptx
《数字化大数据平台规划汇报方案.pptx》由会员分享,可在线阅读,更多相关《数字化大数据平台规划汇报方案.pptx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、大数据应用发展趋势二、大数据平台整体规划所谓“大数据”,指的是所涉及的数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到截取、管理、处理、并整理成为帮助企业经营决策更积极目的的信息。大数据大数据处处理技理技术术代表了新一代的技代表了新一代的技术术架构,架构,这这种架构通种架构通过过高速高速获获取数据并取数据并对对其其进进行分析和挖掘,从海量形式各异的数据源中更有效地抽取出富含价行分析和挖掘,从海量形式各异的数据源中更有效地抽取出富含价值值的信息。的信息。从大量数据中挖掘高价从大量数据中挖掘高价值值知知识识是各界是各界对对于大数据的一个共于大数据的一个共识识。海量数据可广泛海量数据可
2、广泛获获得,所稀缺的是如何从中挖掘出智慧和得,所稀缺的是如何从中挖掘出智慧和观观点。点。Google 首席首席经济经济学家学家 Hal Varian大数据主要被用于分析和决策,企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合,对企业产生新的价值。1542提升提升业务业务效率效率自助分析、生自助分析、生产产管道管道可可视视化、化、资资源解耦随源解耦随需而需而动动,营销实时营销实时,以以业务业务效率提升效率提升为标为标志。志。决策和决策和预测预测能力提升能力提升整体整体经营经营管理水平。管理水平。增增强强管
3、理水平管理水平数据集中到数据中心数据集中到数据中心,多数据源管理,透,多数据源管理,透明服明服务务支持,支持,实时实时的的创创新商新商业业模式模式数据开放服数据开放服务务、与、与OTT厂商合作的后向收厂商合作的后向收费费、广告等新广告等新业务业务.提升客提升客户户体体验验互互联联网化的网化的电电子渠道子渠道全景体全景体验验、个性化商、个性化商品推荐、品推荐、LBS位置位置营营销销、面向客、面向客户户个体的个体的深度洞察深度洞察存存计计算、算、MPP、CEP分而治之的分布式分而治之的分布式计计算算让让运运营营商商实时实时高效决策高效决策.3技技术术高效、低成本高效、低成本以技以技术驱动为标术驱动
4、为标志,内志,内精细化营销数据中心营账系统经分(BI)GN口上网话单终端(DM)VAC短彩信中心语音通话详单客服接触记录流媒体平台详单基站信息位置信令话单116114企业黄页信息渠道应用助销信息 经过一二期的建设,精细化运营平台的数据中心,已经成为上海联通最大、内容最丰富的数据仓库;随着数据量的增长,需要对基础架构做长远规划;有必要深入挖掘数据价值,研究新的商业模式,将成本中心转化为利润中心5 增量式的、几乎无限的扩展 要求系统总是在线运行扩展性可用性 灵活可动态改变的数据模型灵活性扩展性分布式可用性纵向扩展资源集中单份数据横向扩展计算和存储分布数据复制 不要使用分布式事务处理一致性业务业务运
5、运营发营发展展趋势趋势低成本运低成本运营营一体化运一体化运营营精精细细化运化运营营全网运全网运营营实时实时、智能化运、智能化运营营对业务对业务支撑平台的集中化要求支撑平台的集中化要求集中化建集中化建设设、管理和、管理和维护维护可不断可不断线线性性扩扩展展提高提高资资源源综综合利用率合利用率标标准化功能准化功能组组件,可共享可复用件,可共享可复用按按业务业务量、按需支付量、按需支付BASS与与BOSS、CRM的一体化的一体化BSS与与MSS、OSS、VAS等跨域一体等跨域一体化化对对外部客外部客户户和和应应用的一体化用的一体化片区化、网格化管理片区化、网格化管理长长尾市尾市场场、小众市、小众市场
6、场的支撑的支撑个性化、短周期需求的个性化、短周期需求的满满足足异地客异地客户户、家庭客、家庭客户户、集、集团团客客户户一点接入、全网服一点接入、全网服务务、全网客、全网客户户画像画像全国全国统统一套餐、全网一套餐、全网营销营销、统统一客服一客服实时实时数据数据获获取、取、处处理、分析理、分析智能化主智能化主动动事件触事件触发发智能管道智能管道移移动动互互联联网网对对数据架构的集中化要求数据架构的集中化要求n集中化、大容量、高集中化、大容量、高扩扩展、高可用展、高可用数据数据库库平台:支持全网型数据、跨平台:支持全网型数据、跨域数据的整合,形成集中化管理的域数据的整合,形成集中化管理的的企的企业
7、级业级数据中心数据中心n高性能:支持高性能:支持3G时时代更高的代更高的实时实时性要求、支持性要求、支持n动态资动态资源共享:支持多租源共享:支持多租户户管理、管理、资资源源动态动态按需供按需供应应n可重用、可重用、标标准化准化组组件:形成可重用件:形成可重用组组件,支持一次开件,支持一次开发发、各省共享的、各省共享的模式,形成模式,形成规规模型效益模型效益数据集中化数据集中化趋势趋势使得运使得运营营商面商面临临着海着海量数据的存量数据的存储储及分析及分析问题问题,大数据在,大数据在支撑移支撑移动业务发动业务发展展趋势趋势中,充当重要中,充当重要角色。角色。7业务融合、能力互通带来数据融合IC
8、T融合,核心网络、运营支撑和VAS业务数据的融合催生海量User Profile并集,对大数据的关联分析计算效能带来挑战IT系统集中化和行业数据价值挖掘运营商一体化集中运营和透明管控,催生巨大的经营分析数据仓库,对大数据的存储、性能、开放带来挑战移动互联网流量井喷与客户行为分析DPI和信令监测,产生的大量事件在存储和用户通信行为分析的实时处理性能带来挑战提升客户体验要求分析网络服务数据移动互联网和个人消费领域业务扩展和CEM导致海量数据的及时分析带来挑战BSS BI数据:数据:n河南河南17个地市,每天抽取正常用个地市,每天抽取正常用户户数数7000多万,多万,拨备拨备用用户户数数3000多万
9、,多万,DW层层用用户户表表总总量量1亿亿多条多条;语语音清音清单单每天每天2.7亿亿条数据条数据,GPRS清清单单每天每天4.2亿亿条数据条数据;账务账务每天每天4.7亿亿条数据条数据;GPRS文件每个文件每个100M左右,其它文件左右,其它文件25M。n日接口数据量:日接口数据量:2000G,其中,其中话单话单 220G,WAP清清单单 300G,工工单单服服务务 200G,用用户户、帐务帐务 300G,其它,其它980G。每月每月124TB数据量入数据量入库库,历历史数据保留史数据保留1年,年,总总数据量数据量1.45PB。n按照用按照用户户数数简单测简单测算算,6.5亿亿用用户户下,下
10、,总总数据量数据量 10PB!联通总部3G互联网访问记录查询及分析系统:全国每日新增10TB数据,每月近万亿条记录,要存放6个月,约 2PB的上网记录数据。上网记录入库时间小于30分钟,原始上网记录保留6个月。上网查询速度不高于1秒,并发查询数1000请求/秒。集群规模188个数据节点,存储容量2.6 PB传统传统数据数据仓库仓库无法有效存无法有效存储储日益增日益增长长的的业务业务数据存数据存储储需求需求基基础础数据数据(用户资料,产品订购信息):15G/日*365+40G*12月=5T/年考虑20%的业务增长率后为:6T/年年用户上网数据话单数据:250T/年考虑20%的业务增长率后为:30
11、0T/年年MR数据话单数据:634G/日634G/日*365=227T/年考虑20%的业务增长率后为:272T/年年BSS数据新增新增4035302520452013年下半年用户流量增长趋势日使用流量(TB)6月10月n随着业务发展数据量的增加,随着应用n复杂导致的数据量增加,这些数据量导致了数据存储和处理压力;数据仓库无法线性扩容,管理难度加大,成本高扩容压力大,效率下降等传统数据仓库只保存处理后的汇总数据。在大数据架构下需要对用户原始话单应用层数据存储层数据获取层用户层KR/CB/DM层MK层DW层ODS层现平台的数 大数据的数据保存周期 据保存周期永久保留 至少2年永久保留 至少2年5个
12、月 永久保留37天 永久保留进行长期保存。需要扩容大量存储空间。面面对对海量的数据海量的数据压压力,需要大数据平台提力,需要大数据平台提供可供供可供线线性性扩扩容的存容的存储储能力。能力。短信中心经分DMVACGN话单流媒体客服系统计费中心MC话单彩信中心MR数据BSS用户互联网联系方式(总部研究院)n每个应用需求的变化就是一场灾难。由于数据处理与业务的紧密关联可能需要对中间每个处理环节进行逐个调整。重新生成数据的周期也非常缓慢。n个数据加工流程为最终应用服务。为缓解存储压力在数据抽取和清洗阶段会过滤掉与业务无关的数据记录和字段。汇总层(MK)明细数据层(DW)报表数据标签库指标数据客户统一视
13、图DW&MKODS层层操作型数据数据源Oracle数据数据库库应应用用层层精细化营销架构242134n现网数据平台是传统关系型数据库架构。大量的用户上网、用户行为等半结构化和非结构化数据无法保存和处理,缺乏非结构化数据的处理能力。用户上网行为等互联网行为数据以结构化数据方式保存至数据仓库中。由于传统数据仓库的数据处理流程与业务保持紧密关联。整传统传统数据数据仓库仓库无法有效无法有效应对应对大数据分析需求大数据分析需求1n现网每日用户上网HTTP话单达14亿条。每月汇总的记录条数也近30亿条。随着移动互联网正在迅猛增长,传统数据仓库将很难驾驭,无法满足数据处理时限和事务处理需求。3面面对对海量的
14、数据海量的数据压压力,需要大数据平台提供快速的力,需要大数据平台提供快速的处处理能力。理能力。传统传统数据数据仓库组仓库组网将是大数据分析的瓶网将是大数据分析的瓶颈颈n现网精细化营销平台的数据库既存放着所有采集的原始数据,又承担所有的数据加工任务,还承载所有报表和业务应用的数据存储和计算。缺乏对数据分层分级及生命周期的有效管理。n系统核心架构为Oracle数据库+小型机+磁阵。数据存放在磁阵上,计算时由数据库服务器从磁阵读到本地后进行计算结果。随着数据量增长,磁盘I/O、网络带宽、数据库服务器的处理能力将存在瓶颈,处理时延严重。由于传统架构的可扩展性差,无法满足大数据的计算的扩容需求。为应对为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字化 数据 平台 规划 汇报 方案
限制150内