商业智能产品27001.docx
《商业智能产品27001.docx》由会员分享,可在线阅读,更多相关《商业智能产品27001.docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、 企业数据仓库1、企业数数据仓库概述企业数据平平台是商业业智能体系系的基础,通通过建立层层次化的数数据仓库体体系结构、统统一的数据据模型,整整合企业生生产系统的的数据,从从而为数据据分析平台台和CRMM 等上层层应用提供供数据支撑撑。企业数数据平台沉沉淀了企业业多年来的的生产经营营数据,数数据按照存存储粒度分分为细节级级、轻度综综合级、汇汇总级,其其数据量通通常非常庞庞大,少则则几TB,多多则上百TTB,而且且每天都有有大量的生生产数据被被抽取、整整合进入企企业数据平平台,并传传送到数据据分析平台台和其他系系统,以满满足其数据据需要。如如此庞大的的数据量、吞吞吐量和复复杂的业务务逻辑,对对
2、企业数据据平台的存存取效率、数数据质量、易易管理性,易易维护性等等均提出了了很高的要要求。公司司在多年的的数据仓库库建设过程程中研发出出一套适用用于电信行行业的统一一数据模型型(该模型型中的核心心部分已经经被中国联联通作为数数据仓库模模型的标准准规范)。基基于统一数数据模型、结结合数据仓仓库技术、元元数据技术术,并对EETL 过过程进行优优化处理,公公司实现了了电信行业业海量数据据仓库的标标准化构建建和高效运运转。企业数据仓仓库(EDDW)是企企业分析型型数据的统统一存储,它它和运营数数据存储一一起构成企企业的统一一数据平台台。企业数数据仓库在在企业内部部建立统一一的数据架架构和数据据模型,沉
3、沉淀来自运运营数据存存储、生产产系统的数数据,采用用多维分析析和数据挖挖掘手段,细细分市场和和客户,为为企业内各各个部门、各各个层面的的使用者的的信息查询询获取、经经营分析、决决策支持等等需求提供供全方位的的数据支撑撑服务。企企业数据仓仓库从根本本上解决了了沉淀数据据分散重复复、共享困困难和信息息孤岛问题题,充分发发挥数据资资源价值,提提高了企业业在信息化化建设方面面的投资回回报率。系统架构系统功能1. 数据据域划分EDW的数数据存储按按域可以分分为:客户户域、产品品域、市场场营销域、服服务域、业业务域、竞竞争域。客户域以三三户模型为为基础,客客户域包含含客户、客客户对产品品的订购等等相关信息
4、息,如客户户的基本属属性、衍生生属性,客客户的消费费、欠费、缴缴费、行为为、结算、服服务、产品品订购和业业务订购等等。数据加加工主要是是以ODSS 中的营营业域、计计费域、帐帐务域、结结算域数据据进行整合合,按照分分层次、分分类别、多多维度进行行数据汇总总。产品域以产产品模型为为基础,包包括产品的的定价、产产品基础信信息、产品品目录、产产品生命周周期、产品品定位、产产品营销等等信息。数数据加工以以ODS 的营业域域、计费域域、帐务域域、结算域域等数据进进行整合,按按照分层次次、分类别别、多维度度进行数据据汇总。市场营销域域包含营销销活动、营营销能力、营营销过程、营营销结果、渠渠道等信息息。数据
5、来来源是CRRM 系统统的营销活活动、营销销计划、营营销执行、渠渠道等内容容,数据加加工在ODDS 的营营业域、帐帐务域、结结算域等数数据基础之之上按照分分层次、分分类别、多多维度数据据汇总加工工。服务域主要要包含对主主动服务和和被动服务务的信息的的分析,包包括服务能能力、服务务过程和服服务结果等等。数据加加工在ODDS 的客客服域基础础上进行主主动服务和和被动服务务的数据汇汇总。业务域从单单一业务和和组合业务务的角度分分析企业的的经营信息息,包含了了各业务的的发展、收收入、使用用等信息。数数据加工在在ODS 的客户域域、营业域域、计费域域、帐务域域、结算域域等数据基基础上,按按照业务为为主线
6、进行行分层次多多维度数据据汇总。竞争域包含含竞争对手手及其产品品、营销、发发展、话务务等信息。数数据加工在在ODS的的客户域、营营业域、计计费域基础础上,按照照对端号码码归属电信信运营商进进行多维度度、分层次次数据汇总总加工。2. 数据据加工(EETL)ETL 是是英文 EExtraact-TTranssformm-Loaad 的缩缩写,提供供数据的抽抽取、转换换和加载功功能。从源源系统中抽抽取目标数数据,按照照一定的规规则进行清清洗、集成成、转换、汇汇总等处理理工作,并并将处理之之后的数据据加载到数数据仓库的的目标层中中。为了利利用目标数数据仓库的的并行处理理能力,一一般先抽取取、加载,再再
7、做转换处处理。3. 数据据模型支撑撑企业数据仓仓库(EDDW)是为为了便于多多维分析和和多角度展展现而将数数据按特定定的模式进进行存储所所建立起来来的关系型型数据库,它它的数据基基于OLTTP 源系系统。数据据仓库中的的数据是细细节的、集集成的、面面向主题的的,以OLLAP 系系统的分析析需求为目目的。星型型模型聚合合快、分析析效率高,雪雪花型模型型结构明确确,便于与与其他数据据交互,所所以EDWW 一般采采用星型、雪雪花型综合合架构采用用面向主题题方式设计计模型,采采用自顶向向下逐层分分解方法设设计企业数数据仓库模模型。主题题域是模型型针对的业业务的某一一关注领域域或关注点点,同一个个域内的
8、实实体具有高高内聚性,不不同域的实实体之间具具有低耦合合性。主题题域的引入入有助于建建立模型框框架的整体体视图。4. 元数数据管理元数据(MMetaddata)是是关于数据据、操纵数数据的进程程,以及应应用程序的的结构、意意义的描述述信息,其其主要目标标是使数据据、程序具具有自描述述性,使数数据、程序序更易于管管理和维护护。在企业业数据平台台中提供统统一的元数数据管理手手段,对数数据库仓库库中的元数数据进行采采集、存储储、挖掘,支支持查询、分分析、维护护等操作,使使技术人员员和业务人人员可以统统一地对数数据仓库中中的元数据据进行管理理和分析,从从而更有效效地理解和和控制企业业数据平台台的运行。
9、在在元数据信信息的基础础上,通过过数据稽核核及稽核问问题管理,实实现对数据据质量的管管控。1) 元数数据采集、同同步指对表、视视图、过程程、方法等等数据库对对象进行扫扫描,获取取各数据库库对象所包包含的元数数据,将其其存储于系系统中。系系统自动检检查数据仓仓库中的对对象,保持持元数据同同步,并建建立元数据据的版本管管理。2) 元数数据关系分分析通过分析元元数据信息息,获取各各数据对象象之间的关关系。元数数据关系分分析重点关关注元数据据的血统分分析和元数数据之间的的影响分析析。通过元元数据的关关系分析,提提供冗余发发现、流程程优化、故故障诊断等等功能。3) 数据据稽核过程程包括稽核规规则配置、稽
10、稽核流程调调度、质量量报告异常常统计等。支支持对各种种类型、各各种粒度的的数据对象象采用多种种稽核规则则方法进行行质量稽核核。4) 稽核核问题管理理包括问题发发现管理、问问题发布管管理、问题题处理与跟跟踪过程管管理等,支支持对数据据质量的流流程化管理理。5) 稽核核质量查询询系统按数据据仓库的层层次、主题题域等自动动生成数据据质量报告告,并支持持以多种方方式进行查查询分析,为为系统管理理、优化、故故障诊断提提供依据。2、操作型型数据仓储储概述操作数据仓仓储(ODDS)是企企业数据平平台的重要要组成部分分,整合企企业生产系系统的数据据,是各生生产系统的的统一接口口平台,为为企业各个个系统提供供接
11、口数据据服务。运运营数据存存储在企业业运营数据据层面起到到数据总线线的作用,消消除了运营营数据的全全局冗余,降降低了系统统间数据交交互的复杂杂度,降低低了上层应应用的开发发成本,并并使数据质质量得到保保障。系统架构系统功能1.数据域域划分ODS的数数据存储按按域可以分分为:营业业域、计费费域、帐务务域、缴费费域、结算算域、资源源域、客户户域。营业域数据据来源是营营业厅营业业系统、CCRM 系系统、网上上营业厅系系统、电子子渠道等系系统。营业业域包含客客户资料信信息和用户户受理、开开通等业务务相关的内内容,是其其他数据域域的基础。由由于数据来来源于不同同厂家的各各种业务系系统,数据据加工重点点做
12、数据的的完整性、合合法性、一一致性校验验。实体主主要包含客客户信息、账账户信息、订订购资料、状状态变更流流水、资费费变更流水水以及用户户协议信息息等。计费域数据据来源是不不同业务的的计费系统统。模型核核心为用户户行为模型型。计费域域包含与用用户行为相相关信息,是是其他数据据域的基础础。数据加加工主要做做用户通话话行为的分分业务、分分类别、分分层次汇总总加工。实实体主要包包含用户通通话行为、用用户增值行行为、用户户上网行为为等。帐务域数据据来源是不不同业务帐帐务系统、计计费帐务系系统,以帐帐目帐务模模型为基础础。模型核核心为分层层次分类别别帐目模型型。帐务域域描述客户户的账户、帐帐目、账单单、帐
13、务关关系、欠费费等信息,是是基础数据据域模型。数数据加工主主要按照账账户的帐目目做分业务务、分类别别、分层次次汇总加工工。缴费域数据据来源是各各种缴费系系统,包括括营业系统统、CRMM 系统、电电子渠道、网网上营业厅厅、空中充充值等系统统。缴费域域描述帐目目费用与帐帐户的对应应关系,帐帐本与帐单单数据的销销帐关系,帐帐本金额的的使用记录录及帐单、发发票的数据据和格式信信息。数据据加工主要要按照用户户缴费类型型、缴费方方式等分层层次、分类类别、多维维度汇总加加工。结算域数据据来源是各各种结算系系统,包括括网间结算算系统、网网内结算系系统、合作作伙伴系统统、渠道管管理系统等等。结算域域描述结算算清
14、单、结结算明细账账单、合作作服务方等等信息。数数据加工主主要是对结结算明细数数据进行清清理和按照照结算类型型、结算去去向等分类类别、分层层次、多维维度数据汇汇总加工。资源域数据据来源是网网管系统、终终端系统、资资源管理系系统等,资资源可以分分为网络资资源、基站站资源、交交换机资源源、带宽资资源、号码码资源、卡卡类资源、终终端资源等等信息。数数据加工主主要是对资资源明细数数据进行清清洗、抽取取、转换和和按照资源源域相关维维度进行分分层次、分分类别、多多维度的数数据汇总加加工。客服域数据据来源是客客服系统、维维系挽留系系统、俱乐乐部管理、积积分等系统统。模型核核心为客服服模型。描描述客服、维维系挽
15、留、营营销、渠道道、积分、俱俱乐部等服服务质量相相关内容。数数据加工主主要对明细细数据做数数据一致性性、完整性性、合法性性校验,以以及对明细细数据按照照客服业务务进行数据据汇总。2.数据整整合ODS具备备完整的数数据整合流流程。由OODS 承承载企业数数据模型(EEDM),促促进企业各各系统数据据逻辑模型型的统一。通通过数据模模型的统一一,减少系系统间复杂杂的转换,提提高各系统统的效率。OODS 中中建立标准准的数据编编码目录,源源系统数据据依据标准准的数据编编码目录,经经过整合后后进入ODDS 中存存储,实现现企业运营营数据的标标准化与统统一存储。数数据整合主主要包括数数据的抽取取、清洗、转
16、转换三种。3.数据质质量管控ODS对数数据存储、整整合流程等等提供全周周期的数据据质量管控控。ODSS 系统对对抽取到的的各生产系系统的数据据进行属性性合法性检检查、数据据表关联性性检查、数数据比对稽稽核等以发发现数据质质量问题,反反馈给源生生产系统,源源生产系统统进行数据据修正后再再提交给OODS 系系统,形成成数据质量量管理的闭闭环流程,提提升运营数数据质量。4.数据模模型支撑ODS具有有统一、稳稳定的模型型支撑。运运营数据存存储(ODDS)是一一个面向主主题的、集集成的、可可变的、当当前的细节节数据集合合,用于支支持企业对对于即时性性的、操作作性的、集集成的全体体信息的需需求。采用用面向
17、主题题的模型设设计思想设设计统一的的企业数据据模型,来来集成来源源于多个生生产系统的的数据,OODS 数数据又提供供给生产系系统和企业业数据仓库库使用。EETL 的的主要工作作是按照主主数据思想想集成、清清洗来源于于多个系统统数据为统统一的数据据。主题域域是模型针针对的业务务的某一关关注领域或或关注点,同同一个域内内的实体具具有高内聚聚性,不同同域的实体体之间具有有低耦合性性。主题域域的引入有有助于建立立模型框架架的整体视视图。3、数据集集市概述数据集市是是将数据仓仓库中的数数据按照不不同角度进进行组织和和存储的过过程,数据据集市作为为EDW、OODS的数数据子集,主主要目的是是满足特定定用户
18、的应应用需求,根根据不同的的应用需求求,建立相相应的业务务主题。特特点是数据据粒度较粗粗,数据采采取星型或或雪花型结结构,较少少保留历史史数据,便便于访问分分析和快速速查询。数数据集市具具有面向特特定用户群群所需、合合理的查询询响应时间间、便于扩扩展的特点点。在实现现方式上,数数据集市原原则上采用用逻辑部署署的模式,考考虑到系统统性能和应应用效果可可以采用物物理部署的的模式,但但是数据必必须由ODDS、EDDW统一提提供。系统架构数据集市分分类数据集市的的数据按不不同的应用用需求,可可以分为本本地网数据据集市、自自助取数数数据集市、营营销维挽数数据集市、收收入稽核数数据集市、网网格营销数数据集
19、市等等。1.本地网网数据集市市本地网数据据集市的数数据包括两两类:1) 整合合层、汇总总层数据包含整合的的客户基本本信息、客客户行为类类信息、客客户消费类类信息、客客户接触类类信息等,具具体数据有有:每日提提供经过整整合的用于于考核的各各种业务量量(如装、拆拆、在网等等)基础数数据等,每每月提供业业务量考核核统计基础础数据;每每月提供经经过整合的的分产品、分分行业的月月计费基础础数据等;每日提供供经过整合合的网间分分运营商、分分类型的结结算数据等等。2) 接口口层数据来源于ODDS、EDDW接口层层,为本地地网数据集集市提供生生产系统原原始数据。每每日提供昨昨日CRMM 的客户户资料、产产品资
20、料、订订单资料、营营销活动资资料等增量量数据,每每月提供CCRM全量量数据一份份;每日提提供昨日计计费账务系系统的话单单增量数据据、日欠费费全量数据据,每月提提供全量月月计费帐单单数据等;每日提供供结算系统统的分运营营商、分结结算类型的的各类结算算增量数据据;每日提提供资源管管理系统、服服务开通系系统中用户户资源与业业务开通等等增量基础础数据,每每月提供对对应全量数数据。2.自助取取数数据集集市自助取数主主要满足对对客户、产产品、帐户户三户信息息及详单级级的取数,数数据内容涵涵盖客户信信息、产品品、附属产产品基本信信息、账单单、详单汇汇总信息等等。按月汇总表表:包括帐帐单月汇总总信息、详详单月
21、汇总总信息、小小灵通短消消息月汇总总信息、主主产品实例例月汇总信信息、帐户户月汇总信信息和客户户月汇总信信息等。按日更新表表:主产品品、附属产产品实例、客客户的基本本信息等。3.营销维维挽数据集集市营销维挽数数据集市包包含营销维维挽宽表数数据、营销销维挽共享享数据和营营销维挽事事务数据三三部分。营销维挽宽宽表数据是是经过一定定的ETLL处理流程程,通过一一定粒度汇汇总的,面面向主题的的数据集,包包括客户属属性、客户户拥有、客客户行为、客客户价值、客客户服务类类数据、客客户营销接接触类数据据、客户离离网、过网网行为、移移动增值业业务、客户户历史营销销信息等基基础类数据据,以及基基于基础数数据生成
22、的的客户属性性细分、客客户拥有量量统计、客客户行为量量统计、客客户价值量量统计、移移动增值业业务量统计计、增值业业务量统计计、营销过过程评估类类和效果评评估数据等等衍生类数数据。营销维挽共共享数据包包括营销客客户视图信信息和目标标客户清单单等各渠道道协同所用用到的数据据。其中客客户营销视视图信息数数据主要包包括:客户户属性信息息、客户拥拥有信息、客客户行为信信息、客户户价值类信信息、客户户交互类信信息、客户户离网类信信息、移动动业务专有有类信息、移移动业务增增值信息等等多种客户户相关信息息;客户名名单主要包包括对应维维挽方案的的目标客户户清单,包包含客户编编码,客户户名称等信信息;营销销维挽方
23、案案包括方案案类型、渠渠道标识、执执行人等信信息;客户户接触信息息主要包括括接触时间间、接触渠渠道、接触触人员等信信息。营销维挽事事务数据则则包括营销销维挽规则则因子配置置和管理、维维挽方案管管理等事务务功能性数数据。其中中维挽规则则因子信息息,包括规规则因子的的类型、用用途、维挽挽规则类型型、维挽规规则用途、紧紧急程度、可可见范围、生生失效时间间等;营销销维挽方案案包括方案案类型、营营销维挽方方案编码、营营销维挽方方案类型、渠渠道标识、执执行人等信信息。4.收入稽稽核数据集集市收入稽核数数据集市以以支撑收入入保障为目目的,围绕绕收入稽核核点,抽取取某个时间间点所有涉涉及收入稽稽核范围的的相关
24、系统统的数据,并并开展一致致性比对和和分析,从从而发现收收入流失问问题。收入稽核数数据集市的的数据内容容包括客户户和产品的的状态、订订单、使用用记录、计计费出账处处理的规则则和流程、配配置参数信信息等。数数据频度基基本以月为为单位。5.网格营营销数据集集市网格营销数数据集市的的目的是支支撑以网格格为最小单单元进行市市场营销、指指标分配、绩绩效考核等等工作任务务的执行,网网格营销数数据集市整整合了客户户、产品、收收入信息、业业务资源使使用信息、实实物资源地地理定位信信息、人力力资源信息息。二、 数据分析平平台1、客户统统一视图概述客户统一视视图是一个个企业对客客户的了解解,是一个个完整的3360
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商业 智能 产品 27001
限制150内