电信帐单数据挖掘(16页).doc
《电信帐单数据挖掘(16页).doc》由会员分享,可在线阅读,更多相关《电信帐单数据挖掘(16页).doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-电信帐单数据挖掘-第 13 页电信帐单数据挖掘一概述1项目背景1数据挖掘和相关概念1数据挖掘的概念和过程1数据挖掘在电信管理中的应用2项目计划3项目目标3时间安排4人员组织5二项目实施6选择数据挖掘工具6建立数据库表建立和数据清理7建立数据多维存储8维度创建8OLAP存储创建9OLAP数据分析10数据挖掘12决策树计算(月用户数量分析)13用户分类(聚类分析)14三总结15一概述1.1项目背景随着国内电信市场竞争的日趋激烈,电信运营商的经营模式逐渐从“技术驱动”向“市场驱动”、“客户驱动”转化。这就要求运营商要采取以客户为中心的策略,根据客户的实际需求提供多样化、层次化、个性化的服务解决方案
2、。因此,客户关系管理(CRM)成了电信运营商增加收入和利润,提高客户满意度、忠诚度的有效工具。在客户关系管理的流程中,为了准确、及时地进行经营决策,必须充分获取并利用相关的数据信息对决策过程进行辅助支持。近几年迅速发展起来的数据挖掘技术就是实现这一目标的重要手段。 1.2数据挖掘和相关概念数据挖掘的概念和过程 1数据挖掘的概念数据挖掘是根据企业的既定业务目标和存在的问题,对大量的业务数据进行探索,揭示其中隐藏的规律,并将其模型化,指导并应用于企业的实际经营。 数据挖掘是建立在数据仓库基础上的高层应用,但数据挖掘跟数据仓库的其它一些应用如OLAP分析、预定义报表和即席查询等有很大的区别。后三者通
3、常是用户根据已知的情况对所关心的业务指标进行分析;而前者则是在业务问题和目标明确但考察的问题不清楚时,对数据进行探索,揭示隐藏其中的规律性,进而将其模型化。 2数据挖掘过程数据挖掘是一个循环往复的过程,通常涉及数据准备、建立模型、评估和解释模型、运用和巩固模型等步骤。 (1)数据准备:数据准备工作包括数据的选择(选择相关和合适的数据)、探索(了解数据分布情况和异常数据等)、修正(包括缺失数据的插值等)和变换(离散值数据与连续值数据的相互转换,数据的分组分类,数据项的计算组合等)。 (2)建立模型:选取数据挖掘工具提供的算法并应用于准备好的数据,选取相应参数,生成模型。 (3)评估和解释模型:对
4、模型进行比较和评估,生成一个相对最优模型,并对此模型用业务语言加以解释。 (4)运用和巩固模型:对模型在实际应用中的表现进行监控,如果模型表现不好,则对模型作进一步的考察和修正,以反映业务运作规律的变化。数据挖掘在电信管理中的应用电信运营商拥有许多熟的数据库应用系统,如网管系统、财务系统、计费账务系统、112障碍管理系统、缴费销账系统等,并产生了大量的业务处理数据。如果针对客户关系管理相关决策分析的需求,对这些数据进行重组整合,就能充分利用这些宝贵的数据,体现信息的真正价值。 数据挖掘技术在电信行业主要应用领域如下:(1)客户消费模式分析客户消费模式分析(如固话话费行为分析)是对客户历年来长话
5、、市话、信息台的大量详单、数据以及客户档案资料等相关数据进行关联分析,结合客户的分类,可以从消费能力、消费习惯、消费周期等诸方面对客户的话费行为进行分析和预测,从而为固话运营商的相关经营决策提供依据。 (2)客户市场推广分析客户市场推广分析(如优惠策略预测仿真)是利用数据挖掘技术实现优惠策略的仿真,根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优惠策略中存在的问题,并进行相应的调整优化,以达到优惠促销活动的收益最大化。(3)客户欠费分析和动态防欺诈通过数据挖掘,总结各种骗费、欠费行为的内在规律,并建立一套欺诈和欠费行为的规则库。当客户的话费行为与该库中规则吻合时,系统可以提示运营商
6、相关部门采取措施,从而降低运营商的损失风险。 (4)客户流失分析根据已有的客户流失数据,建立客户属性、服务属性、客户消费情况等数据与客户流失概率相关联的数学模型,找出这些数据之间的关系,并给出明确的数学公式。然后根据此模型来监控客户流失的可能性,如果客户流失的可能性过高,则通过促销等手段来提高客户忠诚度,防止客户流失的发生。这就彻底改变了以往电信运营商在成功获得客户以后无法监控客户流失、无法有效实现客户关怀的状况。 项目计划项目目标电信公司每个月的帐单有数百万条,牵涉到千家万户,这些数据中有很多宝贵的东西,可以从这些资料中获得宝贵的资料。电信的产品非常多,主要有以下一些种类:普通电话(市内电话
7、)、长途电话、小灵通和宽带业务,这些业务是电信业务的主体;电信公司的帐单目前按自然月开帐,每个月给用户邮寄帐单;电信公司具有划分为多个区域包括(区局、分局)。项目的目标之一就是对这些数据进行分类统计,按照产品/时间/区域等对数据进行分类统计(建立三个维度),如本地、长途、宽带、小灵通用户数;本地(长途和小灵通)通话次数和平均时长,语音ARP(平均用户收入)值,宽带ARP值,小灵通ARP值等。决策树分析,统计月收入的变化情况,对用户进行聚类分析,将用户分为不同的等级。项目目标之二是进一步加深对数据挖掘的认识,通过上课,我们已经初步了解了数据挖掘的基本原理和基本算法,通过电信数据挖掘这个实践,可初
8、步掌握数据挖掘的一般过程和工具,对数据挖掘有更深刻的认识,这对今后的工作是有非常大的好处的。通过项目也可以促进项目组人员之间的了解,取长补短,共同提高技能。时间安排初步时间安排为三周时间时间安排备注第一周l 项目需求l 系统分析l 人员分工l 选择数据挖掘工具l 建立数据库表结构l 建立挖掘模型第二周 l 数据清理,转换成数据库表l 建立多维度OLAP数据存储模型l OLAP数据分析第三周l 数据挖掘l 知识发现l 编写课题报告和演示报告,演示成果人员组织二项目实施2.1选择数据挖掘工具目前市场上的数据挖掘工具比较多,一般而言,目前市场上这些数据挖掘工具又可分成两类企业型工具以及小型工具。l
9、企业型数据挖掘工具:应用在需要高处理能力、高网络容量和大数据量的场合下。这些工具通常支持多种平台,并基于客户机/服务器结构。它通常可以直接连接一些 复杂的数据管理系统(不像普通文本文件),并能处理大量的数据。这类数据挖掘工具的另一个特点是它通常提供了多种数据挖掘算法,并有能力解决多种应用问 题。企业数据挖掘工具的实例有IBM的Intelligent Miner和SAS Enterprise Miner,SPSS Clementine等。l 小型数据挖掘工具:它与企业型的工具着眼点不同。小型数据挖掘工具或者是针对低端、低消费的用户,或者是为解决特定的应用问题提供特定的解决方案。比如Oracle公
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电信 帐单 数据 挖掘 16
限制150内