某电信经营分析与决策支持系统数据挖掘分析(共12页).doc
《某电信经营分析与决策支持系统数据挖掘分析(共12页).doc》由会员分享,可在线阅读,更多相关《某电信经营分析与决策支持系统数据挖掘分析(共12页).doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上XX电信经营分析与决策支持系统二期数据挖掘分析1 前言小灵通用户是XX电信企业利润的主要来源之一,也是市场竞争的焦点。在目前的市场形势下,发展新客户的成本远远大于留住已有客户的成本。因此加强对小灵通用户的营销和服务工作,减少小灵通用户的流失,是XX电信的重要任务。目前在XX电信经营分析与决策支持系统中,存在对离网小灵通数据的事后分析,但是这样的分析无法做到提前预警,挽留用户。利用数据挖掘技术则可以发现离网小灵通用户的潜在模式,提前进行预测,从而变被动服务为主动服务。CRISPDM(cross-industry standard process for data min
2、ing)是一个跨行业的、以用户为中心,交互式的数据挖掘标准流程,是目前数据挖掘领域内较成熟的方法论。它将数据挖掘过程分为商业理解、数据理解、数据准备、建立模型、模型评估和结果部署等6个阶段。本挖掘分析遵循数据挖掘标准流程,讨论小灵通用户流失预测模型建立的方法和过程,并对预测结果进行分析,以帮助业务人员及时、准确地做出针对性营销服务。2 后付费小灵通用户离网预测2.1 理解商业理解是从业务角度来理解数据挖掘的目标和要求,再转化为数据挖掘问题。本挖掘分析的目标确定为:针对目前在网的后付费小灵通数据进行离网概率的预测。该目标涉及后付费小灵通用户和离网两个概念。其中,后付费小灵通在业务系统中已有标识;
3、离网的用户定义为主动及被动拆机用户。2.2数据理解数据理解的任务是对原始数据进行收集和熟悉,检查数据质量,对数据进行初步探索,并发现可能存在的、有分析价值的数据特征,以形成对隐藏信息的假设。2.1.1 研究对象选取以全省2007年1月离网的后付费小灵通用户为研究对象,同时选取同期在网的后付费小灵通用户作为对照研究对象。确定离网时间点为2007年1月,因此对后付费小灵通用户从2006年7月至12月共6个月的相关变量进行研究。离网用户的选取:选取2006年7月前入网,2007年1月内拆机的用户,共选出满足条件的用户31862名。在网客户的选取:2006年7月前入网,2007年1月31日状态为正常的
4、后付费小灵通用户共名。同时,为避免一些偏差数据的影响,在用户的选择中屏蔽了公免后付费小灵通用户。2.1.2 变量选取基本假设:后付费小灵通用户的行为在年度上不存在强的季节性,即后付费小灵通用户的行为特征和离网影响变量不会因为处于一年中的不同月份(季度)而发生较大变化。根据对业务的理解,选定以下3方面的变量进行数据理解:1. 后付费小灵通用户产品订购数据:主要反映用户与服务商关系的数据,如产品类型、在网时长、订购增值业务信息、是否加入套餐等。2. 用户消费行为特征数据:主要通过用户每月帐务数据反映,且这类数据可以从平均水平和变动情况2个方面来反映。本挖掘分析采用离网时间前6个月,用户的帐务数据变
5、化情况来反映用户消费行为的变动。主要数据包括:用户6个月的收入、平均月租费、市话费、传统长话费、IP长话费,以及用户平均月租费占总费用的比例、6个月总收入波动率(最大收入-最小收入)/平均收入)等3. 用户其他行为特征数据:如欠费时长、累计欠费金额等。2.2 数据准备数据准备阶段初步完成变量的选择和导出变量的生成,同时对一些存在数据质量问题的字段进行相应的处理。首先按照选取的数据范围和变量生成数据,如下图结构:在Clementine中对数据进行实例化分析,数据结果如下所示1. 后付费小灵通用户产品订购数据:主要反映用户与服务商关系的数据,如产品类型、在网时长、订购增值业务信息、是否加入套餐等。
6、此部分数据来自于97系统用户资料,经检测,除入网时长外,这些数据准确度较高,无缺失值和偏差值。从上图可看出,入网时长取值范围为6个月到24071个月,很明显,存在错误数据。故将超过入网时长在180个月(15年)以上的用户(共3314个),定义为入网时长180个月。因总数据量大,此操作直接在数据库中进行。2. 用户消费行为特征数据:主要包括:用户6个月的收入、平均月租费、市话费、传统长话费、IP长话费,以及用户平均月租费占总费用的比例、6个月总收入波动率(最大收入-最小收入)/平均收入)等。经数据质量核查,发现有部分用户6个月收入都为0。这些数据(共88322条记录)中,绝大部分是由于97、计费
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电信 经营 分析 决策 支持系统 数据 挖掘 12
限制150内