某运营商数据挖掘项目汇报chlw.pptx
《某运营商数据挖掘项目汇报chlw.pptx》由会员分享,可在线阅读,更多相关《某运营商数据挖掘项目汇报chlw.pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、某运营商数据挖掘项目汇报_新增用户维系2010年3月新增用户维系基本流程1、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别 流失高危用户群 在网异动用户群 正常用户群异动预警监控1、维系策略方案生成 渠道养卡监管措施 重入网与反复用户管控措施 正常低网龄用户维系措施2、维系方案实施 营销案实施流程 维系渠道 维系方式维系策略及方案1、维系情况反馈2、目标达成情况3、维系效果评估:渠道养卡识别及监管 重入网与反复重入网 正常低网龄用户维系维系效果评估1、新增用户分群:渠道养卡 重入网与反复重入网用户 正常低网龄用户细分根据正常低网龄用户偏好进行细分新增用户
2、分群 建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系 柳州渠道养卡行为特征及监控思路建议p 产品:渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州2种类型产品均被渠道选择使用p ARPU:渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于15元p 主叫时长:渠道养卡号码主叫时长非常低,研究发现柳州有70%以上无通话行为,有通话行为用户主叫时长主要集中在3分钟以内p 用户状态:研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第
3、1-3个月p 消费情况:同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致p 激活IMEI:养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活IMEI一致柳州渠道养卡行为特征p 制定疑似养卡渠道的判断规则:从渠道发展用户的产品、ARPU、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;p 制定疑似养卡号码的判断规则:从用户消费情况、激活IMEI等进行判断,符合一定标准的号码为疑似养卡号码;p 分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序养卡行为监控思路建议 通过研究发现柳州
4、渠道养卡行为特征及监控思路建议如下:以上判断标准,都以同一渠道发展的用户作为判断基础数据;判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量 对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。疑似养卡渠道和养卡号码判断规则疑似养卡渠道p产品:渠道新增用户中,30%以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道p主叫时长:渠道新增用户中,50%以上或100人以上的用户入网当月和次月主叫时长在3分钟内,该渠道为疑似养卡渠道p用户状态:渠道新增用户中,入网后在第3个月,30%以上
5、的用户状态为停机流失,该渠道为疑似养卡渠道疑似养卡号码p消费情况:a.出现5个或以上号码号码入网当月和次月主叫时长都在3分钟内;b.或出现5个或以上号码号码入网当月和次月消费在5元以内;c.或出现2个以上号码入网当月或次月应收费完全一致,这些号码为疑似养卡号码p激活情况:a.出现5个或以上号码号码激活IMEI一致;b.或2个或以上号码登记身份证号一致这些号码为疑似养卡号码pARPU:渠道新增用户中,30%以上或100人以上的用户入网当月和次月ARPU低于5元,该渠道为疑似养卡渠道 渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系 重入网与反复重入网(跳蚤)用户识别规则
6、N N+1 N-6 N-4 N-5 N-2 N-3 N-1新入网激活月新入网激活后第1月新入网激活月前半年的存量用户历史IMEI库或身份证库N月在网用户,区分新增和存量用户判断重入网用户判断新入网用户的有效IMEI或身份证号码N月新入网用户中的重入网和反复重入网用户名单剔除无效IMEI或身份证号码生成、维护历史有效IMEI库或身份证号库 重入网:新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。如,9月新入网用户IMEI或身份证号与3月到8月用户IMEI或身份证号码库匹配后,得到9月新入网用户中重入网用户。反复重入网(跳蚤用户):重入网用户在6个月以内重入网2次及2次以
7、上的用户。识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。用户重入网主要原因分析产品 产品 价格 价格 促销 促销/宣传 宣传 渠道 渠道 产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争 产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题 预存费用
8、低,用户入网门槛不高,使其可以轻易弃卡 新入网促销活动优惠力度过大 品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足 部分社会渠道迫于指标压力或利益驱动,诱导用户换卡 社会渠道虚假激活,通过养卡恶意套取酬金 追求经济收益,受入网优惠的吸引 换取吉祥号码 欠费 竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网公司内部竞争对手用户服务 服务 补卡成本高,手续复杂,补卡不如买新卡 欠费提醒不及时,欠费后被停机,选择重入网从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率重入网与反复重入网管理措施
9、 加强入网促销活动管理,减少促销活动对在网用户的干扰;提高入网首次预存费用,增加在网时长;用户忠诚度管理:网龄营销。产品/促销 传播 渠道 服务 加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。采用户外广告、报纸等大众媒体及营业厅、10086短信、网站、WAP等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。加强欠费管理,减少无效欠费;主卡付费+亲情网;账户低余额时充值提示;优惠或免费补卡;推荐带号转品牌或带号转套餐。渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系 正常低网龄用户维系基本策略剔除了渠道养卡用户和反复重入网用户后所获得的正
10、常低网龄用户是新增用户流失控制的重点。运用数据挖掘方法,识别出不同流失预警级别的用户,针对高危用户和异动用户分别采取针对性的营销捆绑手段进行维系,同时结合网龄营销,延长用户生命周期。正常低网龄用户分群用户 重绑:针对高危用户在网黏性已很弱的特点,采取较大力度的营销捆绑策略,以返还周期短的财务捆绑和力度较大的业务捆绑为主,以服务捆绑为辅。力保:针对异动用户尚处于流失犹豫期、还具有一定黏性的特点,维系策略将以强化用户的业务黏性为重点,以业务捆绑和较长返还周期的财务捆绑为主,以服务捆绑为辅。全用户常规保有(不研究)。细分用户群 细分用户群 基本策略 基本策略流失高危 流失高危用户 用户在网异动 在网
11、异动用户 用户相对稳定 相对稳定用户 用户多级预警,多级维系 在模型挖掘的基础上,准确判别正常低网龄用户的流失倾向,根据用户流失概率的高低分别实施针对性的维系策略和措施,对可能流失的用户提前预防,多级维系,有效地防止用户流失。流失异动用户营销捆绑日常维系及异动监控办理未办理模型匹配低网龄用户流失高危用户是否流失流失未流失11 2一级匹配和维系;二级匹配和维系。1 2正常低网龄用户细分、预警及维系框架精准营销模型新增用户细分模型用户价值 在网时长 渠道偏好 促销偏好 用户号码 消费特征用户清单话费余额新增网用户流失模型商务高端用户群长途话务突出群本地话务突出群本地低端用户群数据业务发烧群漫游突出
12、用户群数据业务兴趣群本地话务偏好群在网异动用户 流失高危用户长途话务突出群本地话务突出群本地低端用户群漫游突出用户群数据业务突出群本地话务偏好群当月新增用户其他新增用户营销案用户流失预警和细分建模过程n 流失现状分析n 流失原因分析n 流失用户特征分析n 流失预警建模目标沟通确定n 流失细分模型目标沟通确定n 根据建模要求和现有数据情况,构思、沟通和确定建模数据提取需求 n 提取09年1-10月新增用户在1-10月的自然属性和消费行为数据n 提取09年10月新增用户在10月的日消费行为数据n 数据质量审核n 数据探索n 非正常用户的剔除。根据渠道养卡和跳蚤用户识别模型提取异常用户n 数据抽样。
13、确定建模用户集合n 建模衍生变量计算。根据提取的基础数据宽表计算衍生变量n 建模变量筛选 特征建模分析 卡方分析 方差分析 双变量分析 Pearson相关分析 wald显著性检验 量重要性分析 n 建模变量数据转换 对数变换 标准化变换n 确定建模用户集n 确定建模用户数据集n 采用Two Step聚类算法,建立用户细分模型 月数据用户细分模型(高价值 用户和在网2月及2月以上的新增用户细分 日数据用户细分模型(在网1月新增用户细分)n 业务解释聚类结果,调整模型参数和建模变量,直到得到满意结果n 确定建模用户集n 确定建模用户数据集n 采用逻辑回归和决策树算法建立流失预警模型 在网2月新增用
14、户流失预警模型 在网2月以上新增用户流失预警模型 在网1月新增用户流失预警模型n采用生存分析算法建立高价值用户流失预警模型n 模型的评估 提升图、收益图 混淆矩阵。准确率和查全率n 模型的优化 建模训练集比例 异常值处理 建模变量 建模方法 模型参数 显著性检验方法 显著性检验变量剔除阈值 树的深度和页节点记录个数 业务与数据 分析数据准备 建模准备 细分模型 预警模型模型评估和优化数据提取 数据清洗 数据审核 数据集成 数据挖掘宽表构建 缺失数据处理 极值数据处理 错误数据处理 冗余数据处理 数据统计错误审核 数据源错误审核 数据统计口径审核数据准备确保建模数据的完整性、可用性和完整性 提取
15、建模所需数据数据准备筛选建模变量、根据模型要求进行数据变换建模准备字段过滤 变异系数 标准差 最大类别数 最小类别数数据探索 数据分布 双变量分析 正态性检验相关性分析 卡方分析 方差分析 相关分析 自相关分析建模筛选 通过建模分析字段的重要性 决策树模型,信息增益旁别 逻辑回归模型,回归系数显著性检验数据变换 标准化变换 对数变换 正态变换经分数据挖掘宽表变量转换变量筛选健康度建模指标库变量清洗用户细分采用凝聚层次聚类算法选择初始化初始化更新结束计算包含每对样本间距离(如欧氏距离)的相似矩阵,把每个样本作为一个簇使用相似矩阵查找最相似的两个簇将两个簇合并为一个簇,簇的个数通过合并被更新;同时
16、更新相似矩阵,将两个簇的两行(两列)距离用1行(1列)距离替换反映合并操作。当所有样本都合并成一个簇或满足指定的簇的数目时,整个过程结束。层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每一条记录看作一个类,然后根据一些规则将他们聚合成越来越大的类,直到满足一些预先设定的条件。1 2 3 4执行n-1次步骤2和步骤3网龄2月及以上新增用户细分模型 采用SPSS 及CLEMENTINE 作为数据分析与聚类建模工具 算法为Two Step 聚类算法 使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特
17、征更明显 聚类数据集为2009 年1-9 月新增用户入网后第二个月,且第二月状态正常的用户的基础数据和消费行为数据 数据在聚类前需进行标准化变换和极值处理本地通话次数长途通话次数计费通话时长漫游通话次数ARPU低端 中低端长途突出本地突出漫游突出商务GPRS流量新业务费新业务使用种类数 彩信条数 短信条数新业务费占比使用少占比高兴趣 短信突出上网突出发烧友细分群主要消费行为特征(网龄=2个月)-1序号 细分群名称 细分群特征 规模占比1商务高端用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU最高为240元/户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长2
18、.4%2漫游突出用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为85元/户左右,经常去外地,漫游话务突出,本地及长途话务较少,且漫游通话频次最高3.9%3长途话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为120元/户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高7.6%4本地话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为120元/户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高4.7%5本地话务偏好群语音消费行为相对数据业务消费行为更为突出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运营商 数据 挖掘 项目 汇报 chlw
限制150内