某运营商数据挖掘项目汇报(ppt 37页)6cnto.ppt
《某运营商数据挖掘项目汇报(ppt 37页)6cnto.ppt》由会员分享,可在线阅读,更多相关《某运营商数据挖掘项目汇报(ppt 37页)6cnto.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、某运营商数据挖掘项目汇报某运营商数据挖掘项目汇报_ _新增用新增用户维系户维系2010年3月-2-新增用户维系基本流程新增用户维系基本流程1、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别流失高危用户群在网异动用户群正常用户群异动预警监控异动预警监控1、维系策略方案生成渠道养卡监管措施重入网与反复用户管控措施正常低网龄用户维系措施2、维系方案实施营销案实施流程维系渠道维系方式维系策略及方案维系策略及方案1、维系情况反馈2、目标达成情况3、维系效果评估:渠道养卡识别及监管重入网与反复重入网正常低网龄用户维系维系效果评估维系效果评估1、新增用户分群:渠道养卡
2、重入网与反复重入网用户正常低网龄用户细分根据正常低网龄用户偏好进行细分新增用户分群新增用户分群建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。方案并实施,实现新增用户保有。-3-渠道养卡识别与监控渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系新增用户维系新增用户维系 -4-柳州渠道养卡行为特征及监控思路建议柳州渠道养卡行为特征及监控思路建议p产品:产品:渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州2种类型产品均被渠道选择使用pA
3、RPUARPU:渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于15元p主叫时长:主叫时长:渠道养卡号码主叫时长非常低,研究发现柳州有70%以上无通话行为,有通话行为用户主叫时长主要集中在3分钟以内p用户状态:用户状态:研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第1-3个月p消费情况:消费情况:同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致p激活激活IMEIIMEI:养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活IMEI一致柳州渠道养卡行为特征柳州渠道养卡行为特征p制定疑似养卡渠道的判断规则:从
4、渠道发展用户的产品、ARPU、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;p制定疑似养卡号码的判断规则:从用户消费情况、激活IMEI等进行判断,符合一定标准的号码为疑似养卡号码;p分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序养卡行为监控思路建议养卡行为监控思路建议通过研究发现柳州渠道养卡行为特征及监控思路建议如下:通过研究发现柳州渠道养卡行为特征及监控思路建议如下:-5-以上判断标准,都以同一渠道发展的用户作为判断基础数据;判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量 对养卡号码的判断模型是对渠道
5、养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。疑似养卡渠道和养卡号码判断规则疑似养卡渠道和养卡号码判断规则疑疑似似养养卡卡渠渠道道p产品:产品:渠道新增用户中,30%以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道p主叫时长主叫时长:渠道新增用户中,50%以上或100人以上的用户入网当月和次月主叫时长在3分钟内,该渠道为疑似养卡渠道p用户状态:用户状态:渠道新增用户中,入网后在第3个月,30%以上的用户状态为停机流失,该渠道为疑似养卡渠道疑疑似似养养卡卡号号码码p消费情况消费情况:a.出现5个或以上号码号码入网当月和次月主叫时长
6、都在3分钟内;b.或出现5个或以上号码号码入网当月和次月消费在5元以内;c.或出现2个以上号码入网当月或次月应收费完全一致,这些号码为疑似养卡号码p激活情况:激活情况:a.出现5个或以上号码号码激活IMEI一致;b.或2个或以上号码登记身份证号一致这些号码为疑似养卡号码pARPUARPU:渠道新增用户中,30%以上或100人以上的用户入网当月和次月ARPU低于5元,该渠道为疑似养卡渠道-6-渠道养卡识别与监控 重入网与反复重入网管理重入网与反复重入网管理 正常低网龄用户维系新增用户维系新增用户维系 -7-重入网与反复重入网(跳蚤)用户识别规则重入网与反复重入网(跳蚤)用户识别规则N NN+1N
7、+1N-6N-6N-4N-4N-5N-5N-2N-2N-3N-3N-1N-1新入网激新入网激活月活月新入网激新入网激活后第活后第1 1月月新入网激活月前半年的存量用户历史新入网激活月前半年的存量用户历史IMEIIMEI库或身份证库库或身份证库N N月在网用月在网用户,区分户,区分新增和存新增和存量用户量用户判断重入网用户判断重入网用户判断新入网用户判断新入网用户的有效的有效IMEIIMEI或身或身份证号码份证号码N N月新入网用户中月新入网用户中的重入网和反复重的重入网和反复重入网用户名单入网用户名单剔除无效剔除无效IMEIIMEI或身或身份证号码份证号码生成、维护历史生成、维护历史有效有效I
8、MEIIMEI库或身库或身份证号库份证号库重入网:重入网:新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。如,9月新入网用户IMEI或身份证号与3月到8月用户IMEI或身份证号码库匹配后,得到9月新入网用户中重入网用户。反复重入网(跳蚤用户):反复重入网(跳蚤用户):重入网用户在6个月以内重入网2次及2次以上的用户。识别规则:识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如
9、下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。-8-用户重入网主要原因分析用户重入网主要原因分析产品产品产品产品价格价格价格价格促销促销促销促销/宣传宣传宣传宣传渠道渠道渠道渠道产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题预存费用低,用户入网门槛不高,使其可以轻易弃卡新入网促销活动优惠力度过大品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足部分社会渠道迫于指标压力或利益驱动,诱导用户换卡社会渠道虚假激活,通过养卡恶意套取酬金
10、追求经济收益,受入网优惠的吸引换取吉祥号码欠费竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网公司内部公司内部竞争对手竞争对手用户用户服务服务服务服务补卡成本高,手续复杂,补卡不如买新卡欠费提醒不及时,欠费后被停机,选择重入网-9-从产品、促销、渠道、传播、服务等多方面入手加强重从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率入网与反复重入网管理,降低重入网比率重入网与反复重入网管理措施重入网与反复重入网管理措施加强入网促销活动管理,减少促销活动对在网用户的干扰;提高入网首次预存费用,增加在网时长;
11、用户忠诚度管理:网龄营销。产品/促销传播渠道服务加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。采用户外广告、报纸等大众媒体及营业厅、10086短信、网站、WAP等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。加强欠费管理,减少无效欠费;主卡付费+亲情网;账户低余额时充值提示;优惠或免费补卡;推荐带号转品牌或带号转套餐。-10-渠道养卡识别与监控 重入网与反复重入网管理 正常低网龄用户维系正常低网龄用户维系新增用户维系新增用户维系 -11-正常低网龄用户维系基本策略正常低网龄用户维系基本策略剔除了渠道养卡用户和反复重入网用户后所获得的正常低网龄用户是新增用户流失
12、控制的重点。运用数据挖掘方法,识别出不同流失预警级别的用户,针对高危用户和异动用户分别采取针对性的营销捆绑手段进行维系,同时结合网龄营销,延长用户生命周期。正常低网龄用正常低网龄用户分群户分群用户用户重绑:重绑:针对高危用户在网黏性已很弱的特点,采取较大力度的营销捆绑策略,以返还周期短的财务捆绑和力度较大的业务捆绑为主,以服务捆绑为辅。力保:力保:针对异动用户尚处于流失犹豫期、还具有一定黏性的特点,维系策略将以强化用户的业务黏性为重点,以业务捆绑和较长返还周期的财务捆绑为主,以服务捆绑为辅。全用户常规保有(不研究)。细分用户群细分用户群细分用户群细分用户群基本策略基本策略基本策略基本策略流失高
13、危流失高危用户用户在网异动在网异动用户用户相对稳定相对稳定用户用户-12-多级预警,多级维系多级预警,多级维系 在模型挖掘的基础上,准确判别正常低网龄用户的流失倾向,根据用户流失概率的高低分别实施针对性的维系策略和措施,对可能流失的用户提前预防,多级维系,有效地防止用户流失。流失异动用户流失异动用户营销捆绑日常维系及异动监控办理未办理模型匹配低网龄用户低网龄用户流失高危用户流失高危用户是否流失流失未流失112一级匹配和维系;二级匹配和维系。12-13-正常低网龄用户细分、预警及维系框架正常低网龄用户细分、预警及维系框架精准营销模型精准营销模型新新增增用用户户细细分分模模型型用户价值在网时长渠道
14、偏好促销偏好用户号码消费特征用户清单用户清单话费余额新增网用户流失模型新增网用户流失模型商务高端用户群商务高端用户群长途话务突出群长途话务突出群本地话务突出群本地话务突出群本地低端用户群本地低端用户群数据业务发烧群数据业务发烧群漫游突出用户群漫游突出用户群数据业务兴趣群数据业务兴趣群本地话务偏好群本地话务偏好群在网异动用户在网异动用户流失高危用户流失高危用户长途话务突出群长途话务突出群本地话务突出群本地话务突出群本地低端用户群本地低端用户群漫游突出用户群漫游突出用户群数据业务突出群数据业务突出群本地话务偏好群本地话务偏好群当月新增用户当月新增用户其他新增用户其他新增用户营销案营销案-14-用户
15、流失预警和细分建模过程用户流失预警和细分建模过程n 流失现状分流失现状分析析n 流失原因分流失原因分析析n 流失用户特流失用户特征分析征分析n 流失预警建流失预警建模目标沟通确模目标沟通确定定n 流失细分模流失细分模型目标沟通确型目标沟通确定定n 根据建模要求根据建模要求和现有数据情况,和现有数据情况,构思、沟通和确构思、沟通和确定建模数据提取定建模数据提取需求需求 n 提取提取0909年年1-101-10月新增用户在月新增用户在1-1-1010月的自然属性月的自然属性和消费行为数据和消费行为数据n 提取提取0909年年1010月月新增用户在新增用户在1010月月的日消费行为数的日消费行为数据
16、据n 数据质量审核数据质量审核n 数据探索数据探索n 非正常用户的非正常用户的剔除。根据渠道剔除。根据渠道养卡和跳蚤用户养卡和跳蚤用户识别模型提取异识别模型提取异常用户常用户n 数据抽样。确数据抽样。确定建模用户集合定建模用户集合n 建模衍生变量建模衍生变量计算。根据提取计算。根据提取的基础数据宽表的基础数据宽表计算衍生变量计算衍生变量n 建模变量筛选建模变量筛选 特征建模分析特征建模分析 卡方分析卡方分析 方差分析方差分析 双变量分析双变量分析 Pearson Pearson相关分析相关分析 wald wald显著性检验显著性检验 量重要性分析量重要性分析 n 建模变量数据建模变量数据转换转
17、换 对数变换对数变换 标准化变换标准化变换n 确定建模用户确定建模用户集集n 确定建模用户数确定建模用户数据集据集n 采用采用TwoTwo StepStep聚类算法,建立用聚类算法,建立用户细分模型户细分模型 月数据用户细分月数据用户细分模型(高价值模型(高价值 用户用户和在网和在网2 2月及月及2 2月以月以上的新增用户细分上的新增用户细分 日数据用户细分日数据用户细分模型(在网模型(在网1 1月新月新增用户细分)增用户细分)n 业务解释聚类结业务解释聚类结果,调整模型参数果,调整模型参数和建模变量,直到和建模变量,直到得到满意结果得到满意结果n 确定建模用户确定建模用户集集n 确定建模用户
18、确定建模用户数据集数据集n 采用逻辑回归采用逻辑回归和决策树算法建和决策树算法建立流失预警模型立流失预警模型 在网在网2 2月新增用月新增用户流失预警模型户流失预警模型 在网在网2 2月以上新月以上新增用户流失预警增用户流失预警模型模型 在网在网1 1月新增用月新增用户流失预警模型户流失预警模型n采用生存分析算采用生存分析算法建立高价值用法建立高价值用户流失预警模型户流失预警模型n 模型的评估模型的评估 提升图、收益图提升图、收益图 混淆矩阵。准确混淆矩阵。准确率和查全率率和查全率n 模型的优化模型的优化 建模训练集比建模训练集比例例 异常值处理异常值处理 建模变量建模变量 建模方法建模方法
19、模型参数模型参数 显著性检验方显著性检验方法法 显著性检验变显著性检验变量剔除阈值量剔除阈值 树的深度和页树的深度和页节点记录个数节点记录个数 -15-数据提取数据提取数据清洗数据清洗数据数据审核核数据集成数据集成 数据挖掘数据挖掘宽表构建表构建 缺失数据缺失数据处理理 极极值数据数据处理理 错误数据数据处理理 冗余数据冗余数据处理理 数据数据统计错误审核核 数据源数据源错误审核核 数据数据统计口径口径审核核数据准备确保建模数据的完整性、可用性和完整性数据准备确保建模数据的完整性、可用性和完整性 提取建模所需数据提取建模所需数据数据准备数据准备-16-筛选建模变量、根据模型要求进行数据变换筛选
20、建模变量、根据模型要求进行数据变换建模准备建模准备经分数据经分数据挖掘宽表挖掘宽表变量转换变量转换变量筛选变量筛选健康度建健康度建模指标库模指标库变量清洗变量清洗-17-用户细分采用凝聚层次聚类算法用户细分采用凝聚层次聚类算法选择选择初始化初始化初始化初始化更新更新结束结束计算包含每对样计算包含每对样本间距离(如欧氏本间距离(如欧氏距离)的相似矩阵,距离)的相似矩阵,把每个样本作为一把每个样本作为一个簇个簇使用相似矩阵查使用相似矩阵查找最相似的两个簇找最相似的两个簇将两个簇合并为将两个簇合并为一个簇,簇的个数一个簇,簇的个数通过合并被更新;通过合并被更新;同时更新相似矩阵,同时更新相似矩阵,将
21、两个簇的两行将两个簇的两行(两列)距离用(两列)距离用1 1行(行(1 1列)距离替列)距离替换反映合并操作。换反映合并操作。当所有样本都合当所有样本都合并成一个簇或满足并成一个簇或满足指定的簇的数目时,指定的簇的数目时,整个过程结束。整个过程结束。层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每一条记录看作一个类,然后根据一些规则将他们聚合成越来越大的类,直到满足一些预一条记录看作一个类,然后根据一些规则将他们聚合成越来越大的类,直到满足一些预先设定的条件。先设定的条件。1 1 2 23
22、34 4执行执行n-1n-1次步次步骤骤2 2和步骤和步骤3 3-18-网龄网龄2月及以上新增用户细分模型月及以上新增用户细分模型采用SPSS及CLEMENTINE作为数据分析与聚类建模工具算法为Two Step 聚类算法使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特征更明显聚类数据集为2009年1-9月新增用户入网后第二个月,且第二月状态正常的用户的基础数据和消费行为数据数据在聚类前需进行标准化变换和极值处理本地通话次数长途通话次数计费通话时长漫游通话次数ARPU低端低端中低中低端端长途长途突出突出本地本地突出突出
23、漫游漫游突出突出商务商务GPRS流量新业务费新业务使用种类数 彩信条数 短信条数新业务费占比使用使用少少占比占比高高兴趣兴趣短信短信突出突出上网上网突出突出发烧友发烧友-19-细分群主要消费行为特征(网龄细分群主要消费行为特征(网龄=2个月)个月)-1序号序号细分群名称细分群名称细分群特征细分群特征规模占比规模占比1商务高端用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU最高为240元/户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长2.4%2漫游突出用户群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为85元/户左右,经常去外地,
24、漫游话务突出,本地及长途话务较少,且漫游通话频次最高3.9%3长途话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为120元/户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高7.6%4本地话务突出群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为120元/户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高4.7%5本地话务偏好群语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;ARPU为67元/户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,长途漫游很少1
25、4.8%6本地低端用户群语音和数据业务消费行为均较低,用消费户行为相对均衡;ARPU较低为30元/户左右,很少去外地,漫游和长途时长比例最低,平均每次通话时长最短33.5%-20-序号序号细分群名称细分群名称细分群特征细分群特征规模占比规模占比7短信突出用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为40元/户左右,数据业务消费占比高于50%,主要使用短信业务,且短信上行条数最高8.0%8GPRS突出用户群数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;ARPU为30元/户左右,数据业务消费占比高于50%,GPRS流量高,其他数据业务使用较少8.1%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 某运营商数据挖掘项目汇报ppt 37页6cnto 运营商 数据 挖掘 项目 汇报 ppt 37 cnto
限制150内