《聚类分析案例.doc》由会员分享,可在线阅读,更多相关《聚类分析案例.doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流聚类分析案例.精品文档.SPSS软件操作实例某移动公司客户细分模型数据准备:数据来源于telco.sav,如图1所示,Customer_ID表示客户编号,Peak_mins表示工作日上班时期电话时长,OffPeak_mins表示工作日下班时期电话时长等。图1 telco.sav数据分析目的:对移动手机用户进行细分,了解不同用户群体的消费习惯,以更好的对其进行定制性的业务推销,所以需要运用聚类分析。操作步骤:1, 从菜单中选择【文件】【打开】【数据】,在打开数据窗口中选择数据位置以及文件类型,将数据telco.sav导入SPSS软件中,如图2所
2、示。图2 打开数据菜单选项2, 从菜单中选择【分析】【描述统计】【描述】,然后在描述性窗口中,将需要标准化的变量选到右边的“变量列表”,勾选“将标准化得分另存为变量”,点确定,如图3所示。图3 数据标准化3, 从菜单中选择【分析】【分类】【K-均值聚类】,在K-均值聚类分析窗口中将标准化之后的结果选入右边“变量列表”,客户编号选入“个案标记依据”,聚类数改为5。点击迭代按钮,在迭代窗口将最大迭代次数改为100,点击继续。点击保存按钮,在保存窗口勾选“聚类成员”、“与聚类中心的距离”,点击继续。点击选项按钮,在选项窗口勾选“ANOVA表”、“每个个案的聚类信息”,点击继续。点击确定按钮,运行聚类
3、分析,如图4所示。图4 聚类分析操作结果分析表1 最终聚类中心聚类12345Zscore: 工作日上班时期电话时长1.60559-.78990.61342-.33584.37303Zscore: 工作日下班时期电话时长.46081-.58917-.493651.18873-.29014Zscore: 周末电话时长-.14005-.15010.35845-.02375-.40407Zscore: 国际电话时长1.68250-.64550.04673.02351-.04415Zscore: 总通话时长1.62690-.94040.41420.10398.21627Zscore: 平均每次通话时长-
4、.06590-.14835-.05337-.140594.87718由最终聚类中心表可得最终分成的5个类它们各自的均值。第一类:依据总通话时间长,上班通话时间长,国际通话时间长等特征,将第一类命名为高端商用客户。第二类:依据其在各项指标中均较低,将第二类命名为不常使用客户。第三类:依据总通话和上班通话时间居中等特征,将第三类命名为中端商用客户。第四类:依据下班通话时间最长等特征,将第四类命名为日常客户。第五类:依据平均每次通话时间最长等特征,将第五类命名为长聊客户。表2 ANOVA聚类误差FSig.均方df均方dfZscore: 工作日上班时期电话时长582.3154.31433901854.
5、022.000Zscore: 工作日下班时期电话时长468.0014.44933901042.395.000Zscore: 周末电话时长39.0604.955339040.896.000Zscore: 国际电话时长443.1794.4783390926.658.000Zscore: 总通话时长605.7704.28633902115.071.000Zscore: 平均每次通话时长463.8234.45433901021.872.000由ANOVA表可根据F值大小近似得到哪些变量对聚类有贡献,本例题中重要程度排序为:总通话时长工作日上班时期电话时长工作日下班时期电话时长平均每次通话时长国际电话时长周末电话时长。同时Sig.值都为0,说明各变量对聚类均有显著地贡献(经常用Sig.值是否小于0.05来检验聚类结果是否好)。结论经过数据标准化以及K-均值聚类分析,最终我们基本实现了本次分析的目的,较为成功的对某移动电话客户进行了细分,初步了解了各类型用户的手机话费消费习惯,对日后经营有一定的指导意义。该移动运营商,可参考不同类型用户群体的手机话费习惯提出有针对性的话费服务,使经营目标达到最优。
限制150内