决策树方法介绍.ppt
市场细分技术培训介绍主要内容市场细分的统计方法简介市场细分的基本原理聚类分析因子分析+主成份分析判别分析+logistic回归分类树CHAID与Conjoint关于Conjoint Analysis培训介绍的仍然是传统的Conjoint分析-全轮廓(Full Profile)法介绍了SPSS正交设计产生的方法SPSS中Conjoint语法SPSS中Conjoint结果解释Conjoint市场占有模拟可供市场细分的变量地理变量地理变量人口变量人口变量年龄,性别,年龄,性别,家庭规模,生命周期家庭规模,生命周期,收入收入 社会心理社会心理社会阶层,生活方式社会阶层,生活方式 性格性格行为变量行为变量场合,利益,场合,利益,使用量使用量地区、城市地区、城市CHAID的应用背景对于判别分析与Logistical回归中的自变量,通常要求是定距变量(Interval Scaled)但是在调查中,人口统计变量通常是类型变量(Category)或离散变量,而且通常是多个类型的变量。CHAID提供了一种在多个自变量中自动搜索能产生最大差异的变量方案案例在碳酸饮料市场细分研究中,我们探索是否可以根据对碳酸饮料的消费行为差异来细分市场。我们调查了消费者的每周消费量以及与消费者相关的背景资料(地区、年龄、性别、收入类型、教育、婚姻,家庭规模等)在传统方法上,我们可以通过检查背景资料交叉表,看不同类型消费者的消费量是否存在差异。但是,这种检查非常费时,而且容易造成遗漏。通过决策树模型,可以迅速地检查按照每个预测(背景)变量分类可能产生的结果,并可以对分类自动归并,选择最佳分类方式,从而达到每个细分市场差异最大化的目的。CHAID方法CHAID(卡方自动交互检测Chi-Square Automatic Interaction Detection)是一种基于目标变量自我分层的方法。在形式上,CHAID非常直观,它输出的是一个树状的图形。它以因变量为根结点,对每个自变量进行分类,计算分类的卡方值。如果几个变量的分类均显著,则比较这些分类的显著程度(P值的大小),然后选择最显著的分类法作为子节点。CHIAD可以自动归并自变量中类别,使之显著性达到最大。最后的每个叶结点就是一个细分市场CHAID的适用范围当预测变量是分类变量时,CHAID方法最适宜。对于连续型变量,CHAID在缺省状态下将连续变量自动分为10段处理,但是可能有遗漏。当预测变量是人口统计变量时,研究者可以很快找出不同细分市场特征,免去对交叉分析表归并与检查之苦。CHAID的分析步骤确定因(目标)变量:因变量在市场研究中通常是消费者对产品的购买/使用行为,比如是否某产品的购买者等。确定自变量(预测变量):自变量的确定相对简单,可以选择较多的变量让计算机自动挑选:地理变量、人口统计变量、生活方式等心理变量。分析GAIN TABLE,解释分类结果。SPSS Answer TreeSPSS Answer Tree 3.0集成了CHAID,CART,QUEST等决策树方法。SPSS Answer Tree操作方便,可以很容易地就能比较群体轮廓和细分市场。4个模块都是通过检查数据库中所有可供分类的变量,来将自变量划分为最佳的小类。CHAID快速高效多树型分析法,速度快;完全CHAID完全多树型分析法,每步分为最显著的2类,相对较慢;但分类结果可能更加全面。CART(分类和回归树)一种完全两分类树型分析法则,用来分割数据和产生精确的同质性子集;QUEST只能在目标变量是类型变量的时候采用。CHAID界面1模型选择CHAID 界面2目标变量预测变量频率变量(加权)定义变量类型CHAID界面3不校验树图CHAID界面4高级选项中有一些关于模型的重要选项CHAID输出结果图一级变量二级变量二级变量三级变量检验统计量Gain Table细分市场的利润指数最终的5个节点(细分市场)演示:9901.sav关于其它决策树方法除了CHAID方法之外,其他方法CART,QUEST,C5.0(在SPSS的数据挖掘软件中 Clementine中采用)等方法均可以用于市场细分。CHAID 作用一种最常见的决策树方法,已经被许多市场研究公司为作市场细分的基础工具。问题?