最新多元统计分析经典案例ppt课件.ppt
Copyright CAE2讨论议题讨论议题 我们的研究工作是什么我们的研究工作是什么? 什么是多元统计分析(什么是多元统计分析(MVA)? 为什么我们需要它为什么我们需要它? 通常的分析技术通常的分析技术 MVA详细介绍及例子详细介绍及例子: 相关分析(相关分析(Correspondence analysis) 回归回归/多元回归分析(多元回归分析(Regression / Multiple regression 因子分析(因子分析(Factor analysis) 聚类分析(聚类分析(Cluster analysis/segmentation) 结论结论Copyright CAECopyright CAECopyright CAECopyright CAECopyright CAECopyright CAECopyright CAE9相关性分析相关性分析Correspondence AnalysisCopyright CAE10结构结构 什么是相关性分析?什么是相关性分析? 尝试通过练习了解它尝试通过练习了解它 输入的类型输入的类型 设计录入的格式设计录入的格式 执行分析执行分析 解释和表述分析的结果解释和表述分析的结果Copyright CAE11什么是相关性分析什么是相关性分析? 经常也称作经常也称作 Brand Mapping 或或 CORAN Mapping Brand Mapping = Correspondence Analysis (usually) 相关性分析图相关性分析图 一种非常有用的市场研究工具,可以表述一个市场的侧面一种非常有用的市场研究工具,可以表述一个市场的侧面(市场细分,品牌定位等)(市场细分,品牌定位等)可以在可以在2维空间内同时表达多维的属性维空间内同时表达多维的属性可以更好的理解品牌和属性之间的关系可以更好的理解品牌和属性之间的关系 Copyright CAE12 帮助客户帮助客户/市场决策者市场决策者 为实施市场战略而去发现市场的空隙和优化产品的为实施市场战略而去发现市场的空隙和优化产品的定位(对于新品牌或新产品的开发定位(对于新品牌或新产品的开发/延伸)延伸) 发现市场上决定性的或显著的属性,例如对于选择发现市场上决定性的或显著的属性,例如对于选择不同品牌的重要和有显著区别的属性不同品牌的重要和有显著区别的属性Copyright CAE13什么是什么是Brand Mapping?Wan LiMagic CleanMr. MuscleLookCleans well for heavyduty cleaning *Is effective inremoving oil/greaseCleans thoroughlyBlue MoonGold FishGFLWhite CatCloroxCleans and shines in one step *Has a good fragrance *Deodorizes Is easy to useCleans well for lightduty cleaning *Is a trustworthy brand *Is non-irritating/safe to useLeaves a long-lasting shine *Leaves a shine *Copyright CAE14一个例子一个例子- 原始数据原始数据 以下这张表显示不同家庭宠物的颜色以下这张表显示不同家庭宠物的颜色CatsDogsBirdsBunniesBlack20%40%50%5%Brown10%40%40%80%White30%10%2%0%Mixed/other50%10%8%15%Copyright CAE15可能制作的分析图可能制作的分析图.20%40%50%5%10%40%40%80%20%10%50%10%15%2% 8%CatsDogsBirdsBunniesBlackBrownWhiteMixed/ otherCopyright CAE16可能制作的分析图可能制作的分析图. 20%40%50%5%10%40%40%80%20%10%2%50%10%8%15%CatDogBirdBunniesMixed/ otherWhiteBrownBlackCopyright CAE17现在我们用颜色和动物名称两个变量现在我们用颜色和动物名称两个变量来做来做2-维的图表维的图表努力来显示努力来显示.- 那些动物在颜色方面最相似,那些区别最大?那些动物在颜色方面最相似,那些区别最大?- 那些颜色更倾向那类动物那些颜色更倾向那类动物- 那些动物和那些颜色有更强的相关性,那些相关性很弱那些动物和那些颜色有更强的相关性,那些相关性很弱Copyright CAE18BROWNBLACKWHITEMIXEDCopyright CAE19BROWNBLACKWHITEMIXEDCopyright CAE20BROWNBLACKWHITEMIXEDCopyright CAE21为了建立这种立体的图表你不得为了建立这种立体的图表你不得 不不. 把那些与较多动物相关联的颜色放置在图的中央把那些与较多动物相关联的颜色放置在图的中央位置位置 把那些与较多动物相关联的颜色放置在图的边缘把那些与较多动物相关联的颜色放置在图的边缘位置位置 如果一种颜色同时与超过二种以上的动物强相关如果一种颜色同时与超过二种以上的动物强相关,这些动物将会在图中更接近,这些动物将会在图中更接近Copyright CAE22非常简单非常简单这就是相关性分析这就是相关性分析所做的事所做的事Copyright CAE23以下这张表就是依据原始数据生成的以下这张表就是依据原始数据生成的.BlackBrownWhiteMixed/ otherCatsDogsBirdsBunnies33%65.4%Copyright CAE24以下这张表就是依据原始数据生成的以下这张表就是依据原始数据生成的. BlackBrownWhiteMixed/ otherCatsDogsBirdsBunnies33%65.4%Copyright CAE25相关性分析输入数据的类性相关性分析输入数据的类性 百分比或原始数据都可以百分比或原始数据都可以 品牌的相关联的格子(通常形式)品牌的相关联的格子(通常形式) 任何具有缺省任何具有缺省/存在的分数类型存在的分数类型 切记得分数是以样本的总数而不是以单个样本切记得分数是以样本的总数而不是以单个样本为基础的为基础的Copyright CAE26设计输入类型设计输入类型 只研究数据并想到进行分析并不是一个好主意只研究数据并想到进行分析并不是一个好主意 分析应该在问卷设计以前的表述分析应该在问卷设计以前的表述/决定研究目标阶决定研究目标阶段就开始考虑段就开始考虑 如果你乡做相关性分析表如果你乡做相关性分析表 - 你通常打算使用(二分你通常打算使用(二分制)不在制)不在/在的数据类型在的数据类型 这些数据可以通过品牌与品牌或类别系列等形式收这些数据可以通过品牌与品牌或类别系列等形式收集集. i.e.Copyright CAE27设计输入类型设计输入类型 通过系列的类别通过系列的类别. 请看这个品牌的列表,然后告诉我那一个符合下述的声明请看这个品牌的列表,然后告诉我那一个符合下述的声明. 更便宜,更容易,更快更便宜,更容易,更快 品牌和品牌品牌和品牌. Now thinking about Mr Muscle, which of these statements describe Mr Muscle Now thinking about White Cat, which of these statements describe White Cat Answers can be agree / disagree ratings Better for smaller brands, when more detailed responses are necessaryCopyright CAE28复制定性研究的图表复制定性研究的图表 有时,定性研究可以得到一个关于品牌、细分市场有时,定性研究可以得到一个关于品牌、细分市场和需求定位的图表和需求定位的图表. 如果我们已经有了这些结果,我们就能在定量研究如果我们已经有了这些结果,我们就能在定量研究阶段尝试重复这一研究阶段尝试重复这一研究 它需要我们仔细思考和再设计它需要我们仔细思考和再设计 - 可能需要从定性研可能需要从定性研究人员那里得到帮助究人员那里得到帮助 最理想是同一公司内部人员最理想是同一公司内部人员 它会很有帮助(尤其对市场人员),如果它会很有帮助(尤其对市场人员),如果map 有相有相同的定位同的定位 -但是,相同的定位并不意味着什么但是,相同的定位并不意味着什么Copyright CAE29分析数据分析数据 看下面的输出结果看下面的输出结果. 是否有任何品牌或语句使是否有任何品牌或语句使MAP倾斜倾斜? 是否应该删除或增添品牌是否应该删除或增添品牌 - 或许需要删除小的品牌或许需要删除小的品牌 这幅这幅map是否有意义是否有意义? 我们能解释它吗我们能解释它吗? 品牌与语句回出现在不该出现的地方吗品牌与语句回出现在不该出现的地方吗? 检查原始数据检查原始数据-什什么原因么原因? 可以通过删除或补充某些品牌和属性来产生可以通过删除或补充某些品牌和属性来产生Maps直直到它变的较为明显,可以让使用者更容易理解到它变的较为明显,可以让使用者更容易理解 - 需需要执行者的判断要执行者的判断 最少点的限最少点的限 - 你需要至少你需要至少3个点去做一张个点去做一张 map, 4 更更好好Copyright CAE30当你看一张当你看一张map时时 . 问你自己问你自己 它意味着什么?它意味着什么? 它对理解数据有什么附加的作用它对理解数据有什么附加的作用? 它对我们所知道的市场它对我们所知道的市场/顾客的思考方式是否适顾客的思考方式是否适合合? 如果不是 - 错在什么地方? 它是否帮助我更好地了解市场它是否帮助我更好地了解市场?Copyright CAE31当你看一张当你看一张map时时 . 问你自己问你自己 一张图表总是浓缩数据并使数据变的直观,但是它一张图表总是浓缩数据并使数据变的直观,但是它也有局限性,大量的数据本身蕴涵的信息将会丢失也有局限性,大量的数据本身蕴涵的信息将会丢失 (例如仅是重要的信息被保留)。因此,相关性分析例如仅是重要的信息被保留)。因此,相关性分析图应当小的心运用和解释(例如我们不能依赖表面图应当小的心运用和解释(例如我们不能依赖表面的定位图,因为一些变量可能没有在的定位图,因为一些变量可能没有在MAP上表现出上表现出来)来)Copyright CAE32概念概念MAP(Perceptual Mapping)的基本方法的基本方法 通过因子分析程式来运行一组数据通过因子分析程式来运行一组数据 减少大量的变量(如产品属性)到小规模的基础变减少大量的变量(如产品属性)到小规模的基础变量。这些变量是高度自相关的变量,例如,受访者量。这些变量是高度自相关的变量,例如,受访者的回答模式都非常相似的回答模式都非常相似 通过因子提取来解释因子变量。高的得分意味着更通过因子提取来解释因子变量。高的得分意味着更加重要的变量已经被因子所包含加重要的变量已经被因子所包含Copyright CAE33回归分析回归分析RegressionCopyright CAE34回归分析是什么回归分析是什么? 线性回归(线性回归(Linear Regression) 画出因变量画出因变量(dependent variable)和自变量和自变量(independent variable)之间的关系之间的关系 因变量因变量 = B* 自变量自变量+ 常数项常数项 + 残差残差Copyright CAE35回归分析是什么回归分析是什么? 线性回归方程式:线性回归方程式: Y = C + bx + e Y = 产出产出(dependent variable /response variable) X = 输入变量输入变量(independent variable / regressor) c = 常量常量 (当当x=0时时) b = 斜率斜率 e = 误差误差/残差(残差(error / residual)Copyright CAE36多元回归多元回归象线性回归一样只不过有更多象线性回归一样只不过有更多的独立变量的独立变量Y = c + b1x1 + b2x2 + b3x3 + . + eCopyright CAE37多元回归在市场研究中的运用多元回归在市场研究中的运用Copyright CAE38关键的驱动因素关键的驱动因素 - 在上升的咖啡市场在上升的咖啡市场StylishFriendlinessClassyQuality of IngredientsRelaxingEase of Drinking ComfortableSophisticatedCaffine ContentModernPrideYoung/OldBitternessStage of CareerSmoothness5.05.44.74.85.96.05.04.25.66.56.46.44.56.45.9Key DriversMean Scorer2 = 0.57Copyright CAE39Value12%Buy again30%Recommend30%Price66%Customer FocusedOverall Quality14%ProductPerformanceRetail OutletStart up serviceSpeedAdd on ServicesPromotionsPhone CustService Billing0.45*0.22*0.16*0.100.020.020.02% - Top 2 box scores* Statistically significant 0.42*0.35*-0.21*0.17*Easy to useTechnically advancedIMAGE0.100.120.19*Modelavailability0.09计算机公司的客户满意关系计算机公司的客户满意关系Beta scoreCopyright CAE40回归分析意味着什么回归分析意味着什么? 我们通常认为是独立变量在某些方面影响着非独立我们通常认为是独立变量在某些方面影响着非独立变量变量 例如过度的吸烟会导致肺癌的发生例如过度的吸烟会导致肺癌的发生 在市场在市场/社会研究中,它通常表现出是社会研究中,它通常表现出是“先有鸡还先有鸡还是先有蛋的关系是先有蛋的关系”: 你喜欢某件产品是因为它很时髦还是你认为因为你喜欢你喜欢某件产品是因为它很时髦还是你认为因为你喜欢它才觉得它她时髦它才觉得它她时髦? 你喜欢一个公司是因为它有好的服务?或者你认为这个你喜欢一个公司是因为它有好的服务?或者你认为这个公司的服务很好只因为你喜欢这家公司公司的服务很好只因为你喜欢这家公司 (或者公司其他方或者公司其他方面的因素面的因素) Copyright CAE41回归分析意味着什么回归分析意味着什么? 考虑考虑 Beta 得分将可能更有意义(通常是喜好的排得分将可能更有意义(通常是喜好的排序值)序值) Beta值越大,喜好的波动越大(影响也越大)值越大,喜好的波动越大(影响也越大) 这表示这些是非常重要的属性因为他们是和喜好一这表示这些是非常重要的属性因为他们是和喜好一起变动的属性起变动的属性 在市场研究中,我们经常称它为可导出的重要性以在市场研究中,我们经常称它为可导出的重要性以此与规定的重要性相对比此与规定的重要性相对比Copyright CAE42但是我们不能说一件事情导致另一件但是我们不能说一件事情导致另一件事情的发生事情的发生Copyright CAE43回归分析假设回归分析假设. X1, X2, X3 独立的独立的 - 没有很强的相关性没有很强的相关性 如果它们强相关,我们称为多元共线性如果它们强相关,我们称为多元共线性 市场研究数据通常都有很强的内部相关性市场研究数据通常都有很强的内部相关性 例如,如果你喜欢一个品牌,你也倾向于认为它时髦例如,如果你喜欢一个品牌,你也倾向于认为它时髦、耐用、所有场合都适用、对小孩和成年人都适合等、耐用、所有场合都适用、对小孩和成年人都适合等等等 背景资料通常也是相关的背景资料通常也是相关的 -例如,年龄和收入、收入例如,年龄和收入、收入和教育程度等和教育程度等. Multicollinearity 对我们来说是一个大问题对我们来说是一个大问题Copyright CAE44最后的想法最后的想法 仔细观察数据仔细观察数据 - 作出一些散布图去看一看相关的形作出一些散布图去看一看相关的形状状 执行相关分析去寻找执行相关分析去寻找Multicollinearity 来帮助你解来帮助你解释数据释数据 记住,我们假设显著的记住,我们假设显著的Betas 是重要的是重要的 - 但是他们但是他们只能与另一个我们无法测量的因子联系在一起只能与另一个我们无法测量的因子联系在一起 例如:例如:Copyright CAE45散布图散布图 - 会议与会议与“少女吧少女吧”的关系的关系 Nightclubs/ Girlie BarsConferencesCopyright CAE46得出的结论得出的结论. 我们可以回归出在不同城市举办会议的次数通过我们可以回归出在不同城市举办会议的次数通过“少女吧少女吧”的数量,然后得出在世界不同城市举的数量,然后得出在世界不同城市举办众多会议的原因办众多会议的原因 但是,我们可能忽略了其他显著的因素,如:旅但是,我们可能忽略了其他显著的因素,如:旅馆的方便性、承受能力、中心位置、娱乐设施的馆的方便性、承受能力、中心位置、娱乐设施的便利性等潜在的因素便利性等潜在的因素 这些也可能与这些也可能与“少女吧少女吧”的收益有关系的收益有关系Copyright CAE47因子分析因子分析Factor analysisCopyright CAE48因子分析是什么因子分析是什么? 一种用来在众多变量中辨别、分析和归结出变量间的相一种用来在众多变量中辨别、分析和归结出变量间的相互互 关系并用简单的变量(因子)来描述这种关系的数据关系并用简单的变量(因子)来描述这种关系的数据分析方法分析方法Copyright CAE49因子分析因子分析 一个例子一个例子:YIQ=0.9 Xmaths+E1YIQ=0.8 Xscience+E2 YIQ=0.2 Xart+E3Xmaths 与与 Xscience 高度相关高度相关. 一个基本的因子一个基本的因子“科科学能力学能力”正是通过因子分析所得到的能够更好地正是通过因子分析所得到的能够更好地表达这两个变量表达这两个变量.Copyright CAE50因子分析做什么因子分析做什么? 识别一组观察不到的尺度(因子),这些因子已经概括识别一组观察不到的尺度(因子),这些因子已经概括了原始的变量的大多数的信息了原始的变量的大多数的信息 估计这种关系并且通过变量与因子之间的变形等式来获估计这种关系并且通过变量与因子之间的变形等式来获得因子得因子 降低原始变量的维数,为进一步的分析作准备降低原始变量的维数,为进一步的分析作准备Copyright CAE51为什么使用它为什么使用它 ? 去产生新的、更少的变量以便为后续的回归和其他分析去产生新的、更少的变量以便为后续的回归和其他分析做基础做基础. 去识别概念或产品的基本感知和特性去识别概念或产品的基本感知和特性 去制作去制作perceptual map 去改善市场研究领域多元测量的结构与方法去改善市场研究领域多元测量的结构与方法.Copyright CAE52ATTRIBUTES CONTRIBUTING TO PRODUCT/ATTITUDINAL FACTORS - IFactor 1:FactorloadingFactor 2:FactorloadingTotal(R07) Cleans well for heavy duty cleaning(R06) Is effective in removing tough stains (R04) Is effective in removing oil/grease(R05) Keeps soils and stains from building up(R08) Keeps germs/bacteria away(R22) Disinfects/kills germs(R21) Long lasting cleaning (R17) Cleans thoroughlyTotal(R13) Is non-irritating/safe to use(R15) Is safe for environment (R11) Is easy to use(R16) Deodorizes(R14) Does not leave residueCleans and kills germsSafe and easy to use47%0.760.720.690.670.580.560.540.497%0.800.750.700.630.54Copyright CAE53ATTRIBUTES CONTRIBUTING TO PRODUCT/ATTITUDINAL FACTORS - IIFactor 3:FactorloadingFactor 4:FactorloadingProtects and gives shiny surfaceBasically reliable and affordableTotal(R03) Is a trustworthy brand(R02) Cleans well for light duty cleaning(R01) Good value for money4%0.690.650.64Total(R25) Leaves a protective finish(R23) Leaves a shine(R24) Safe to surface(R20) Cleans and shine in one step5%0.830.740.690.61Copyright CAE54ATTRIBUTES CONTRIBUTING TO PRODUCT/ATTITUDINAL FACTORS - IIIFactor 5:FactorloadingFactor 6:FactorloadingWide usageNo rinseTotal(R09) Does not require rinsing(R10) Leaves long-lasting shine3%0.830.56Total(R18) Is effective on a variety of surfaces(R12) Cleans in grooves and corners3%0.790.43Copyright CAE55ATTRIBUTES CONTRIBUTING TO PRODUCT/ATTITUDINAL FACTORS - IVFactor 7:FactorloadingFavorable fragranceTotal(R19) Has a good fragrance3%1Copyright CAE56得出结论得出结论. 我们能减少变量的数量我们能减少变量的数量:大批量的变量大批量的变量少量的基本特性少量的基本特性 我们可能会忽略了显著的因子,尽管它们也是因我们可能会忽略了显著的因子,尽管它们也是因子分析的结果子分析的结果 数据的基础结构将会抽象出来数据的基础结构将会抽象出来 Copyright CAE57但是但是 针对对购买的影响因素,我们不能说一个因子针对对购买的影响因素,我们不能说一个因子比另一个因子更重要比另一个因子更重要 我们甚至更不能说那个因子直接导致购买行为我们甚至更不能说那个因子直接导致购买行为Copyright CAE58并且并且 我们可以利用因子分析得出的结果进行其他我们可以利用因子分析得出的结果进行其他的统计分析的统计分析 回归分析回归分析: 寻找出关键的驱动因素寻找出关键的驱动因素 聚类分析聚类分析: 把目标分类为某些特征更加相似的把目标分类为某些特征更加相似的细分群体细分群体Copyright CAE59聚类分析聚类分析Cluster AnalysisCopyright CAE60结构结构 什么是聚类分析什么是聚类分析? 聚类分析做什么聚类分析做什么? 聚类分析怎样使用聚类分析怎样使用? 市场细分和定位计划市场细分和定位计划?Copyright CAE61聚类的概念聚类的概念把研究目标分割成为具有相同属性的小的群体把研究目标分割成为具有相同属性的小的群体Variable BVariable ACorrespondence matrix . . . . . . . . . .Copyright CAE62聚类分析做什么聚类分析做什么? 把研究对象(人,城市,品牌等)分割成为更把研究对象(人,城市,品牌等)分割成为更加同质的细分群体加同质的细分群体 描述对象的整体结构或者各个簇之间的组织关描述对象的整体结构或者各个簇之间的组织关系系 根据每个簇的描述资料进行该簇特征的定位根据每个簇的描述资料进行该簇特征的定位 决定判别群体之间区别的显著性水平(例如:决定判别群体之间区别的显著性水平(例如:总体的总体的%) 评价一种判别簇类之间定性区别的方法评价一种判别簇类之间定性区别的方法 (例如:例如:根据背景、品牌使用、心理因素根据背景、品牌使用、心理因素)Copyright CAE63聚类分析怎样使用聚类分析怎样使用? 去识别细分市场去识别细分市场 了解购买行为了解购买行为 为市场测试确定相匹配的城市为市场测试确定相匹配的城市 在市场结构分析中去识别竞争者在市场结构分析中去识别竞争者 减少数据以便进一步的分析减少数据以便进一步的分析Copyright CAE643 个市场方面的概念个市场方面的概念大规模市场(大规模市场(Mass marketing): 一种产品一种产品 =所有所有的受访者的受访者产品类别市场(产品类别市场(Product variety marketing): 2个或更多的种类个或更多的种类 =所有手访者所有手访者* 不知道谁、为什么、怎样不知道谁、为什么、怎样* 市场的努力分散市场的努力分散目标市场(目标市场(Target marketing): 产品和营销的组合产品和营销的组合 =不同的细分不同的细分Copyright CAE65市场细分的种类市场细分的种类Base:Descriptor:Approach:PredefinedDerivedQuantity consumed (heavy vs. light)Price sensitivityBrand loyalty etc.Benefits soughtNeedsAttitudesetc.Demographics/classificationGeographicMedia usageetcDemographics/classificationGeographicMedia usagePsychographic etcCross-tabCluster analysisCopyright CAE66市场细分、目标市场和市场定位市场细分、目标市场和市场定位1. Identify bases for segmenting the market2. Develop profile of resulting segment (demographic, behavior, personality, etc.)什么是市场什么是市场细分细分?3. Develop measure of segments attractiveness (size, growing,etc)4. Select the target segments选择哪个选择哪个目标市场目标市场5. Develop positioning for each segment6. Develop market mix for each target segment (product, price, distribution, promotion, etc.)怎样选择怎样选择?Copyright CAE67最后的总结最后的总结Final thoughts.Copyright CAE68多元统计分析不能替代多元统计分析不能替代 . 好的简报好的简报 好的研究方案设计好的研究方案设计 好的运作执行和质量控制好的运作执行和质量控制 你和你的研究小组清晰的思路你和你的研究小组清晰的思路 你更好的理解正常人(非市场研究人员)如何思考和认你更好的理解正常人(非市场研究人员)如何思考和认识你所研究的市场识你所研究的市场 但是多元统计分析是一种非常重要的研究方法,你将回但是多元统计分析是一种非常重要的研究方法,你将回在工作中接触和使用它在工作中接触和使用它69 结束语结束语