《市场数据分析方法.ppt》由会员分享,可在线阅读,更多相关《市场数据分析方法.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章市场研究的数据分析方法第六章市场研究的数据分析方法第一节线性回归分析一、线性回归方程的基本模型线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。1.一元线性回归模型模型是:式中:为被解释变量(因变量);为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,与是待估参数,称为回归常数,为回归系数。2.多元回归模型多元线性回归模型中自变量
2、的个数在2个以上,模型的一般形式为:i=1,2,n其中,为被解释变量(因变量),为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,为k+1个待估参数,称为回归常数,称为回归系数。在应用线性回归模型时,必须满足以下假设:(1)解释变量是确定性变量,而且解释变量之间不相关。(2)随机误差项具有0均值和同方差。(3)随机误差项在不同样本点之间是独立的,不存在序列相关。(4)随机误差限于解释变量之间不相关。(5)随机误差项服从0均值和同方差的正态分布。二、线性回归方程的统计检验1.回归方程拟合优度检验2.回归方程的显著性检验3.回归系数显着性检验三、回归分析假设条件的检验1.残差分析2
3、.多重共线性3.误差项的序列相关四、线性回归分析的基本步骤1.确定回归中的自变量和因变量2.从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程3.对回归方程进行各种统计检验4.利用回归方程进行预测五、实例分析例:CheckersPizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对手是欧文公司,提供相同的产品与服务。另外麦当劳也是它的一个重要竞争者。在过去的24个月中,该公司的销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文公司产品的价格(P欧文)以及麦当劳产品的价格(P麦当劳)。假定下个月公司产品价格为9.05元,人均收
4、入为26614元,欧文公司产品的价格10.2元,麦当劳产品的价格为1.15元,请预测该公司下个月的销售量。首先CheckersPizza公司根据资料估计下面的线性需求方程的参数:Qab Pc Md P欧文e P麦当劳式中:Q比萨饼的销量 P比萨饼的价格 M小镇居民的人均收入 P欧文欧文公司产品的价格 P麦当劳麦当劳产品的价格下面是SPSS11.0的输出结果:从上面的输出结果可以看出,模型可以解释97%的比萨饼销售量的变化;模型整体非常显着,F统计的相伴概率值P=0.000;四个参数b,c,d,e非常显着,T统计的相伴概率值P都远小于0.01。所以,回归方程为:Q343.748195.895P0
5、.0742M174.403P欧文81.057P麦当劳该公司下一个月比萨饼的销量为:Q343.748195.8959.050.074226614174.40310.281.0571.151730.2872第二节判别分析一、判别分析法的基本思想判别分析包括以下两步:1.分析和解释各类指标之间存在的差异,并建立判别函数2.以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类二、判别分析基本模型与统计术语(一)假设条件1.每一个类别都取自一个多元正态总体的样本2.所有正态总体的协方差矩阵或相关矩阵都相等(二)基本模型(三)统计术语1.先验概率2.后验概率3.判别系数4.结构系数5.分组的矩
6、心6.判别力指数7.残余判别力三、分析的基本步骤判别分析一般都是通过现成的统计软件进行分析。一般而言,利用统计软件的判别分析具体包括以下步骤:1.确定研究的问题2.获取判别分析的数据3.进行判别分析4.评价和解释分析结果四、实例分析某公司生产一新产品,该公司在新产品末大量上市以前,进行了一次市场调查。公司将新产品寄给15个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。评估的因素有:式样、包装及耐久性。评分采用10分制,高分表示特性良好,低分则较差。其中有三位代理商没有表明自己的购买意愿。那么这些代理商是属于“非购买组”还是“购买组”?以下是SPSS11.0的部分输出结果:表中
7、,式样、包装和耐用性的标准化系数分别为0.91、0.083、0.254。因而,式样是最重要的判别变量,其次是耐用性,最后是包装。表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组”,14号代理商属于“购买组”。第三节聚类分析 一、聚类分析的基本思想 聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。它是根据事物本身的特性研究个体分类的方法,其基本原则是同类的个体有较大的相似性,而不同类的个体的差异很大。在聚类分析中,根据分类对象的不同可分为样品聚类(Q型聚类)和变量聚类(R型聚类)两种。样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映
8、被观测对象的特征的变量值进行分类。变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。二、距离与相似系数(一)定距或定比率数据的距离和相似系数 常用的距离指标有1.欧式距离2.欧式距离的平方3.曼哈顿距离4.切比雪夫距离(二)常用的相似系数指标1.余弦系数2.皮尔逊相关系数(三)定类数据的距离1.卡方距离2.法方距离三、聚类方法1.层次聚类法2.迭代聚类法四、聚类分析的主要步骤1.确定研究的问题2.计算相似性3.聚类4.聚类结果的解释和证实。五、实例分析某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。这次调查的指标有:喜爱
9、的款式(老式为1,新式为2),图案(素式为1,格字为2,花纹为3);颜色(蓝色为1,黄色为2,红色为3,绿色为4)。调查样本为30人。根据聚类结果,这30名顾客分为3类,可以较好地反映这些顾客对家具的偏好类型:第一类:1,9,13,17,24第二类:2,3,4,5,6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30第三类:10,14,19,25,27第四节因子分析一、因子分析的基本思想因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结果。这些假设变量
10、是不可观测的,通常称为因子。它们反映了原来众多的观测变量所代表的主要信息,并能解释这些观测变量之间的相互依存关系。二、因子分析的数学模型和相关统计量(一)数学模型(二)相关统计量1.因子载荷2.共同度3.因子的贡献4.巴特利特球体检验5.KMO指数三、因子分析的基本步骤1.确定研究变量2.计算所有变量的相关矩阵3.构造因子变量4.因子旋转5.计算因子得分四、实例分析某公司为了了解消费者对牛肉、色、羊肉、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。请10位消费者对这五种肉类进行评分。评分采用十分制,分数越高表示越喜欢。调查结果列于下表。试用因子分析方法研究影响消费者选择食物的因素。上表
11、是SPSS11.0输出的旋转后的因子载荷矩阵。我们可以依此推断两个公共因子的含义。从表中的数据来看,鸡、鱼、牛肉在第一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较低,故第一公共因子反映鸡、鱼、牛肉的公共特性。第一公共因子可能代表脂肪少。而羊肉、猪肉在第二公共因子的因子载荷值较高,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊肉、猪肉的公共特性,第二公共因子可能代表价格。因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素。第五节对应分析一、对应分析的基本思想对应分析,又称为相应分析,是在R型和Q型因子分析基础上发展起来的一种多元相依的变量统计分析技术。它通过分析由定性
12、变量构成的交互汇总表来揭示变量间的关系。当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。二、有关统计术语与资料格式(一)统计术语1.列联表2.主成分3.惯量和特征值4.卡方、似然比卡方、曼图汉斯泽鲁卡方、法系数、列联系数(二)数据格式对应分析的典型数据格式是二维列联表或交叉频数表。它能清楚地表示两个定性变量之间的相互关系。三、分析的步骤1.确定研究的内容2.获取分析资料3.对列联表作对应分析4.解释结果意义5.评价分析结果四、实例分析某公司进行一次市场调查,得到轿车特征于一些用户特征的数据。
13、如有:轿车大小(大、中、小)、轿车类型(家用型、跑车、商用车)、收入(一份收入、双份收入)、状态(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、买房)等数据。现请分析它们之间的联系。从对应图可以推断出下面一些结论:(1)已婚有孩子、家用车和中型车相关性较大。(2)已婚和双份收入有联系,已婚、已婚有孩子和买房也有一定的联系。(3)未婚、一份收入和租房之间关系紧密。(4)跑车与小型车之间也有关系。根据上面的结论,我们在进行市场细分、制定营销战略方面可以充分利用这些信息。例如:面向已婚家庭应重点推销中型家用车。而那些未婚、一份收入、租房的消费者,因其经济条件方面的原因,他们难以成为轿车消费的目标
14、顾客群。另外现没有适合双份收入、已婚的消费者的车型,应考虑开发新车型满足他们的需求。第六节多维偏好分析一、主成分分析法简介(一)主成分分析的基本思想主成分分析法就是将原来众多具有一定相关性的指标(如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。(二)主成分分析的数学模型(三)主要统计术语1.偏好评分2.特征值或惯量二、分析的基本步骤1.确定研究的问题2.资料的收集3.主成分分析4.偏好图并解释结果意义三、实例分析某心理学期刊作了一项市场调查,以了解自己刊物与现有的其他心理学刊物的相对定位。他们挑选10种心理学刊物,请39个专业心理学家根据他们对这些刊物的偏好按110的量表评
15、分,其中“1”代表低评价,“10”代表高评价。利用SPSSCategoriesPRINCALS过程的“非线性”主成分分析方法对上表的资料进行分析,部分结果如下:这些刊物表现为以下分组:(1)一个“硬”组,包括JEXP,PMET,MVBR,JAPP,或许BULL。(2)一个“发展”组,包括JEDP,HUDE。成分加载图表:箭头指向相同的心理学家的偏好相似。如图形左上方的“D”组的发展和教育心理学家偏好教育心理学杂志和人类发展两种期刊。其他组心理学家的偏好也很明显,都集中指向其研究方向的期刊。双图:模型总结:最后结果说明,总的拟合情况好:二维顺序方案占总方差的大约82%。第七节多维尺度法一、多维尺
16、度法的基本介绍多维尺度法的基本思想是,将消费者对各种品牌产品的偏好和感觉资料,用r维空间的点来表示。品牌的点间距离的次序完全反映原始输入的相似次序(两种品牌间的距离越短,则越相似)。具体主要包括两步:(1)初步图形结构的构造。(2)初步图形结构的修改。二、统计术语与数据格式(一)统计术语1.接近程度2.空间图3.克鲁斯卡系数4.残差(二)数据格式多维尺度法输入的数据是表示待比较事物之间相似程度的矩阵。三、分析的基本步骤1.确定研究的问题2.获取资料3.作多维尺度分析4.作空间图并解释结果意义5.评价分析结果四、实例分析在某次市场研究中,研究者调查了10位消费者,要求他们对A、B、C、D、E等五
17、种品牌的相似性进行评分。消费者利用李克量表分别对AB、AC、AD、AE、BC、BD、BE、CD、CE、DE中的每一对评分。其中一位消费者的评分结果为:AB=2,AC=1,AD=4,AE=5,BC=6,BD=8,BE=6,CD=3,CE=7,DE=5,从而可以得到一个相似性比较矩阵。请就此进行多维尺度分析。将表的相似矩阵输入,利用SPSS11.0进行计算,可得到如下的概念空间图:从该空间图可以看出,D和E相对接近。在第一维度方向,A、B、C、D、E几个品牌的差异较为明显。第八节联合分析一、联合分析的基本概念与功能联合分析方法的基本思想是,通过提供给消费者以不同的属性组合形成的产品,请消费者做出心
18、理判断,按其意愿程度给产品组合打分、排序,然后采用数理分析方法对每个属性水平赋值,使评价结果与消费者的给分尽量保持一致,来分析研究消费的选择行为。(一)联合分析的功能1.在研究消费者的偏好和购买决策的主要影响因素时,联合分析法比传统的方法有较大的优越性2.联合分析可以将研究结果做成市场模拟模型,并能应用于未来的营销策划(二)联合分析的应用1.决定各种属性在消费者选择品牌时的相对重要性2.估计不同属性的市场占有率3.确定最受欢迎品牌的属性水平组合4.根据消费者对属性水平偏好的相似性,进行市场细分二、联合分析的模型和有关统计术语(一)联合分析的基本模型(二)统计术语1.分值函数2.属性和水平3.相
19、对重要性权数4.全轮廓5.配对表6.实验设计7.内部有效性8.最大效用模型三、联合分析的基本步骤1.确定研究对象2.确定属性及水平3.实验设计4.资料的收集5.计算属性的分值6.评价分析的结果7.解释结果8.模拟市场占有率四、实例分析某公司为了推出受消费者欢迎的小汽车,采用联合分析法进行了一次市场研究。研究中共考虑了担保、座位、价格和车速等四个属性。各属性包含的水平、6位受访者的排序结果见教材。请用联合分析法对之进行分析。1.整个样本的分析结果输出结果解释如下:(1)各属性对产品的重要性(AveragedImportance)依次为担保情况(34.49%)、座位数(33.25%)、价格(24.94%)和车速(7.32%)。因此,消费者在购车时主要考虑担保情况、座位数和价格,而不太考虑车速。(2)效用(Utility)分析的结果来看,最受欢迎的组合为五年担保(1.4992)、四座(1.3979)、14000元(2.2987)、车速为70(0.6913)。2.市场占有率的模拟给出了三个占有率模型的模拟结果,其结果相互有所差异。一般常用的是最大效用模型的结果。以最大效用模型为例,12号卡片的市场占有率最高,其特征为:5年担保、4座、7000元、时速70。该属性组合的市场占有率达33.33%,其次为2、4、11、14号卡片。而其他属性的组合则无市场。
限制150内