《市场研究的数据分析方法.ppt》由会员分享,可在线阅读,更多相关《市场研究的数据分析方法.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、市场研究的数据分析方法,第一节 线性回归分析,一、线性回归方程的基本模型 线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。 线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式-回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。,1、一元线性回归模型,模型是: 式中:为被解释变量(因变量);为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量, 与 是待估参数,称 为回归常数,为回归系数。,2、多元回归模型 多元线性回归模型中自变量的个数
2、在2个以上,模型的一般形式为: i=1,2n 其中, 为被解释变量(因变量), 为解释变量(自变量), 是随机误差项,i为观测值下标,n为样本容量, 为k+1个待估参数, 为回归常数, 称为回归系数。,在应用线性回归模型时,必须满足以下假设: (1)解释变量 是确定性变量,而且解释变量之间不相关。 (2)随机误差项具有0均值和同方差。 (3)随机误差项在不同样本点之间是独立的,不存在序列相关。 (4)随机误差限于解释变量之间不相关。 (5)随机误差项服从0均值和同方差的正态分布。,二、线性回归方程的统计检验 1、回归方程拟合优度检验 2、回归方程的显著性检验 3、回归系数显着性检验 三、回归分
3、析假设条件的检验 1、残差分析 2、多重共线性 3、误差项的序列相关,四、线性回归分析的基本步骤 1、确定回归中的自变量和因变量。 2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。 3、对回归方程进行各种统计检验。 4、利用回归方程进行预测。,例:Checkers Pizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对手是欧文公司,提供相同的产品与服务。另外麦当劳也是它的一个重要竞争者。在过去的24个月中,该公司的销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文公司产品的价格(P欧文)以及麦当劳产品的价格(P麦当劳
4、)。假定下个月公司产品价格为9.05,人均收入为26614元,欧文公司产品的价格10.2元,麦当劳产品的价格为1.15元,请预测该公司下个月的销售量。,五、实例分析,首先Checkers Pizza公司根据资料估计下面的线性需求方程的参数: Q=a+bP+cM+dP欧文+eP麦当劳 式中: Q比萨饼的销量; P比萨饼的价格 M小镇居民的人均收入 P欧文欧文公司产品的价格 P麦当劳麦当劳产品的价格,下面是SPSS11.0的输出结果:,从上面的输出结果可以看出,模型可以解释97%的比萨饼销售量的变化;模型整体非常显著,F统计的相伴概率值P=0.000;四个参数b、c、d、e非常显著,T统计的相伴概
5、率值P都远小于0.01。 所以,回归方程为: Q= -343.748 - 195.895P+0.0742M+174.403 P欧文 +81.057 P麦当劳 该公司下一个月比萨饼的销量为; Q= - 343.748 - 195.895*9.05+0.0742*26614+174.403 *10.2 +81.057 *1.15 1730.2872,第二节 判别分析,一、判别分析法的基本思想 判别分析包括以下两步: 1、分析和解释各类指标之间存在的差异,并 建立判别函数。 2、以第一步的分析结果为依据,将对那些未 知分类属性的案例进行判别分类。,二、判别分析基本模型与统计术语 (一)假设条件 1、
6、每一个类别都取自一个多元正态总体的样本 2、所有正态总体的协方差矩阵或相关矩阵都相等 (二)基本模型,1、先验概率 2、后验概率 3、判别系数 4、结构系数 5、分组的矩心 6、判别力指数 7、残余判别力,(三)统计术语,三、分析的基本步骤 判别分析一般都是通过现成的统计软件进行分析。一般而言,利用统计软件的判别分析具体包括以下步骤:,确定研究 的问题,某公司生产一新产品,该公司在新产品末大量上市以前,进行了一次市场调查。公司将新产品寄给十五个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。评估的因素有:式样、包装及耐久性。评分用10分制,高分表示特性良好,低分则较差。其中有三
7、位代理商没有表明自己的购买意愿。 那么这些代理商是属于“非购买组”还是“购买组”?,四、实例分析,以下是SPSS11.0的部分输出结果:,表中,式样 、包装和耐用性的标准化系数分别为0.91、0.083、0.254。因而,式样是最重要的判别变量,其次是“耐用性”,最后是包装。,表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组”,14号代理商属于“购买组”。,第三节 聚类分析,一、聚类分析的基本思想 聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。 样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。
8、变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。,二、距离与相似系数 (一)常用的距离指标有 1、欧式距离 2、欧式距离的平方 3、曼哈顿距离 4、切比雪夫距离,(二)常用的相似系数指标主要有 1、余弦系数 2、皮尔逊相关系数 (三)定类数据的距离 1、卡方距离 2、法方距离,三、聚类方法 1层次聚类法 2迭代聚类法 四、聚类分析的主要步骤,确定研究 的问题,某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。这次调查的指标有:喜爱的款式(老式为1,新式为2),图案(素式为1,格字为2,花纹为3);颜色(蓝色为1,黄色为2
9、,红色为3,绿色为4)。调查样本为30人。,五、实例分析:,根据聚类结果,这30名顾客分为3类,可以较好的反映这些顾客对家具的偏好类型: 第一类: 1,9,13,17,24 第二类:2,3,4,5, 6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30 第三类: 10,14,19,25,27,第四节 因子分析,一、因子分析的基本思想 因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结果。这些假设变量是不可观测的,通常称为因子。它们反映了原来众多的观测变
10、量所代表的主要信息,并能解释这些观测变量之间的相互依存关系。,二、因子分析的数学模型和相关统计量 (一) 数学模型 (二)相关统计量 1、因子载荷 2、共同度 3、因子的贡献 4、巴特利特球体检验 5、KMO指数,三、因子分析的基本步骤 1、确定研究变量。 2、计算所有变量的相关矩阵。 3、构造因子变量。 4、因子旋转。 5、计算因子得分。,四、实例分析 某公司为了了解消费者对牛肉、色、羊肉、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。请10位消费者对这五种肉类进行评分。评分采用十分制,分数越高表示越喜欢。调查结果列于下表。试用因子分析方法研究影响消费者选择食物的因素。,上表是SPS
11、S11.0输出的旋转后的因子载荷矩阵。我们可以依此推断两个公共因子的含义。从表中的数据来看,鸡、鱼、牛肉在第一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较低,故第一公共因子反映鸡、鱼、牛肉的公共特性。第一公共因子可能代表脂肪少。而羊肉、猪肉在第二公共因子的因子载荷值较高,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊肉、猪肉的公共特性,第二公共因子可能代表价格。因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素。,第五节 对应分析,一、对应分析的基本思想 对应分析,又称为相应分析,是在R型和Q型因子分析基础上,发展起来的一种多元相依的变量统计分析技术。它通过分析由定
12、性变量构成的交互汇总表来揭示变量间的关系。当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。,二、有关统计术语与资料格式 (一)统计术语 1、列联表 2、主成分 3、惯量和特征值 4、卡方、似然比卡方、曼图汉斯泽鲁卡方、法系数、列联系数 (二) 数据格式,三、分析的步骤 1、 确定研究的内容 2、 获取分析资料 3、 对列联表作对应分析 4、 解释结果意义 5、 评价分析结果,四、实例分析 某公司进行一次市场调查,得到轿车特征于一些用户特征的数据。如有: 轿车大小(大、中、小)、轿车类型(家用
13、型、跑车、商用车)、 收入(一份收入、双份收入)、状态(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、买房)等数据。现请分析它们之间的联系。,1、已婚有孩子、家用车和中型车相关性较大。 2、已婚和双份收入有联系,已婚、已婚有孩子和买房 也有一定的联系。 3、未婚、一份收入和租房之间关系紧密。 4、跑车与小型车之间也有关系。,从对应图可以推断出下面一些结论:,根据上面的结论,我们在进行市场细分、制定营销战略方面可以充分利用这些信息。例如:面向已婚家庭应重点推销中型家用车。而那些未婚、一份收入、租房的消费者,因其经济条件方面的原因,他们难以成为轿车消费的目标顾客群。另外现没有适合双份收入、已婚
14、的消费者的车型,应考虑开发新车型满足他们的需求。,第六节 多维偏好分析,一、主成分分析法简介 (一)主成分分析的基本思想 主成分分析法就是将原来众多具有一定相关性的指标(如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。 (二)主成分分析的数学模型,(三)主要统计术语 1、偏好评分 2、特征值或惯量 二、分析的基本步骤 1、确定研究的问题 2、资料的收集 3、主成分分析 4、偏好图并解释结果意义,三、实例分析 某心理学期刊作了一项市场调查,以了解自己刊物与现有的其它心理学刊物的相对定位。他们挑选10种心理学刊物,请39个专业心理学家根据他们对这些刊物的偏好按1-10的量表评分
15、,其中“1”代表低评价,“10”代表高评价。,利用SPSS Categories PRINCALS过程的“非线性”主成分分析方法对上表的资料进行分析,部分结果如下:,这些刊物表现为以下分组: 1)一个“硬”组,包括JEXP,PMET,MVBR,JAPP,或许BULL 2)一个“发展”组,包括JEDP,HUDE,2、成份加载图表:,箭头指向相同的心理学家的偏好相似。如,图形左上方的“D”组的发展和教育心理学家偏好教育心理学杂志和人类发展两种期刊。其它组心理学家的偏好也很明显,都集中指向其研究方向的期刊。,3、双图:,4、模型总结,最后结果说明,总的拟合情况好:二维顺序方案占总方差的大约82%。,
16、第七节 多维尺度法,一、多维尺度法的基本介绍 具体主要包括两步: (1)初步图形结构的构造。 (2)初步图形结构的修改。,二、统计术语与数据格式 (一)统计术语 1、接近程度 2、空间图 3、克鲁斯卡系数 4、残差 (二)数据格式 多维尺度法输入的数据是表示待比较事物之间相似程度的矩阵。,三、分析的基本步骤 1、确定研究的问题。 2、获取资料。 3、作多维尺度分析。 4、作空间图并解释结果意义。 5、评价分析结果。,四、实例分析: 在某次市场研究中,研究者调查了10位消费者,要求他们对A、B、C、D、E等五种品牌的相似性进行评分。消费者利用李克量表分别对AB 、AC、 AD、AE、 BC、 B
17、D BE 、CD、 CE 、DE中的每一对评分。其中一位消费者的评分结果为:AB=2 、AC=1、 AD=4、AE=5 BC=6、 BD=8 、BE=6 CD=3,CE=7, DE=5,从而可以得到一个相似性比较矩阵。请就此进行多维尺度分析。,将表的相似矩阵输入,利用SPSS11.0进行计算,可得到如下的概念空间图:,从该空间图可以看出,D和E相对接近。在第一维度方向,A、B、C、D、E几个品牌的差异较为明显。,第八节 联合分析,一、联合分析的基本概念与功能 联合分析方法的基本思想是,通过提供给消费者以不同的属性组合形成的产品,请消费者做出心理判断,按其意愿程度给产品组合打分、排序,然后采用数理分析方法对每个属性水平赋值,使评价结果与消费者的给分尽量保持一致,来分析研究消费的选择行为。,二、联合分析的模型和有关统计术语 (一) 联合分析的基本模型 (二)统计术语 1、分值函数 2、属性和水平 3、相对重要性权数 4、全轮廓 5、配对表 6、实验设计 7、内部有效性 8、最大效用模型,三、联合分析的基本步骤 1、确定研究对象 2、确定属性及水平 3、实验设计 4、资料的收集 5、计算属性的分值 6、评价分析的结果 7、解释结果 8、模拟市场占有率,
限制150内