市场调查资料分析.pptx
市场调查资料分析市场调查资料分析 7.1 7.1 市场调查资料分析概述市场调查资料分析概述 7.1.1 7.1.1 市场调查资料分析的意义市场调查资料分析的意义 市场调查资料分析是指根据市场调研的目的,运用多种分析方法对市场调查收集整理的各种资料进行对比研究,通过综合、提炼、归纳、概括得出调研结论,进行对策研究,撰写市场调研报告的过程。本质:数据深加工,从数据导向结论,从结论导向对策。7.1.2 7.1.2 市场调查资料分析的规则市场调查资料分析的规则 1从目的到研究:有针对性的分析,以解决所定义的市场调研问题。2从局部到整体:先从局部问题分析开始,再过渡到对整体的全面认识。3从单项到多项:先认识单项指标的变化,再过渡到对多项指标的认识。4从表层到里层:先描述现象表层的事实,再揭示内在的本质特证。5从静态到动态:“静态”和动态分析相结合,使定量认识更全面。6从结果到原因。从结果找内因和外因,以便更好地解释为什么。7从过程到规律:分析事物发展变化的过程,去认识事物变化的规律。8从规律到预测:只有先认识事物变化的规律,才能做出科学的预测。9从问题到对策:只有先搞准问题性质及原因,才能提出可行的对策。第1页/共48页7.1.3 7.1.3 7.1.3 7.1.3 市场调查资料分析的内容市场调查资料分析的内容市场调查资料分析的内容市场调查资料分析的内容 1背景分析:了解问题的来由和背景,把握分析研究的目的和方向。2状态分析:描述和评价现象的各方面的数量表现,概括现象的各种特征。3因果分析:找出影响事物变化的内因和外因,揭示的问题与原因,4对策研究:针对调查结论和启示、问题与原因,提出解决问题的对策。第2页/共48页7.1.4 7.1.4 7.1.4 7.1.4 市场调查资料分析的方法市场调查资料分析的方法市场调查资料分析的方法市场调查资料分析的方法 1 定性分析方法 是从事物的质的方面入手,利用经验判断、辨证思维、逻辑思维、创造是从事物的质的方面入手,利用经验判断、辨证思维、逻辑思维、创造性思性思维等思维方法对事物质的规定性进行判断和推理。定性分析主要是界定事物维等思维方法对事物质的规定性进行判断和推理。定性分析主要是界定事物的大的大小、变化的方向、发展的快慢、事物的优劣、态度的好坏、问题的性质。定小、变化的方向、发展的快慢、事物的优劣、态度的好坏、问题的性质。定性分性分析方法主要有:析方法主要有:(1)(1)辨证思维法。运用唯物辩证法来认识问题、分析问题和阐述问题。辨证思维法。运用唯物辩证法来认识问题、分析问题和阐述问题。(2)(2)逻辑思维法。利用逻辑推理对事物的本质属性进行判断、推理和论逻辑思维法。利用逻辑推理对事物的本质属性进行判断、推理和论证。证。(3)(3)创新思维法。利用独立性思维、求异性思维、交叉性思维、联动性创新思维法。利用独立性思维、求异性思维、交叉性思维、联动性思维思维和多向性思维等创新思维的方式对市场调研问题进行分析和思考。和多向性思维等创新思维的方式对市场调研问题进行分析和思考。(4)(4)经济理论分析法。利用经济学中所阐明的各种经济范畴、经济理论经济理论分析法。利用经济学中所阐明的各种经济范畴、经济理论和经和经济规律,对市场调研的问题进行判断和推理。济规律,对市场调研的问题进行判断和推理。(5)(5)结构分析法。是指利用分组资料,通过分析各组成分的性质和结构,结构分析法。是指利用分组资料,通过分析各组成分的性质和结构,进进而判断和认识现质属性和特征。而判断和认识现质属性和特征。(6)(6)比较判断法。是把两个同类现象或有关联的现象进行比较,从而确比较判断法。是把两个同类现象或有关联的现象进行比较,从而确定它定它们之间的相同点和不同点,或者它们之间的关联性,进而判别事物的本质属们之间的相同点和不同点,或者它们之间的关联性,进而判别事物的本质属性。性。第3页/共48页 2 定量分析方法 是从事物的数量方面入手,运用一定的统计分析方法进行对比研究,从而挖掘事物的本质特征和规律性。即从数据对比中得出分析结论和启示。(1)按研究的目的不同,分为描述性分析和解析性分析。描述性分析:着重于描述和评价现象的规模、水平、结构、比率、速度、离散程度等基本数量特征。解析性分析:着重于推断总体、解释数量关系、检验理论、挖掘数据中隐含的本质和规律性 (2)按涉及变量多少不同,分为单变量数据分析、双变量数据分析和多变量数据分析。单变量数据分析:一个统计指标或变量的对比研究。双变量数据分析:两个变量之间数量关系的分析研究。多变量数据分析:三个或三个以上变量之间的数量关系的分析研究。第4页/共48页。7.1.5 7.1.5 市场调查资料分析的程序市场调查资料分析的程序 明确调研问题界定分析内容提取数据选定方法对比研究概括结论综合集成撰写报告数据列表制图显示定性分析法单变量分析双变量分析多变量分析 计算、比较 建模、检验 推断、预测解释调研问题、展示调 研成果编辑整理、集中、综合特征、趋势关联、因果结论、启示问题性质数列类型变量多少分析需求划分构面列示子项目第5页/共48页7.2 7.2 单变量数据分析单变量数据分析 单变量数据分析是市场调查资料分析中最常用的定量分析,主要用于描述和评价调研现象的单变量或单指标的数量特征和规律。如规模、水平、结构、集中趋势、离散程度、发展速度、发展趋势等等。单变量数据分析的方法很多,下面分别介绍有关的分析方法。7.2.1 结构性分析 结构性分析又称数列分布分析,主要通过数列的频数分布或频率分布来显示总体或样本分布的类型和特征,反映总体或样本的结构与特点。数列分布的类型主要有钟型分布(正态的、右偏的、左偏的)、U型分布、J型分布等形态。不同形态的变量数列说明的问题不同,形成的内在原因也不同,应根据具体情况作具体分析。第6页/共48页 【例7.1】表7-1是某地调查的1 200名农村消费者对彩电售后服务的满意状态的评价。从表中可看出,对彩电售后服务的满意率(很满意、较满意、一般)为44.3%,不满意率为55.7%。从分布类型来看,农村城镇消费者的满意状态呈左偏分布(左边大,右小)。其深层次的原因是厂商比较注重城市彩电市场营销,农村因消费者居住分散,交通不便,售后服务存在较大的难度。第7页/共48页【例例7.27.2】表表7-27-2是某市是某市1 0001 000户居民户居民%,在,在80m280m2以下的占以下的占10.4%10.4%,在,在120m2120m2以以下的占下的占57.9%57.9%,在,在120m2120m2以上的占以上的占42.1%42.1%家庭现有住房面积的分布。可看出家庭现有住房面积的分布。可看出10001000户户居民家庭的住房面积在居民家庭的住房面积在60m260m2以下的占以下的占3.1%3.1%(累计频率分析)。样本户现有住房(累计频率分析)。样本户现有住房面积的频率分布是近似于正态分布的。由于随着居民收入的提高,居民对住房面面积的频率分布是近似于正态分布的。由于随着居民收入的提高,居民对住房面积和居房条件的改善是日益增长的,假定积和居房条件的改善是日益增长的,假定120m2120m2以下的居民户的住房面积都提高以下的居民户的住房面积都提高到到120m2120m2及以上,则全市现有及以上,则全市现有57.9%57.9%的的居民家庭低于这一水平,因此,该市房地产居民家庭低于这一水平,因此,该市房地产投资和开发仍有较大的市场潜力。投资和开发仍有较大的市场潜力。图7-3 样本房现有住房面积分布第8页/共48页 7.2.2 集中度分析 集中度分析又称集中程度或集中趋势分析,其目的在于通过测定变量值的一般水平,来评价数据分布的中心值或一般水平,衡量事物变动的集中趋势。1.品质数列集中度测定:“选项众数”。平均等级。2.变量数列集中度测定:平均数、中位数和众数。7.2.3 差异性分析 差异性分析又称离散程度分析,其目的在于测定变量值之间的离散程度或差异程度,评价平均数代表性的大小,衡量事物变动的均衡性或稳定性。1品质数列离散程度测定:等级标准差、等级标准差系数。2变量数列离散程度测定:全距、标准差、标准差系数或集中程度。第9页/共48页 【例例7.37.3】表表7-37-3是对甲、乙两市居民家用空调拥有量的调查分组资料。是对甲、乙两市居民家用空调拥有量的调查分组资料。从表从表中的频率分布来看,两个样本均呈偏态分布,大部分家庭的空调拥有量为中的频率分布来看,两个样本均呈偏态分布,大部分家庭的空调拥有量为1-1-2 2台。为了更好地说明问题,可计算得到表台。为了更好地说明问题,可计算得到表7-47-4的分析指标。可得出如下结论:的分析指标。可得出如下结论:空调普及率乙市比甲市高;空调普及率乙市比甲市高;样本平均数乙市略高于甲市样本平均数乙市略高于甲市.两个样本的分布均为右两个样本的分布均为右(低低)偏分布。偏分布。甲市样本的全距、标准差、标准差系数均比乙市大,说明甲市空调拥甲市样本的全距、标准差、标准差系数均比乙市大,说明甲市空调拥有量有量分布的离散程度比乙市要大。分布的离散程度比乙市要大。甲市空调市场的潜力比乙市要大(普及率、户均拥有量均比乙市低)。甲市空调市场的潜力比乙市要大(普及率、户均拥有量均比乙市低)。第10页/共48页 7.2.4 增长性分析 增长性分析是分析现象在一定时期内增长变化的程度和快慢,主要分析指标有增长量和平均增长量、发展速度和增长速度,平均发展速度和平均增长速度。应注重增长过程和阶段性分析。【例7.4】表7-5是某市2000-2007年城镇居民人均消费支出的动态分析。可看出,近几年,人均消费支出的逐期增长量和环比增长率均呈加速增长的趋势,人均消费支出的平均增长量316.86元,平均增长率为7.04%。第11页/共48页 7.2.5 趋势性分析 趋势性分析在于认识和掌握现象在较长时期内发展变化的总趋势和规律,以便解释和描述现象的长期发展,预测未来的变化。1图示分析法:常用动态曲线图识别长期趋势的类型.2趋势方程法:用趋势方程描述现象长期发展变化的趋势,并据此进行外推预测。常用的有常数均值方程、直线方程、指数曲线方程、二次曲线方程等。例如:由表7-5的数据,可求得人均消费支出(S)的趋势方程如下。S=3595.5714+72.3929t+25.3690t2 (R=0.9977 SE=59.35 1999年t=0)图7-4 某市城镇居民人均消费支出动态曲线 第12页/共48页 7.2.6 季节性分析 反映季节变动的淡旺季规律,可用于预测和计划分解。反映和测定季节变动方法平均季节比重、季节指数、趋势与季节模型、自回归分析。【例7.5】表7-6是某地2004-2007年分季的消费品零售额。从平均季节比重来看,第一季度和第四季度为旺季,第二季度平淡,第三季度最淡。第13页/共48页 7.2.7 循环波动性分析 单变量数据波动分析又称周期性分析或循环变动分析单变量数据波动分析又称周期性分析或循环变动分析,其目的在于揭其目的在于揭示单变示单变量动态数据波动是否存在从低到高、再从高到低的循环往复的变动规律,揭量动态数据波动是否存在从低到高、再从高到低的循环往复的变动规律,揭示不示不同时期经济变量波动的的过程、形态和周期长度,以及当前的波动走向。主同时期经济变量波动的的过程、形态和周期长度,以及当前的波动走向。主要有要有环比发展速度或增长率分析法、时间数列分解余值分析法、动态曲线图示法环比发展速度或增长率分析法、时间数列分解余值分析法、动态曲线图示法等。等。【例例7.67.6】图图7-57-5是根据我国是根据我国1978-20061978-2006年社会消费品零售额环比发展速年社会消费品零售额环比发展速度绘度绘制的波动曲线制的波动曲线,显示了社会消费品零售额的环比发展速度的波动存在着周期显示了社会消费品零售额的环比发展速度的波动存在着周期性的性的变动规律,变动规律,1978-20061978-2006年期间共经历了年期间共经历了4 4个半周期个半周期,1998-2006,1998-2006年是一个尚未年是一个尚未完的完的周期周期,社会消费品零售额的增长正处在扩张的阶段。社会消费品零售额的增长正处在扩张的阶段。图图7-5 1978-20067-5 1978-2006年消费品零售额环比发展速度波动曲线年消费品零售额环比发展速度波动曲线 第14页/共48页 7.2.8 显著性分析 是指以样本统计量来验证假设的总体参数是否成立,借以决定采取适当是指以样本统计量来验证假设的总体参数是否成立,借以决定采取适当行动行动的统计方法。假设是指对总体参数作出的假设,这种假设可能正确,也可能的统计方法。假设是指对总体参数作出的假设,这种假设可能正确,也可能是错是错误的,假设检验就是要对假设的正确与否作出判断。在市场调查中,许多问误的,假设检验就是要对假设的正确与否作出判断。在市场调查中,许多问题往题往往需要经过检验,才能得出正确的结论。往需要经过检验,才能得出正确的结论。在进行假设检验时,如果总体的分布形式已知,仅需对总体的未知参数在进行假设检验时,如果总体的分布形式已知,仅需对总体的未知参数(总(总体均值、总体比率等)进行假设检验,则称之为参数假设检验。如果总体分体均值、总体比率等)进行假设检验,则称之为参数假设检验。如果总体分布形布形式未知,或者解决的问题不符合参数假设检验条件时,通常采用非参数假设式未知,或者解决的问题不符合参数假设检验条件时,通常采用非参数假设检验检验(又称非参数统计)。(又称非参数统计)。【例例7.77.7】某地城镇居民某年人均可支配收入某地城镇居民某年人均可支配收入9 8509 850元,标准差元,标准差880880元。随元。随机抽机抽取取600600各居民进行调查,结果人均可支配收入为各居民进行调查,结果人均可支配收入为9 7859 785元,在的条件下,能否元,在的条件下,能否认为认为样本人均可支配收入与总体均值没有显著的差别(样本人均可支配收入与总体均值没有显著的差别(H0=0H0=0)。解:)。解:-1.8093 -1.8093 查查Z Z分布表,得分布表,得=-1.96=-1.96,=1.96=1.96,由于检验统计量,由于检验统计量Z Z=-1.8093=-1.8093,落在了两,落在了两个个临界值之间,故接受原假设,即样本均值与总体均值之间没有显著的差别,临界值之间,故接受原假设,即样本均值与总体均值之间没有显著的差别,样本样本是有代表性的。是有代表性的。第15页/共48页 【例例7.87.8】某商场上半年测量的每天的顾客流量为某商场上半年测量的每天的顾客流量为4 2004 200人,人,9 9月份从月份从1616天构成天构成的随机样本测量的顾客流量为的随机样本测量的顾客流量为4 2844 284人,标准差为人,标准差为210210人,设人,设a=0.05a=0.05,假定顾,假定顾客流客流量服从正态分布,能否认为顾客流量比上半年要高一些?(量服从正态分布,能否认为顾客流量比上半年要高一些?(H H0 0:0 0)解:解:1.5492 1.5492 查查t t分布表,分布表,a a=0.05=0.05,n n=15=15时,得临界值为时,得临界值为 1.7531.753,1.7531.753,检验统,检验统计量计量t t=1.5492=1.5492落在此区间内,因此,不能认为顾客流量比上半年要高一些,亦即落在此区间内,因此,不能认为顾客流量比上半年要高一些,亦即差差异不显著。异不显著。【例例7.97.9】据调查,甲市平均每户拥有空调据调查,甲市平均每户拥有空调2.1462.146台,标准差为台,标准差为1.181.18,乙,乙市平市平均每户拥有空调均每户拥有空调2.2242.224台,标准差为台,标准差为1.031.03,n n1=1=n n2=10002=1000,在显著水平,在显著水平a a=0.05=0.05的条的条件下,能否认为甲、乙两市平均每户空调拥有量是相同的(件下,能否认为甲、乙两市平均每户空调拥有量是相同的(H H0 0:u u1=1=u u2 2)解:)解:=1.5748 =1.5748 当当=0.05=0.05,查,查z z分布表得临界值(分布表得临界值(-1.96-1.96,1.961.96),检验统计量),检验统计量z=1.5748z=1.5748,落在此区间的,故接受原假设,即甲、乙两市平均每户空调拥有量的差异是落在此区间的,故接受原假设,即甲、乙两市平均每户空调拥有量的差异是不明不明显的(有差异,但不显著)。显的(有差异,但不显著)。第16页/共48页 7.2.9 差异性分析 差异性分析主要是检验两个总体差异性分析主要是检验两个总体(单位、地区、样本单位、地区、样本)的平均数或比率之的平均数或比率之差是否具有显著的差别差是否具有显著的差别.1.两个总体平均数之差的检验 在检验两个总体平均数之差是否具有显著性时,无论总体是否服从正态在检验两个总体平均数之差是否具有显著性时,无论总体是否服从正态分布,当样本为大样本(分布,当样本为大样本(n n3030)时,来自两个总体的样本平均数之差是趋)时,来自两个总体的样本平均数之差是趋近于正态分布的,故可采用近于正态分布的,故可采用z z检验,其检验统计量为:检验,其检验统计量为:【例例7.97.9】据调查,甲市平均每户拥有空调据调查,甲市平均每户拥有空调2.1462.146台,标准差为台,标准差为1.181.18,乙,乙市平均每户拥有空调市平均每户拥有空调2.2242.224台,标准差为台,标准差为1.031.03,n n1=1=n n2=10002=1000,在显著水平,在显著水平a a=0.05=0.05的条件下,能否认为甲、乙两市平均每户空调拥有量是相同的(的条件下,能否认为甲、乙两市平均每户空调拥有量是相同的(H H0 0:u u1=1=u u2 2)解:解:=1.5748 =1.5748 当当=0.05=0.05,查,查z z分布表得临界值(分布表得临界值(-1.96-1.96,1.961.96),检验统计量),检验统计量z=1.5748z=1.5748,落在此区间的,故接受原假设,即甲、乙两市平均每户空调拥有,落在此区间的,故接受原假设,即甲、乙两市平均每户空调拥有量的差异是不明显的(有差异,但不显著)。量的差异是不明显的(有差异,但不显著)。第17页/共48页2,两个总体比率之差的检验 当样本量较大时,来自两个总体的样本比率之差的抽样分布是近似于正态分布的。当两个总体比率P大体相同时,可先求两个样本比率的联合估计值 检验统计量为:【例例7.117.11】据调查,消费者对彩电售后服务的评价,城镇据调查,消费者对彩电售后服务的评价,城镇510510名被名被调查者的满意率为调查者的满意率为74.9%74.9%,农村,农村690690名被调查者的满意率为名被调查者的满意率为21.9%21.9%,城乡总体满意率为城乡总体满意率为44.4%44.4%,问在,问在a=0.05a=0.05的条件下,城乡满意率是否的条件下,城乡满意率是否具有显著的差别(具有显著的差别(H0H0:P1=P2P1=P2)=18.2759 查查Z Z分布表分布表=0.05=0.05,Z0.975=1.96Z0.975=1.96,由于,由于Z=18.2759Z=18.27591.961.96,故拒绝原,故拒绝原假设(假设(P1P2P1P2),即城乡居民对彩电售后服务的满意度评价具有显),即城乡居民对彩电售后服务的满意度评价具有显著的差异。著的差异。第18页/共48页7.2.10 吻合性分析 吻合性分析是判别变量的实际频数分布与期望分布是否一致。采用(卡方)检验。统计量定义为 检验法则为:不适合某理论分布,反之,适合。【例7.12】某厂选择了三家经营条件大体相同的零售商场,分别经销三种不同包装的同种产品,促销历时1个月,共购买量分别为11 700,12 100,11 780件。在显著水平a=0.05的条件下,能否认为三种方案的销售效果是相同的(H0:E1=E2=E3)?解:理论期望频数 E=11860 第19页/共48页7.3 7.3 双变量数据分析双变量数据分析 双变量数据分析是通过对两个变量之间的数量关系的分析研究,揭示两个变量之间的依存性、相关性、差异性,挖掘数据中隐含的本质和规律性。双变量数据分析的方法很多,下面分别介绍有关的分析方法。7.3.1双变量比率分析 双变量比率分析是通过计算两个有联系现象的变量值的比值(y/x),来分析现象之间的相互联系的数量关系、变化过程和趋势。用以揭示现象的强度、密度、普遍程度、依存关系及其变化。所计算的比值依据两个变量的性质不同,而有不同的含义,如人口密度、存货周转率、产品产销率、居民消费倾向、资产报酬率等都是依存性或相关性比例指标。第20页/共48页 【例7.13】某饮料厂某年第二季度单位产品成本和工人劳动生产率资料如表77,要求计算第二季度平均产品单位成本、季工人劳动生产率和月均工人劳动生产率。第21页/共48页 7.3.2边际效应分析 通过计算两个变量的增减量的比值,考察两个变量间的数量关系、变化特征和规律。边际效应又称边际水平、边际倾向、增量系数等,即y/x的比例值。用以说明自变量每增加一个单位能引起因变量y能增加多少个单位 【例7.14】某地2000-2007年的GDP、消费品零售额如表7-8。据此计算的消费品零售额占GDP的比率、逐期边际系数和逐期弹性系数均呈下降的趋势,并具有一定的周期波动性。这种变动的趋向性和周期波动性是居民消费倾向和储蓄倾向变动、商品消费与非商品消费结构变动、商品零售市场周期波动的综合反映。第22页/共48页 7.3.3 弹性系数分析 是通过计算两个变量的增减率的比值,考察两个变量间的数量关系、变是通过计算两个变量的增减率的比值,考察两个变量间的数量关系、变化特化特征和规律。弹性系数是指因变量征和规律。弹性系数是指因变量y y的增减率与自变量的增减率与自变量x x的增减率之比,用的增减率之比,用E E表表示。示。它能说明自变量它能说明自变量x x每变化每变化1%1%,因变量,因变量y y能相应地变化的能相应地变化的%。弹性可按数值大小、。弹性可按数值大小、值值正负、衡量对象不同进行分类。正负、衡量对象不同进行分类。【例例7.157.15】用几何法求得的各类商品消费的平均收入弹性如表所示,其用几何法求得的各类商品消费的平均收入弹性如表所示,其中消中消费的收入弹性小于费的收入弹性小于1 1,说明居民的储蓄倾向增大。在各类商品中,食品、家,说明居民的储蓄倾向增大。在各类商品中,食品、家庭设庭设备用品、杂项商品与服务的弹性较弱,而衣着、医疗保健、交通通讯、娱乐备用品、杂项商品与服务的弹性较弱,而衣着、医疗保健、交通通讯、娱乐教育教育文化服务、居住均呈高效应弹性。这说明随着收入的增长,消费结构变化显文化服务、居住均呈高效应弹性。这说明随着收入的增长,消费结构变化显著。著。第23页/共48页 7.3.4双变量动态分析 是将两个有联系的变量的动态数据联系起来是将两个有联系的变量的动态数据联系起来,考察二者之间的增长是考察二者之间的增长是否具否具有同步性有同步性;长期趋势是否具有一致性长期趋势是否具有一致性,发展变化的动态过程是否具有协调性发展变化的动态过程是否具有协调性;亦亦可考察两变量的动态数据的波动是否具有某种循环变动的规律性。分析的方可考察两变量的动态数据的波动是否具有某种循环变动的规律性。分析的方法主法主要有增长率比较法、复式动态曲线图示法、趋势方程比较法等。要有增长率比较法、复式动态曲线图示法、趋势方程比较法等。【例例7.167.16】图图7-6 7-6 是根据我国是根据我国1981-20051981-2005年按当年价格计算的年按当年价格计算的GDPGDP和全和全社会社会固定资产投资年增长率绘制的复式动态曲线(数据见固定资产投资年增长率绘制的复式动态曲线(数据见中国统计年鉴中国统计年鉴20062006),该图显示了固定资产投资与经济增长具有一定的动态的依存关系,即投资增该图显示了固定资产投资与经济增长具有一定的动态的依存关系,即投资增长与长与经济增长不是同步的,投资增长领先于经济增长,投资增长对经济增长具有经济增长不是同步的,投资增长领先于经济增长,投资增长对经济增长具有长期长期的动态推动作用,投资波动是经济增长波动的主要原因之一。的动态推动作用,投资波动是经济增长波动的主要原因之一。第24页/共48页7.3.5 双变量关联分析 双变量关联分析是采用简单相关分析、简单回归分析或自变量滞后分布模型来衡量两个变量之间联系的紧密程度和数量关系。【例7.17】表7-10是某市某年城镇居民家庭人均月收入和消费的关联分析。居民人均收入决定人均消费的回归方程为:y=73.9243+0.7963x (R=0.9986 Sy=14.46)第25页/共48页 【例7.18】若以我国1992-2005年的为因变量,分别以,年的全社会固定资产投资总量为自变量(数据见中国统计年鉴2006),用逐步回归得到下列固定资产投资总量决定GDP总量的模型。(9.517)(13.675)(2.873)=0.995 F=1026.43 SE=3615.52 DW=1.364 模型表明在1992-2005年期间,t-2和t-8年的固定资产投资总量对t年的GDP总量具有显著的长期推动效应,时间跨度长达8年左右,这与短期投资项目一般需要2年左右、长期投资项目一般需要较长时间才能形成生产能力的现实是相符的。第26页/共48页 7.3.6 两变量的独立性检验 在市场调查分析研究中,往往有许多两变量交叉分类的数据列表,那么在市场调查分析研究中,往往有许多两变量交叉分类的数据列表,那么这两这两个变量或两种分类标准之间是否有联系,如果没有联系,则称两变量间是独个变量或两种分类标准之间是否有联系,如果没有联系,则称两变量间是独立立的。两变量之间是否有联系,可采用的。两变量之间是否有联系,可采用 检验法。检验法。【例例7.197.19】要求检验表要求检验表7-117-11中人均年收入与文化程度之间是否有联系中人均年收入与文化程度之间是否有联系(括号括号内为理论次数)。内为理论次数)。第27页/共48页 【例7.20】为了研究女性收入高低与购买化妆品之间是否有联系,某调查公司随机抽取112名女性进行调查,数据分类如表7-12要求判别女性收入与化妆品选择之间是否有联系。第28页/共48页 7.3.7 两样本的一致性检验 两样本的一致性检验,通常用来判断两个或两个以上的样本的比率是否具有显著的差别,或者说检验两个或两个以上的独立随机样本是否来自一致的总体。检验统计量计算与独立性检验一样.【例7.21】两家电视收视率调查公司分别对晚间八点档作电话调查得到的两个样本资料如表7-13,要求检验两家公司调查的结果是否有差异。第29页/共48页第30页/共48页7.4 7.4 多变量数据分析多变量数据分析 多变量数据分析是通过对三个或三个以上变量之间的数量关系的分析研究,揭示多个变量之间的依存性、相关性、差异性、挖掘数据中隐含的本质和规律性。多变量数据分析的方法很多,下面分别介绍有关的分析方法。7.4.1 7.4.1 多变量比较分析多变量比较分析 多变量比较分析是将有联系的多个变量或指标联系起来,通过计算有关分析指标,揭示现象之间的依存性、差异性和协调性。亦可利用增长率比较法、复式动态曲线图示法、趋势方程比较法等方法,考察多变量之间的增长是否具有同步性;或者考察多变量发展变化的长期趋势是否具有一致性,发展变化的动态过程是否具有协调性或循环变动的规律性。第31页/共48页 下图显示:我国1990-1997年各种主要价格的总水平都是持续上升的;1998-2002年各种主要价格的总水平相对稳定,2003-2005年各种主要价格的总水平又呈现上升的趋势。同时图11-1亦显示了7种主要价格的总水平的变动走向和趋势具有相似性,特别是原材料、燃料和动力购进价格定基指数和农业生产资料价格定基指数的变动走向和趋势具有一致性和同步性。因此,不同价格之间具有相互影响和传导的内在关系。第32页/共48页 【例例7.237.23】某地某地1996-20061996-2006城镇居民和农村居民人均收入、人均消费和城镇居民和农村居民人均收入、人均消费和人均人均GDPGDP如表如表7-157-15见教材见教材.可得出如下结论:可得出如下结论:城乡居民人均收入都低于人均城乡居民人均收入都低于人均GDPGDP的的年增长率,其协调性不高,其原因是年增长率,其协调性不高,其原因是GDPGDP使用中积累与消费的比例不合理所使用中积累与消费的比例不合理所致;致;城乡居民人均收入、人均消费存在较大的差异性,城乡居民人均收入、人均消费存在较大的差异性,1996-19991996-1999年城乡居民年城乡居民人均人均收入差距呈缩小的趋势,但收入差距呈缩小的趋势,但2000-20072000-2007年则呈扩大的趋势,人均消费亦是如年则呈扩大的趋势,人均消费亦是如此;此;城乡居民的消费倾向均呈不断下降的趋势,亦即储蓄倾向不断提高,城乡居民的消费倾向均呈不断下降的趋势,亦即储蓄倾向不断提高,农农村居村居民的消费倾向高于城镇居民,其原因是农村居民人均收入低于城镇居民。民的消费倾向高于城镇居民,其原因是农村居民人均收入低于城镇居民。第33页/共48页7.4.2 7.4.2 7.4.2 7.4.2 多变量平衡性分析多变量平衡性分析多变量平衡性分析多变量平衡性分析 多变量平衡性或协调性分析有不同的方法多变量平衡性或协调性分析有不同的方法,最常见的是利用收支平衡最常见的是利用收支平衡关系编关系编制的平衡表进行平衡状态分析、平衡结构分析、平衡比例关系分析等,用以制的平衡表进行平衡状态分析、平衡结构分析、平衡比例关系分析等,用以揭示揭示现象之间的相互联系的数量关系,及其发展变化的协调性和均衡性。现象之间的相互联系的数量关系,及其发展变化的协调性和均衡性。【例例7.247.24】表表7-167-16某是啤酒厂某年啤酒产销存分析。从全部产品来看,某是啤酒厂某年啤酒产销存分析。从全部产品来看,生生产量大于销售量,产品销售率只有产量大于销售量,产品销售率只有95.2%95.2%,导致年末存货比年初增加,导致年末存货比年初增加1 1倍多。倍多。从产从产销结构来看,生产结构与销售结构相比存在着不相适应的地方,如干啤、散销结构来看,生产结构与销售结构相比存在着不相适应的地方,如干啤、散装啤装啤酒的生产量过大,导致产品销售率较低,存货成倍增加。因此该厂啤酒产大酒的生产量过大,导致产品销售率较低,存货成倍增加。因此该厂啤酒产大于销于销的状态主要是由这两类啤酒产大于销所引起的。的状态主要是由这两类啤酒产大于销所引起的。第34页/共48页7.4.3 7.4.3 多变量综合评价多变量综合评价 运用反映测评对象总体特征的多个变量或指标体系,借助一定的综合评价方法求得综合评价值,借以衡量测评对象工作的优劣、质量的好坏、效益的高低,并能排出名次、作出评价结论,提出解决问题的对策或建议。综合评价方法的方法很多,如综合等级评价法、综合评分评价法和综合评价指数法。【例7.25】某评价机构组织专家对6种品牌空调的质量、包装、外观、噪声等五个项目进行综合等级评价,排序结果见表7-17。第35页/共48页 【例7.26】某评价机构用问卷调查的形式请消费者对A品牌的电视机的清晰度、音响效果、外观设计、功能、耗电量五个项目进行打分评价,打分标准为:很满意100分,较满意80分,基本满意60分,不满意40分,很不满意20分。回收有效问卷1000分。表7-18中的各评价项目的平均得分是用得票数(频数)作权数,用加权平均法求得的。其综合加权平均分为:第36页/共48页 【例7.27】某市有A、B、C、D、E、五家同类型工业企业,确定的7项经济效益评价指标(其中资产负债率为逆指标)、权数、标准值及有关数据如表7-19。经济效益总指数是根据表中的数据用上述计算公式计算的。计算结果表明,综合经济效益最高的是A企业,最低的是D企业,其顺序是A、B、E、C、D。第37页/共48页7.4.4 7.4.4 7.4.4 7.4.4 多变量方差分析多变量方差分析多变量方差分析多变量方差分析 方差分析是利用方差来判断多个正态总体均值是否相等,或者检验多个样本均值之间的差异是否具有显著性的一种统计分析方法。常用于判断影响某变量的众多因素中,哪些因素起主导作用,哪些因素起次要作用;或者判断不同的方案中哪一种方案最好。【例7.28】表7-20是某广告方案的消费者测评分数统计,表中有三种水平A1,A2,A3,(广告设计方案),每种水平有5个试验数据(n1=n2=n3=5)。第38页/共48页第39页/共48页7.4.5 7.4.5 7.4.5 7.4.5 多变量相关分析多变量相关分析多变量相关分析多变量相关分析 多变量相关分析是利用简单相关系数的计算方法,对多变量数据中的每两个变量的相关程度分别进行测度,从而可得到多变量的相关距阵,根据此相关距阵可考察任何一个变量与其他变量之间的相关程度的高低,说明哪些变量影响大,哪些变量影响小。【例7-29】根据表7-22是根据我国1990-2005年7类价格定基指数(数据见中国统计年鉴2006)构建的相关距阵。此表可考察任何一类价格与其他价格之间的相关程度,第40页/共48页7.4.6 7.4.6 7.4.6 7.4.6 多变量回归分析多变量回归分析多变量回归分析多变量回归分析 多元回归分析是在相关分析的基础上,利用数学模型(方程)来描述因变量与多个自变量之间的数量关系,模型通过各种统计检验后,即可利用这一模型来解释问题、分析问题,亦可进行预测和控制,多元回归分析有多元线性回归、多元非线性回归、时间数列多元自回归等多种形式。【例7.30】根据表7-22的数据,以居民消费价格指数(CPI)为因变量,以其余6个指数为自变量,用逐步回归法进行变量筛选,其中工业品生产(IPI)、农产品生产(FPI)、商品零售(RPI)这三类指数对居民消费价格指数(CPI)的影响最显著,再对这3个自变量作滞后分布处理(因变量样本1993-2005年,自变量则取t,t-1,t-2,t-3年的的序列值,逐步回归估计的统计检验合格的模型如下。第41页/共48页7.4.7 7.4.7 7.4.7 7.4.7 多变量聚类分析多变量聚类分析多变量聚类分析多变量聚类分析 多变量聚类分析可用于解决市场分析中多因素、多指标的综合分类问题。聚类分析中常用的方法有系统聚类法、K-均值聚类法、动态聚类法、模糊聚类法等。利用多元统计分析软件求解。【例7.31】表7-23是根据中国统计年鉴 2007的数据,采用K-均值聚类对31个省市人均GDP和三次产业结构进行聚类的结果。第42页/共48页7.4.8 7.4.8 7.4.8 7.4.8 多变量分析的其他方法多变量分析的其他方法多变量分析的其他方法多变量分析的其他方法 1.1.主成份分析主成份分析 是将多个指标化为少数几个既相互独立,又尽可能多地反映原有指标是将多个指标化为少数几个既相互独立,又尽可能多地反映原有指标大量大量信息的综合性指标,以便更好地集中地反映各样本之间主要差别的一种多元信息的综合性指标,以便更好地集中地反映各样本之间主要差别的一种多元统计统计分析方法。主成份分析是对多元数据结构进行简化处理的一种有效方法。但分析方法。主成份分析是对多元数据结构进行简化处理的一种有效方法。但是,是,主成份分析涉及的变量多、计算复杂,一般仅在调查数据量大,影响指标多主成份分析涉及的变量多、计算复杂,一般仅在调查数据量大,影响指标多的情的情况下才采用。因此,分析者应根据市场调查分析的实际情况,决定是否有必况下才采用。因此,分析者应根据市场调查分析的实际情况,决定是否有必要进要进行主成份分析,并利用多元统计分析软件求解。行主成份分析,并利用多元统计分析软件求解。2.2.判别分析判别分析 是研究如何根据某个样本的若干个变量的观察数据对所面临的对