市场研究的最新数据分析方法.ppt
《市场研究的最新数据分析方法.ppt》由会员分享,可在线阅读,更多相关《市场研究的最新数据分析方法.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第第1515章章 市场研究的数据分析方法市场研究的数据分析方法 Chapter 15 Analysis Methods of Market Research Data教学内容教学内容(Teaching content)(Teaching content)介绍以下五种数据分析方法在市场研究中的具体应用。介绍以下五种数据分析方法在市场研究中的具体应用。介绍以下五种数据分析方法在市场研究中的具体应用。介绍以下五种数据分析方法在市场研究中的具体应用。联合联合分析分析多维多维偏好偏好分析分析对应对应分析分析因子因子分析分析 聚类聚类分析分析教学教学内容内容聚类分析聚类分析(Cluster Analys
2、isCluster Analysis)聚类分析的基本思想:聚类分析的基本思想:根根据据样样本本自自身身的的属属性性,用用数数学学方方法法按按照照某某些些相相似似性性或或差差异异性性指指标标,定定量量地地确确定定样样本本之之间间的的亲亲疏疏关关系系,并并按按这这种种亲亲疏疏关关系系程程度度对对样样本进行聚类本进行聚类。聚类分析的分类聚类分析的分类(classification of cluster analysisclassification of cluster analysis)样品聚类:对事件进行聚类,或是对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。变量聚类:是当反映事物特
3、征的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。聚类分析的统计量聚类分析的统计量(Statistics of Clustering AnalysisStatistics of Clustering Analysis)设x1x2xn为n个分类特征指标,xik表示第i个样品的第k个指标值。为了将样品(或变量)进行分类,首先需要引进表示样品之间相似程度的度量,称为聚类统计量。1 1匹配系数匹配系数 当分类指标当分类指标当分类指标当分类指标 为类别标度量时,通常采用匹配系数为类别标度量时,通常采用匹配系数为类别标度量时,通常采用匹配系数为类别标度量时,通常采用匹配系数
4、作为聚类统计量。第作为聚类统计量。第作为聚类统计量。第作为聚类统计量。第 个样品与第个样品与第个样品与第个样品与第 个样品的匹配系数个样品的匹配系数个样品的匹配系数个样品的匹配系数 其其其其中中中中匹配系数越大,说明两样品越相似,越应该划为同一类。匹配系数越大,说明两样品越相似,越应该划为同一类。匹配系数越大,说明两样品越相似,越应该划为同一类。匹配系数越大,说明两样品越相似,越应该划为同一类。2 2距离距离 当指标中有间隔标度变量时,匹配系数已不再适用,此时采用距离来进行度量,距离越小,相似程度越高,两样品越应该划为一类.在实际问题中,对样品分类常用距离,对变量分类常用相似系数。相似系数可以
5、分为夹角余弦与相关系数。3相似系数聚类分析的方法聚类分析的方法(M Method of Cluster Analysisethod of Cluster Analysis)聚聚类类分分析析的的方方法法中中应应用用最最广广泛泛的的有有两两类类:层层次次聚聚类类法法和和迭迭代代聚类法。层次聚类法又可分为两种:聚集法和分解法聚类法。层次聚类法又可分为两种:聚集法和分解法 聚类分析聚类分析的方法的方法层次聚类法层次聚类法 分解法和聚集法的过程相反,首先把所有的案例归为一类,分解法和聚集法的过程相反,首先把所有的案例归为一类,分解法和聚集法的过程相反,首先把所有的案例归为一类,分解法和聚集法的过程相反,
6、首先把所有的案例归为一类,然后把最不相似的案例分为两类,每一步增加一类,直到每个案然后把最不相似的案例分为两类,每一步增加一类,直到每个案然后把最不相似的案例分为两类,每一步增加一类,直到每个案然后把最不相似的案例分为两类,每一步增加一类,直到每个案例都自成一类为止。例都自成一类为止。例都自成一类为止。例都自成一类为止。迭代聚类法迭代聚类法 层层次次聚聚类类法法在在聚聚类类过过程程中中,当当样样本本量量很很大大时时需需要要占占用用的的计计算算机机内内存存空空间间较较大大,并并且且耗耗时时较较长长。迭迭代代聚聚类类法法克克服服了了层层次次聚聚类类法法的的这这两两个个缺缺点点它它具具有有占占计计算
7、算机机内内存存空空间间小小、速速度度快快的的优优点,适用于大样本的聚类分析。点,适用于大样本的聚类分析。迭代聚类法的优点迭代聚类法的优点占计算机内存空间小占计算机内存空间小速度快速度快迭代聚类法的聚类过程的基本思路迭代聚类法的聚类过程的基本思路 首先指定聚首先指定聚类数,对样类数,对样本进行初始本进行初始分类并计算分类并计算每一类的中每一类的中心心 然后计算每然后计算每个样本点到个样本点到各类中心的各类中心的距离,调整距离,调整样本点的分样本点的分类,把每个类,把每个样本点归入样本点归入与中心距离与中心距离最近的那一最近的那一类类 重复计算每重复计算每一类的中心一类的中心,调整分类,调整分类直
8、到所有样直到所有样本点调整完本点调整完毕为止毕为止。聚类分析的基本步骤聚类分析的基本步骤(B Basic Steps of Cluster Analysisasic Steps of Cluster Analysis)相似性测度相似性测度 选择聚类变量选择聚类变量 聚类聚类 聚类结果的解释和证实聚类结果的解释和证实 偏好图展示偏好图展示 首先要解决的是判断哪些因素是决定分类的关键因素首先要解决的是判断哪些因素是决定分类的关键因素 主要有两种指标来测度:距离和相似系数主要有两种指标来测度:距离和相似系数主要解决两个问题:选定聚类方法;确定形成的类数主要解决两个问题:选定聚类方法;确定形成的类数
9、对结果进行验证和解释,以保证聚类解是可信的对结果进行验证和解释,以保证聚类解是可信的 以聚类结果和聚类变量为轴做出研究对象的偏好图以聚类结果和聚类变量为轴做出研究对象的偏好图 聚类分析的假设条件和局限性聚类分析的假设条件和局限性(A Assumptions and Limitations of Cluster Analysisssumptions and Limitations of Cluster Analysis)要进行聚类分析必须满足两个假设条件:第一,作为聚类要进行聚类分析必须满足两个假设条件:第一,作为聚类依据的相似性指标是衡量对象间相似性的正确指标;第二,可依据的相似性指标是衡量对
10、象间相似性的正确指标;第二,可以从理论上证明把对象合并成一类是有道理的。以从理论上证明把对象合并成一类是有道理的。其局限性主要在于要评价聚类分析的质量比较难。由于没有标其局限性主要在于要评价聚类分析的质量比较难。由于没有标准统计检验可用,因此无法保证输出结果不是完全偶然事件。准统计检验可用,因此无法保证输出结果不是完全偶然事件。聚类准则指标值、输出结果的合理性和分割样本的可靠性检验聚类准则指标值、输出结果的合理性和分割样本的可靠性检验都能提供有用的检验信息,但是要确切了解哪些类别非常相似、都能提供有用的检验信息,但是要确切了解哪些类别非常相似、哪些对象难以分配到类别里去还是很难。哪些对象难以分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场 研究 最新 数据 分析 方法
限制150内