应用统计学对应分析等.ppt
《应用统计学对应分析等.ppt》由会员分享,可在线阅读,更多相关《应用统计学对应分析等.ppt(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学对应分析等现在学习的是第1页,共19页 当属性变量当属性变量A A和和B B的状态较多时,很难透过列联表作出判断的状态较多时,很难透过列联表作出判断。怎样简化列联表的结构?怎样简化列联表的结构?利用降维的思想利用降维的思想。如因子分析和主成分分析。如因子分析和主成分分析。但因子分析但因子分析的缺陷的缺陷是在于无法同时进行是在于无法同时进行R R型因子分析和型因子分析和Q Q型因子分析型因子分析。怎么办?怎么办?精细建模:对数线性模型精细建模:对数线性模型 直观展示:对应分析直观展示:对应分析现在学习的是第2页,共19页*对应分析的基本理论对应分析的基本理论v1 1、什么是对应分析?、
2、什么是对应分析?对应分析是利用对应分析是利用“降维降维”的方法,以两变量的的方法,以两变量的交叉列联交叉列联表表为研究对象,通过图形的方式,直接揭示变量之间以及变量为研究对象,通过图形的方式,直接揭示变量之间以及变量的不同类别之间的联系,特别适合于多分类属性变量研究的一的不同类别之间的联系,特别适合于多分类属性变量研究的一种多元统计分析方法。种多元统计分析方法。v2 2、对应分析的基本思想:、对应分析的基本思想:首先,编制两品质型变量的交叉列联表,将交叉列联表中的每个数据单元看首先,编制两品质型变量的交叉列联表,将交叉列联表中的每个数据单元看成两变量在相应类别上的对应点;成两变量在相应类别上的
3、对应点;然后,对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上然后,对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;,并使联系密切的类别点较集中,联系疏远的类别点较分散;最后,通过观察对应分布图就能直观地把握变量类别之间的联系最后,通过观察对应分布图就能直观地把握变量类别之间的联系现在学习的是第3页,共19页方法特点是多维图示分析技术之一,结果直观、简单与因子分析有关 分类资料的典型相关分析 用于展示两个/多个分类变量各类间的关系 高收入、黑人、男性倾向于反对开战研究较多分类变量间关系时较佳各个变量的类别较多
4、时较佳 均为四类以上p 局限性 不能进行变量间相关关系的检验 仍然只是一种统计描述方法 解决方案的所需维度需要研究者决定 对极端值敏感 对于小样本不推荐使用现在学习的是第4页,共19页v 3 3、方法优点:、方法优点:可以在一张二维图上同时表示出两类属性变量的各种状态可以在一张二维图上同时表示出两类属性变量的各种状态,以直观描述原始数据结构。,以直观描述原始数据结构。v 4 4、关键问题:、关键问题:l如何将多个类别点表示在低维空间中,以便于直接观察如何将多个类别点表示在低维空间中,以便于直接观察l如何确定各类别点的坐标,以易于鉴别类别间联系的强弱如何确定各类别点的坐标,以易于鉴别类别间联系的
5、强弱现在学习的是第5页,共19页原理以列联表为分析基础,计算基于H0假设的单元格残差将每行看成是一条记录,基于列变量相关系数阵进行因子分析,计算出列变量各类别的负荷值将每列看成是一条记录,基于行变量相关系数阵进编制交叉列联表并计算概率矩阵编制交叉列联表并计算概率矩阵根据矩阵确定数据点坐标根据矩阵确定数据点坐标行变量和列变量的分类降维处理行变量和列变量的分类降维处理步骤现在学习的是第6页,共19页对应分析图的阅读p每个维度可能代表了一种特征每个维度可能代表了一种特征实际上就是一个提取出的主成分,但由于分类变量的信息较少,可能找不到合理的解释1考察同一变量的区分度:如果同一变量不同类别在某个方向上
6、靠得较近,则说明这些类别在该维度上区别不大。2考察不同变量的类别联系:一般而言,落在从图形原点(0,0)处出发相同方位上大致相同区域内的不同变量的分类点彼此有联系。散点间距离越近,说明关联倾向越明显;散点离原点越远,也说明关联倾向越明显。现在学习的是第7页,共19页典型相关分析典型相关分析canonical correlation analysis 现实中:现实中:如鸡蛋、猪肉的价格(作为第一组变量)和相应产品如鸡蛋、猪肉的价格(作为第一组变量)和相应产品的销量(第二组变量)有相关关系。如投资性变量(劳力投入的销量(第二组变量)有相关关系。如投资性变量(劳力投入、财力投入、固定资产投资等)与国
7、民收入(工农业收入、建、财力投入、固定资产投资等)与国民收入(工农业收入、建筑业收入、等)具有相关关系。筑业收入、等)具有相关关系。如何研究两组变量之间的相关关系?如何研究两组变量之间的相关关系?设两组变量用设两组变量用X X1 1,X,X2 2.,X.,XP P以及以及Y Y1 1,Y,Y2 2Y YP P表示。表示。(1 1)分别研究)分别研究X Xi i和和Y Yj j之间的相关关系,列出相关系数表。之间的相关关系,列出相关系数表。其缺陷:其缺陷:当两组变量较多时,处理较烦琐,不易抓住问题的实质。(当两组变量较多时,处理较烦琐,不易抓住问题的实质。(2 2)采用主成分分析的方法,每组变量
8、分别提取主成分,再通过)采用主成分分析的方法,每组变量分别提取主成分,再通过主成分之间的关系反映两组变量之间的关系。主成分之间的关系反映两组变量之间的关系。现在学习的是第8页,共19页例:鸡蛋、猪肉的价格用例:鸡蛋、猪肉的价格用X X1 1和和X X2 2表示;鸡蛋、猪肉的销量用表示;鸡蛋、猪肉的销量用Y Y1 1和和Y Y2 2表示。表示。构造第一组和第二组变量的线性组合:构造第一组和第二组变量的线性组合:F F1 1=a=a1111X X1 1+a+a1212X X2 2 Z Z1 1=a=a1111Y Y1 1+a+a1212Y Y2 2 满足满足F F1 1和和Z Z1 1的相关性最大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 对应 分析
限制150内