第1章 多元统计分析的应用和多元统计数据的图表示法.ppt
《第1章 多元统计分析的应用和多元统计数据的图表示法.ppt》由会员分享,可在线阅读,更多相关《第1章 多元统计分析的应用和多元统计数据的图表示法.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、n赵世赵世舜舜n数学数学楼楼 426第一章多元统计分析的应用和第一章多元统计分析的应用和 多元统计数据的图表示法多元统计数据的图表示法第一节第一节 引言引言 第二节第二节 轮廓图轮廓图第三节第三节 雷达图雷达图 第四节第四节 散布图矩阵散布图矩阵第一节第一节 引言引言n什么是多元统计分析什么是多元统计分析n用于的领域用于的领域n如何处理数据如何处理数据n什么样的方法什么样的方法第一节第一节 引言引言n什么是多元统计分析什么是多元统计分析n高维数据高维数据n降维降维 n分类分类n变量间的相互关系变量间的相互关系n统计推断统计推断第一节第一节 引言引言n用于的领域用于的领域 教育教育 服饰服饰 医
2、学医学 经济经济 气象气象 农业农业 环境环境 社会科学社会科学 地址地址 文学文学第一节第一节 引言引言n如何处理数据如何处理数据第一节第一节 引言引言n什么样的方法什么样的方法第二节第二节 轮廓图轮廓图n图表示法图表示法n众所周知,图形是我们直观了解、认识数据的一种众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维
3、数据也可以用三维图形来平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自,那么如何用图形直观表现三维以上的数据呢?自上世纪上世纪70年代以来,多变量数据的可视化分析研究年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。就一直是人们关注的一个问题。n从研究的成果来看,主要可以分为两类从研究的成果来看,主要可以分为两类:一类是使高维空间的点与平面上的某种图一类是使高维空间
4、的点与平面上的某种图形对应,这种图形能反映高维数据的某些形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;特点或数据间的某些关系;另一类是对多变量数据进行降维处理,在另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数尽可能多地保留原始信息的原则下,将数据的维数降为据的维数降为2维或维或1维,然后再在平面上维,然后再在平面上表示。例如后面将要介绍的主成分分析方表示。例如后面将要介绍的主成分分析方法、因子分析方法、多维尺度法等就属于法、因子分析方法、多维尺度法等就属于此类方法。此类方法。n下表是我国华北地区下表是我国华北地区5个省市个省市2003年城镇居民家庭平均每
5、人年城镇居民家庭平均每人全年消费性支出的六项指标数据考虑微机的普及应用,图形全年消费性支出的六项指标数据考虑微机的普及应用,图形的制作则通过电脑实现。轮廓图、矩阵散点图在的制作则通过电脑实现。轮廓图、矩阵散点图在SPSS中制作,中制作,雷达图则在雷达图则在EXCEL中实现。中实现。表表 华北华北5省市城镇居民家庭消费性支出省市城镇居民家庭消费性支出第二节第二节 轮廓图轮廓图n轮廓图是将多个样品观测数据以折线的方式表示在平面图中轮廓图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。轮廓图用线段的升降来表示变量的一种多变量可视化图形。轮廓图用线段的升降来表示变量的大小,常用于
6、表示现象在时间上的变化趋势、现象的分配的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。情况和两个现象之间的依存关系等。n轮廓图的作图原理如下:轮廓图的作图原理如下:(1)作平面坐标系,横坐标取)作平面坐标系,横坐标取p个点,表示个点,表示p个变量,纵坐个变量,纵坐 标表示变量取值。标表示变量取值。(2)对给定的样品观测值,在)对给定的样品观测值,在p个点的纵坐标上标出相应的个点的纵坐标上标出相应的 变量取值。变量取值。(3)将表示)将表示p个变量取值的点连接成一条折线,即得到了表个变量取值的点连接成一条折线,即得到了表 示一个样品观测数据的折线,示一个样品观
7、测数据的折线,n次观测可绘出次观测可绘出n条折条折 线,构成多变量轮廓图。线,构成多变量轮廓图。n在在SPSS中作轮廓图的方法如下:中作轮廓图的方法如下:(1)将原始数据输入)将原始数据输入SPSS中。把不同地区当成变量,而把中。把不同地区当成变量,而把支出指标当成观测。支出指标当成观测。作轮廓图时的数据组织形式作轮廓图时的数据组织形式(2)选择菜单项)选择菜单项GraphsLine,打开,打开Line Charts对话框,对话框,如图。在对话框上方的三个选项用于选择轮廓图的形式,由如图。在对话框上方的三个选项用于选择轮廓图的形式,由于是这里是多变量作图,所以选择于是这里是多变量作图,所以选择
8、Multiple。在对话框下面。在对话框下面的三个选项中选择的三个选项中选择Value of individual cases。单击。单击Define按钮,按钮,打开打开Define Multiple Line对话框。对话框。Line Charts对话框对话框(3)在)在Define Multiple Line对话框中,将代表不同地区的对话框中,将代表不同地区的5个变量移入个变量移入Lines Represent列表框中,将代表支出指标的变列表框中,将代表支出指标的变量(量(variable)移入)移入Variable框中。单击框中。单击OK按钮,即可作出按钮,即可作出如图所示的轮廓图。从图中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第1章 多元统计分析的应用和多元统计数据的图表示法 多元 统计分析 应用 统计数据 图表
限制150内