多变量的可视化分析精.ppt
《多变量的可视化分析精.ppt》由会员分享,可在线阅读,更多相关《多变量的可视化分析精.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页,本讲稿共38页第一节第一节 引言引言n众所周知,图形是我们直观了解、认识数据的一种可视化手众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维
2、数通常又都大于且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪那么如何用图形直观表现三维以上的数据呢?自上世纪70年年代以来,多变量数据的可视化分析研究就一直是人们关注的代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。一个问题。第2页,本讲稿共38页n从研究的成果来看,主要可以分为两类从研究的成果来看,主要可以分为两类:一类是使高维空间的点与平面上的某种图形对应,这种一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;图形能反映高维数据的某些特点或数据间的某些关系;另一类是对多变量数据
3、进行降维处理,在尽可能多地保另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为留原始信息的原则下,将数据的维数降为2维或维或1维,然维,然后再在平面上表示。例如前面介绍的主成分分析方法、后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅因子分析方法、多维尺度法等就属于此类方法。这里仅介绍介绍5种实用而有效的多变量可视化方法。种实用而有效的多变量可视化方法。第3页,本讲稿共38页n表表11.1是我国华北地区是我国华北地区5个省市个省市2003年城镇居民家庭平均每人年城镇居民家庭平均每人全年消费性支出的六项指标数据,下
4、面分别用全年消费性支出的六项指标数据,下面分别用5种可视化方种可视化方法对数据进行分析。法对数据进行分析。n考虑微机的普及应用,本章主要介绍考虑微机的普及应用,本章主要介绍5种图形的制作方法,种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在在SPSS中制作,雷达图和星座图则在中制作,雷达图和星座图则在EXCEL中实现。中实现。表11.1 华北5省市城镇居民家庭消费性支出第4页,本讲稿共38页第二节第二节 折线图分析法折线图分析法n折线图是将多个样品观测数据以折线的方式表示在平面图中折线图是将多个样品观测数据以折线的方式
5、表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。情况和两个现象之间的依存关系等。n折线图的作图原理如下:折线图的作图原理如下:(1)作平面坐标系,横坐标取)作平面坐标系,横坐标取p个点,表示个点,表示p个变量,纵坐个变量,纵坐 标表示变量取值。标表示变量取值。(2)对给定的样品观测值,在)对给定的样品观测值,在p个点的纵坐标上标出相应的个点的纵坐标上标出相应的 变量取值。变量取值。(3)将表
6、示)将表示p个变量取值的点连接成一条折线,即得到了表个变量取值的点连接成一条折线,即得到了表 示一个样品观测数据的折线,示一个样品观测数据的折线,n次观测可绘出次观测可绘出n条折条折 线,构成多变量折线图。线,构成多变量折线图。第5页,本讲稿共38页n在在SPSS中作折线图的方法如下:中作折线图的方法如下:(1)将原始数据输入)将原始数据输入SPSS中。注意数据的组织形式要像图中。注意数据的组织形式要像图11.1那样。即把不同地区当成变量,而把支出指标当成观测。那样。即把不同地区当成变量,而把支出指标当成观测。图11.1 作折线图时的数据组织形式 第6页,本讲稿共38页(2)选择菜单项)选择菜
7、单项GraphsLine,打开,打开Line Charts对话框,对话框,如图如图11.2。在对话框上方的三个选项用于选择折线图的形式,。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择由于是这里是多变量作图,所以选择Multiple。在对话框下。在对话框下面的三个选项中选择面的三个选项中选择Value of individual cases。单击。单击Define按按钮,打开钮,打开Define Multiple Line对话框。对话框。图11.2 Line Charts对话框 第7页,本讲稿共38页(3)在)在Define Multiple Line对话框中,将
8、代表不同地区的对话框中,将代表不同地区的5个变量移入个变量移入Lines Represent列表框中,将代表支出指标的变列表框中,将代表支出指标的变量(量(variable)移入)移入Variable框中。单击框中。单击OK按钮,即可作出按钮,即可作出如图如图11.4所示的折线图。从图中可以清楚地看出北京市几乎所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。各项支出都排在第一,而山西省则几乎每项支出都是最低的。图11.3 Define Multiple Line对话框第8页,本讲稿共38页图11.4 折线图第9页,本讲稿共38页第三节第三节 条
9、形图分析法条形图分析法n条形图是由若干平行条状的矩形所构成,而以每一个矩形的条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。高度来代表数值的大小。n按图按图11.1所示的方式在所示的方式在SPSS中组织好数据后,条形图的制作中组织好数据后,条形图的制作步骤如下:步骤如下:(1)选择菜单项)选择菜单项GraphsLine,打开,打开Bar Charts对话框,该对话框,该对话框与图对话框与图11.2所示的所示的Line Charts对话框有相同的选项。在对话框有相同的选项。在对话框上方的三个选项用于选择条形图的形式,由于是这里对话框上方的三个选项用于选择条形图的形式,由
10、于是这里是多变量作图,所以选择是多变量作图,所以选择Clustered。在对话框下面的三个选。在对话框下面的三个选项中选择项中选择Value of individual cases。单击。单击Define按钮,打开按钮,打开Define Clustered Bar对话框。对话框。(2)在)在Define Clustered Bar对话框中,将代表不同地区的对话框中,将代表不同地区的5个变量移入个变量移入Bars Represent列表框中,将代表支出指标的变列表框中,将代表支出指标的变量移入量移入Variable框中。单击框中。单击OK按钮,即可作出如图按钮,即可作出如图11.5所示所示的条形
11、图。的条形图。第10页,本讲稿共38页图11.5 条形图第11页,本讲稿共38页n可以发现,折线图和条行图的作图过程几乎相同,作图原理可以发现,折线图和条行图的作图过程几乎相同,作图原理也大同小异,折线图是以折线的高低来表示变量的大小,条也大同小异,折线图是以折线的高低来表示变量的大小,条形图是以矩形的高低来表示变量的大小。形图是以矩形的高低来表示变量的大小。n从图从图11.5也可以得出与折线图同样的结论:北京市各项支出也可以得出与折线图同样的结论:北京市各项支出都比较高,而山西省各项支出都比较低。都比较高,而山西省各项支出都比较低。第12页,本讲稿共38页第四节第四节 散点图分析法散点图分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多变 可视化 分析
限制150内