欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    多变量的可视化分析精.ppt

    • 资源ID:49780126       资源大小:4.82MB        全文页数:38页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多变量的可视化分析精.ppt

    第1页,本讲稿共38页第一节第一节 引言引言n众所周知,图形是我们直观了解、认识数据的一种可视化手众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪那么如何用图形直观表现三维以上的数据呢?自上世纪70年年代以来,多变量数据的可视化分析研究就一直是人们关注的代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。一个问题。第2页,本讲稿共38页n从研究的成果来看,主要可以分为两类从研究的成果来看,主要可以分为两类:一类是使高维空间的点与平面上的某种图形对应,这种一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;图形能反映高维数据的某些特点或数据间的某些关系;另一类是对多变量数据进行降维处理,在尽可能多地保另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为留原始信息的原则下,将数据的维数降为2维或维或1维,然维,然后再在平面上表示。例如前面介绍的主成分分析方法、后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅因子分析方法、多维尺度法等就属于此类方法。这里仅介绍介绍5种实用而有效的多变量可视化方法。种实用而有效的多变量可视化方法。第3页,本讲稿共38页n表表11.1是我国华北地区是我国华北地区5个省市个省市2003年城镇居民家庭平均每人年城镇居民家庭平均每人全年消费性支出的六项指标数据,下面分别用全年消费性支出的六项指标数据,下面分别用5种可视化方种可视化方法对数据进行分析。法对数据进行分析。n考虑微机的普及应用,本章主要介绍考虑微机的普及应用,本章主要介绍5种图形的制作方法,种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在在SPSS中制作,雷达图和星座图则在中制作,雷达图和星座图则在EXCEL中实现。中实现。表11.1 华北5省市城镇居民家庭消费性支出第4页,本讲稿共38页第二节第二节 折线图分析法折线图分析法n折线图是将多个样品观测数据以折线的方式表示在平面图中折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。情况和两个现象之间的依存关系等。n折线图的作图原理如下:折线图的作图原理如下:(1)作平面坐标系,横坐标取)作平面坐标系,横坐标取p个点,表示个点,表示p个变量,纵坐个变量,纵坐 标表示变量取值。标表示变量取值。(2)对给定的样品观测值,在)对给定的样品观测值,在p个点的纵坐标上标出相应的个点的纵坐标上标出相应的 变量取值。变量取值。(3)将表示)将表示p个变量取值的点连接成一条折线,即得到了表个变量取值的点连接成一条折线,即得到了表 示一个样品观测数据的折线,示一个样品观测数据的折线,n次观测可绘出次观测可绘出n条折条折 线,构成多变量折线图。线,构成多变量折线图。第5页,本讲稿共38页n在在SPSS中作折线图的方法如下:中作折线图的方法如下:(1)将原始数据输入)将原始数据输入SPSS中。注意数据的组织形式要像图中。注意数据的组织形式要像图11.1那样。即把不同地区当成变量,而把支出指标当成观测。那样。即把不同地区当成变量,而把支出指标当成观测。图11.1 作折线图时的数据组织形式 第6页,本讲稿共38页(2)选择菜单项)选择菜单项GraphsLine,打开,打开Line Charts对话框,对话框,如图如图11.2。在对话框上方的三个选项用于选择折线图的形式,。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择由于是这里是多变量作图,所以选择Multiple。在对话框下。在对话框下面的三个选项中选择面的三个选项中选择Value of individual cases。单击。单击Define按按钮,打开钮,打开Define Multiple Line对话框。对话框。图11.2 Line Charts对话框 第7页,本讲稿共38页(3)在)在Define Multiple Line对话框中,将代表不同地区的对话框中,将代表不同地区的5个变量移入个变量移入Lines Represent列表框中,将代表支出指标的变列表框中,将代表支出指标的变量(量(variable)移入)移入Variable框中。单击框中。单击OK按钮,即可作出按钮,即可作出如图如图11.4所示的折线图。从图中可以清楚地看出北京市几乎所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。各项支出都排在第一,而山西省则几乎每项支出都是最低的。图11.3 Define Multiple Line对话框第8页,本讲稿共38页图11.4 折线图第9页,本讲稿共38页第三节第三节 条形图分析法条形图分析法n条形图是由若干平行条状的矩形所构成,而以每一个矩形的条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。高度来代表数值的大小。n按图按图11.1所示的方式在所示的方式在SPSS中组织好数据后,条形图的制作中组织好数据后,条形图的制作步骤如下:步骤如下:(1)选择菜单项)选择菜单项GraphsLine,打开,打开Bar Charts对话框,该对话框,该对话框与图对话框与图11.2所示的所示的Line Charts对话框有相同的选项。在对话框有相同的选项。在对话框上方的三个选项用于选择条形图的形式,由于是这里对话框上方的三个选项用于选择条形图的形式,由于是这里是多变量作图,所以选择是多变量作图,所以选择Clustered。在对话框下面的三个选。在对话框下面的三个选项中选择项中选择Value of individual cases。单击。单击Define按钮,打开按钮,打开Define Clustered Bar对话框。对话框。(2)在)在Define Clustered Bar对话框中,将代表不同地区的对话框中,将代表不同地区的5个变量移入个变量移入Bars Represent列表框中,将代表支出指标的变列表框中,将代表支出指标的变量移入量移入Variable框中。单击框中。单击OK按钮,即可作出如图按钮,即可作出如图11.5所示所示的条形图。的条形图。第10页,本讲稿共38页图11.5 条形图第11页,本讲稿共38页n可以发现,折线图和条行图的作图过程几乎相同,作图原理可以发现,折线图和条行图的作图过程几乎相同,作图原理也大同小异,折线图是以折线的高低来表示变量的大小,条也大同小异,折线图是以折线的高低来表示变量的大小,条形图是以矩形的高低来表示变量的大小。形图是以矩形的高低来表示变量的大小。n从图从图11.5也可以得出与折线图同样的结论:北京市各项支出也可以得出与折线图同样的结论:北京市各项支出都比较高,而山西省各项支出都比较低。都比较高,而山西省各项支出都比较低。第12页,本讲稿共38页第四节第四节 散点图分析法散点图分析法n散点图又称散布图,它是以点的分布反映变量之间相关关系散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。关系的二维散点图。n利用利用SPSS制作矩阵散点图的步骤如下:制作矩阵散点图的步骤如下:(1)在)在SPSS中按图中按图11.6的形式组织数据,即把支出指标当成的形式组织数据,即把支出指标当成变量,而把不同地区当成观测。变量,而把不同地区当成观测。图11.6 作散点图时的数据组织形式第13页,本讲稿共38页 (2)选择菜单项)选择菜单项GraphsScatter,打开,打开Scatter plot对话框对话框,如图如图11.7。该对话框用于选择散点图的形式。选定。该对话框用于选择散点图的形式。选定Matrix,即矩阵散点图即矩阵散点图,单击,单击Define按钮,打开按钮,打开Scatter plot Matrix对对话框,如图话框,如图11.8。图11.7 Scatter plot对话框第14页,本讲稿共38页图11.8 Scatter plot Matrix对话框 第15页,本讲稿共38页 (3)在打开的)在打开的Scatter plot Matrix对话框中,将食品、衣着、对话框中,将食品、衣着、居住三个变量移入居住三个变量移入Matrix Variables列表框中,将标志变量列表框中,将标志变量region移入移入Label Cases by列表框中。列表框中。(4)点击)点击OK按钮,得到如图按钮,得到如图11.9所示的矩阵散点图。所示的矩阵散点图。n从图从图11.9可以看出,河北、山西、内蒙古在居住和食品消费可以看出,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间支出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。特征。第16页,本讲稿共38页图11.9 矩阵散点图 第17页,本讲稿共38页n另外,还可以作三维立体散点图。只需在另外,还可以作三维立体散点图。只需在Scatter plot对话框对话框(图(图11.7)中选择)中选择3-D选项。在跳出的选项。在跳出的3-D Scatter plot对话框对话框中将食品、衣着、居住三个变量分别移入中将食品、衣着、居住三个变量分别移入X Axis、Y Axis和和Z Axis列表框中,将标志变量列表框中,将标志变量region移入移入Label Cases by列表框列表框中。单击中。单击OK按钮,则作出图按钮,则作出图11.10所示的三维立体散点图。所示的三维立体散点图。n矩阵散点图不仅可以在二维平面上同时反映多个变量数值,矩阵散点图不仅可以在二维平面上同时反映多个变量数值,而且可以用于直观反映多个变量间是否存在某种关系。与三而且可以用于直观反映多个变量间是否存在某种关系。与三维立体图相比,有着更好的可视性。比较图维立体图相比,有着更好的可视性。比较图11.9与图与图11.10不不难看出这一点。难看出这一点。第18页,本讲稿共38页图11.10 三维立体散点图 第19页,本讲稿共38页第五节第五节 雷达图分析法雷达图分析法n雷达图是一种较为常用的多变量可视化图形。在雷达图中,雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。图。又像蜘蛛网,所以也称蛛网图。n雷达图的作图方法:雷达图的作图方法:(1)作一圆,并按变量的个数)作一圆,并按变量的个数p将圆周分成将圆周分成p等分。等分。(2)连接圆心和各分点,将这)连接圆心和各分点,将这p条半径连线依次定义为各变条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。量的坐标轴,并标以适当的刻度。(3)对给定的一次观测值,将每个变量值分别标在相应的)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把坐标轴上,把p个点相连就形成了一个个点相连就形成了一个p边形,边形,n次观测值就次观测值就可画出可画出n个个p边形。边形。第20页,本讲稿共38页n例如,根据表例如,根据表11.1中的数据,调用中的数据,调用EXCEL图表向导,选择雷图表向导,选择雷达图,然后按图表向导提示,即可制作出如图达图,然后按图表向导提示,即可制作出如图11.1117所示所示的雷达图。图的雷达图。图11.5画出了北京、天津和河北的雷达图,从图画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。大小,可以对样品进行初始分类分析。n为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。要对比的指标分布在左、右或上、下方,以便于对比分析。第21页,本讲稿共38页n当观测次数当观测次数n较大和指标较多时,画出的雷达图线段太多,较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为了获得较好的可视化效果,在一张雷图形的效果会很差。为了获得较好的可视化效果,在一张雷达图上可以画几个样品观测数据,甚至一张雷达图只画一个达图上可以画几个样品观测数据,甚至一张雷达图只画一个样品观测数据。如图样品观测数据。如图11.1111.17所示,对这些图进行比较所示,对这些图进行比较分析,也可了解其特点。分析,也可了解其特点。图11.11 第22页,本讲稿共38页图11.12第23页,本讲稿共38页图11.13第24页,本讲稿共38页图11.14第25页,本讲稿共38页图11.15第26页,本讲稿共38页图11.16第27页,本讲稿共38页图11.17第28页,本讲稿共38页第六节第六节 星座图分析法星座图分析法n星座图是将高维空间的样本点投影到平面上的一个半圆内,星座图是将高维空间的样本点投影到平面上的一个半圆内,用投影点表示样本点的多元图示方法。由于样本点在半圆内用投影点表示样本点的多元图示方法。由于样本点在半圆内的投影犹如浩瀚苍穹中的星座,因此而称其为星座图。的投影犹如浩瀚苍穹中的星座,因此而称其为星座图。n星座图的作图方法:星座图的作图方法:(1)通过对观测数据)通过对观测数据Xij作极差标准化变换,将其变换为角度作极差标准化变换,将其变换为角度 ij:第29页,本讲稿共38页 第30页,本讲稿共38页 第31页,本讲稿共38页n n 第32页,本讲稿共38页n 第33页,本讲稿共38页n 第34页,本讲稿共38页第35页,本讲稿共38页 n 第36页,本讲稿共38页n最后,利用最后,利用EXCEL中的散点图制作功能可得如图中的散点图制作功能可得如图11.18所示所示的星座图。的星座图。图11.18 星座图第37页,本讲稿共38页本章结束本章结束第38页,本讲稿共38页

    注意事项

    本文(多变量的可视化分析精.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开