数据挖掘原理与SPSS Clementine应用宝典第20章 数据的图形化展示.ppt
《数据挖掘原理与SPSS Clementine应用宝典第20章 数据的图形化展示.ppt》由会员分享,可在线阅读,更多相关《数据挖掘原理与SPSS Clementine应用宝典第20章 数据的图形化展示.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据挖掘原理与数据挖掘原理与SPSS Clementine应用宝典应用宝典第第20章章 数据的图形化数据的图形化展示展示第第20章章 数据的图形化展示数据的图形化展示2 2本章的主要内容本章的主要内容图表类型图表的创建使用图表散点图的显示条形图的绘制绘制直方图收集图显示多重散点图网络图显示评估节点图时间散点图的显示图图20-1 图形节点选项板图形节点选项板20.1图表类型图表类型层叠图三维图动画效果图 20.1.1 层叠图层叠图图图20-2以颜色为层次的图以颜色为层次的图图图20-3 以大小为层次的图以大小为层次的图图图20-4以颜色、大小、形状和透明度为层次的图以颜色、大小、形状和透明度为层
2、次的图图图20-5以面板图为层次的图以面板图为层次的图20.1.2三维图像三维图像有两种创建 3-D图像的方法:(1)将信息绘制在三维坐标轴上(真正的 3-D图像)。(2)将图像用 3-D效果显示。这两种方法对于散点图和收集图(如图20-6所示)来说都是可用的。图图20-6 三维收集图三维收集图 将信息绘制在一个三维坐标轴上步骤如下:在图表节点对话框中,选择“散点图”页签。单击“3-D”图标按钮启动 Z轴的选项。使用“字段选取器”图标按钮来为 Z轴选择一个字段。在一些情况下,只可以使用符号字段。字段选取器将显示合适的字段。如果要对图像加3-D效果显示。可以在已经创建图表的输出窗口中选择“图形”
3、对象,单击“3-D”图标按钮来将视图转换为三维图像。20.1.3动画效果动画效果散点图、多重散点图和直方图可以被设计为动画形式。使用带有三个类别的变量的动画点图如图20-7所示。一旦用户已经作出了一个带有动画效果的图像,就可以用各种方式使用动画工具:(1)在任何时点暂停动画按钮。(2)使用拖动滑块在想要观看的点处观看。图图20-7动画散点图动画散点图20.2 图表的创建图表的创建对于所有图形类型,用户都可以为生成的文件名和显示方式指定以下选项。输出到屏幕:选择在一个 Clementine 窗口内产生并显示图像。输出到文件:选择将生成的图像保存为一个文件,此文件的类型是文件类型下拉列表中给定的。
4、文件类型:可用的文件类型有:(1)Bitmap(.bmp)(2)JPEG(.jpg)(3)PNG(.png)(4)HTML document(.hml)(5)Vizml(.xml)(6)Output object(.cou).文件名:指定生成的图所用的文件名。使用自定义()按钮来指定一个文件及其位置。图图20-8 散点图对话框输出设置散点图对话框输出设置 对于除了条形图以外的所有图来说,用户可以在图创建之前或者探索已生成图时指定外观选项。如图20-9所示为散点图对话框外观页签。图图20-9散散点点图图对对话话框框外外观观设设置置 相关参数的说明如下:设置用于:使用下拉列表来选择“标题”、“说明
5、”或“标签”。X(Y)标签:只可用于“标签”中,用户可选择“定制”来为X(Y)轴指定一个常用标注。Z标签:可以选择“定制”来为Z轴指定一个常用标注。显示网格线:这个选项是默认选定的,它在点或图后面显示出网格线使得用户可以更容易的确定区域和带的分割点。网格线常常显示为白色,除非图像背景也是白色的,这时它们显示为灰色。用户创建图形后,可用一些方法制定和操作我们创建的图形,允许的操作方式包括:使用鼠标来选择一个图表区域以便进行更深入的操作。使用菜单栏中可用的选项。不同的图表可能有不同类型的可用菜单和选项。在选定区域上右击鼠标右键,给这个区域提供可用的内容菜单,如图20-10所示。图图20-10 在已
6、选定区域中带有内容菜单的散点图在已选定区域中带有内容菜单的散点图还可以依据已创建图表的不同类型来执行下述操作:使用鼠标高亮度表示划定的矩形数据区域。通过点击图像区域,高亮度表示直方图和收集图上的数据带。识别并标注用户的数据子集。基于图表上选定的区域来生成操作节点。图图20-11 图形窗口文件菜单和工具栏图形窗口文件菜单和工具栏 20.3 散点图的显示散点图的显示图图20-12散点图节点的设置散点图节点的设置 相关参数的说明如下:X(Y)字段:从列表中选择一个字段并显示在X(Y)轴上,也被称为水平(垂直)轴或者横(纵)坐标。Z字段:当用户点击“3-D”图标按钮()时,第三个字段变得可用,用户可以
7、从列表中选择一个字段并显示在Z轴上。交叠字段:包括颜色、大小、形状、面板、动画、透明度等。交叠函数:选择指定一个已知函数,将其比作实际的数值。20.4.3使用散点图使用散点图使用层叠,将会用图示说明在申报(值或数字)和谷物的类型之间是否存在一定的关系。如图20-13所示。图图20-13 反映变量值和需求关系的散点图反映变量值和需求关系的散点图20.3.1 定义一个区域定义一个区域使用鼠标来定义一个区域的步骤:在图中某个地方点击鼠标的左键来定义区域的一角。为了定义区域的另一个对角,将鼠标拖动到需要的位置。结果得到的矩形不能超过轴的边界。放开鼠标按键来为这个区域创建一个永久矩形。新创建的区域被默认
8、称为区域N,如图20-14所示。图图20-14 定义一个区域定义一个区域按照以下方式使用鼠标,这样可以在图像窗口中产生反馈信息。在数据点上方停留鼠标可以提供此点所特有的信息,如图20-15所示。在一个区域中右击并按住鼠标按钮,以提供关于此区域边界的信息,如图20-16所示。直接在一个区域内右击鼠标来弹出一个带有更多选项的内容菜单,比如产生过程节点。图图20-15 提示区域内某点特有的信息提示区域内某点特有的信息图图20-16提示区域边界信息提示区域边界信息20.3.2 删除已创建的区域删除已创建的区域 在已定义区域的任何地方点击鼠标右键。从内容菜单中,选择“删除区域”选项。如果用户已经定义了一
9、个区域,那么用户可以选择一组记录,选择的标准是它们是否被包括在一个特定区域里或者在几个区域中。通过生成一个导出节点来标记记录标记的标准是它们是否被包括在一个区域中,用户还可以为一条记录合并区域信息。20.3.3 编辑图像区域编辑图像区域 选择“编辑”/“图形区域”菜单,即可打开如图20-17所示的编辑图形区域对话框来编辑。图图20-17 编辑图形区域对话框编辑图形区域对话框用户可以用以下方式编辑图像区域。在区域名称栏输入对已定义区域名的调整。手动的通过调整X,Y的最小值,最大值来指定区域边界。通过指定名称和边界来加入新的区域。然后按下回车键来开始新的一行。通过在表格中选定一个区域,并单击删除按
10、钮来删除一个区域。20.4 条形图的绘制条形图的绘制一个条形图像表现的是,在一个数据集中,符号型(非数值型)变量值的发生情况。条形图节点的一个典型用途是展示出数据中的不平衡。这种不平衡是可以通过在建构一个模型之前使用平衡节点来调整的。用户可以利用一个条形图形窗口中的内容菜单来自动生成一个平衡节点。图图20-18条形图节点设置条形图节点设置 相关的参数设置如下:散点图:选择“选定字段”单选按钮可以指出选定字段的分布。选择“所有标志字段”单选按钮可以为数据集中的标记字段指出其真实值的分布。字段:用来显示变量值的分布。交叠字段:在上面已经选定字段的每个变量值中说明它的变量值分布。颜色:选择按比例决定
11、条形,以使得所有条形能占满整个图形的宽度。排序:选择在条形图中用来显示变量值的方法。比例尺:选择按比例决定的变量值分布。图图20-19 反应儿童反应数量的条形图反应儿童反应数量的条形图图图20-20 条形图生成菜单选项条形图生成菜单选项其下一级子菜单选项说明如下:选择节点:从图像中选择任何一个单元来为这个类别产生一个选择节点。导出节点:从图形中选择任何一个单元来为这个类别产生一个导出标志节点。平衡节点(增加):这个节点将增大较小数据子集的规模。平衡节点(减少):使用这个选项来生成一个平衡节点,这个节点将减小较大数据子集的规模。重新分类节点(组):这个节点将按组分类以减少数据子集的规模。重新分类
12、节点(值):这个节点将按值分类以减少数据子集的规模。从一个条形图中选择并且复制变量值,具体步骤如下:单击并按住鼠标左键不放,同时拖动鼠标来选择一组变量值。用户可以使用“编辑”菜单来选择所有变量值。在“编辑”菜单中,选择“复制”命令。贴到剪贴板上或者到想要放置的应用程序中即可。20.5 绘制直方图绘制直方图图图20-21直方图的参数设置直方图的参数设置 相关的设置参数如下:字段:选择一个数值型字段,展示这个字段变量值的分布。交叠字段:选择一个符号型字段来为以上选定的字段显示变量值的类别。直方图有种层叠方式,分别是:颜色、面板、动画。20.5.1 定义变量值的区域定义变量值的区域点击直方图中的任何
13、一个位置,设置一条线来定义一个变量值的区域。或者,单击工具栏中的“区域”图标按钮,将图像分成相等的区域。这种方法为工具栏添加了更多选项,用户可以使用这些选项来指定大量的相等区域。如图20-22所示。通过以下方式用鼠标在图像窗口中生成一个反馈信息:将鼠标放在条柱上不动,可以提供关于条柱的特定信息。通过在一个区域中右击鼠标并阅读窗口底部的反馈显示屏,可以检查一个区域的变量值范围。简单地在一个区域中右击鼠标,可以弹出一个带有更多选项的内容菜单,比如生成过程节点。通过在一个区域中右击鼠标并选择“重命名带状区域”可以为区域重新命名。区域的名字被预设为区域N,这里的 N等于从 x 轴左端到 x 右端的区域
14、个数。通过用用户的鼠标选定一条区域线并将它移动到 x 轴上所希望放置的位置,可以移动一个区域的边界线。通过在一条线上右击鼠标并选定“删除带状区域”选项,可以删除区域。20.5.2 在一个特定段中选择或标在一个特定段中选择或标记记录记记录在区域中单击鼠标右键。注意区域的详细信息是显示在图形下部的反馈信息显示屏中的。从内容菜单中选择“生成带状区域的选择节点”选项或者“生成带状区域的导出节点”选项。“选择节点”选项选定的是在区域中的所有记录。而“导出节点”选项则是为变量值落入区域的记录生成一个标记。标记的字段名称与区域名称是相对应的,对于在区域内部的记录设置标记为 T,而对于在外部的记录则设置标记为
15、 F。20.5.3 为所有区域中的记录生成集合从图像窗口的“生成”菜单中选择“导出节点”选项一个新的导出设置节点出现在带有选项的流程区域中,这些选项是为了给每个记录创建一个新的被称为“区域”的字段而设置的。这个字段的变量值等于每个记录落入的区域名称。20.5.4 编辑图型区域编辑图型区域选择“编辑”菜单的“图形带状区域”,打开编辑区域对话框,如图20-23所示。在“带状区域名称”栏用户可以给已经定义的区域名键入调整值。用户可以通过调整 X和 Y的最大值和最小值来手动地指定区域的边界通过指定名称和边界来加入新的区域。然后按下回车键来开始新的一行。通过在表格中选择一个段并且点击“删除”按钮来删除段
16、。图图20-23 编辑图形带状区域对话框编辑图形带状区域对话框20.6 收集图显示收集图显示图图20-24 收集图节点的参数设置收集图节点的参数设置相关设置的参数如下:收集:选择一个字段,其变量值将在“超出”中被聚集,并显示在下面给定字段的变量值范围中。只有尚未被定义为符号型的字段才能被列出。超出:选择一个字段,其变量值将被用来显示上面指定的收集图字段。由:在创建一个3D图像时被激活,这个选项允许用户选择一个用来按类别显示收集图字段的设定或标记字段。操作:选择收集图中的每个条柱都分别代表什么。选项包括“合计”、“平均值”、“最大值”、“最小值”、“标准差”。交叠字段:选择一个符号型字段来指示上
17、述已选定字段的变量值的类别。选择一个转换收集图的交叠字段,可为每个类别都建立不同颜色的多重条柱。交叠方式有:颜色、面板、动画。图图20-25 3-D收集图收集图图图20-26 二维收集图二维收集图一旦用户已经创建了一个收集图节点,图像窗口中的一些选项就可用了。例如,用户可以:将X 轴上的数值范围划分为区段。以是否包含在一个特殊段的数值范围内为依据,生成一个选择或导出标记节点。选择一个导出集合节点,它可以指示出哪个区段包含一个记录的变量值。生成一个平衡节点来纠正资料中的不均衡状况。20.7多重散点图节点多重散点图节点多重散点图是一种特殊类型的散点图,它显示的是一个单独的 X字段对应多个 Y字段的
18、情况。Y字段被绘制成带有颜色的线,而且每条线都与一个Y模式被设置为线、X模式被设置为“排序”的散点图节点等价。当用户有时间序列数据,并希望能发掘出某些变量在一定时间内的波动状况时,多重散点图时十分有用的。图图20-27 多重散点图节点对话框多重散点图节点对话框相关设置参数如图所示:X字段:选择一个沿着X轴显示的字段。Y字段:从列表中选择一个或多个字段来显示Y字段变量值的整个范围。交叠字段:有两种方式:面板和动画。标准化:此选项是为了能在图上显示而将所有Y变量值按比例缩小到0和1之间。标准化可以帮助用户发掘图中没有清楚显示出来的线条之间的关系。图20-28、20-29所示分别为标准化前和标准化后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据挖掘原理与SPSS Clementine应用宝典第20章 数据的图形化展示 数据 挖掘 原理 SPSS Clementine 应用 宝典 20 图形 展示
限制150内