数据挖掘原理与SPSS Clementine应用宝典第22章 数据挖掘结果的输出.ppt
《数据挖掘原理与SPSS Clementine应用宝典第22章 数据挖掘结果的输出.ppt》由会员分享,可在线阅读,更多相关《数据挖掘原理与SPSS Clementine应用宝典第22章 数据挖掘结果的输出.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据挖掘原理与数据挖掘原理与SPSS Clementine应用宝典应用宝典第第22章章 数据挖掘结果数据挖掘结果的输出的输出第第2222章章 数据挖掘结果的输出数据挖掘结果的输出2 2本章包括结果输出的概述表节点的输出通过矩阵方式建立关系表评估预测值的输出数据审核报告统计量输出均值的输出数据的质量报告格式化的报告输出全局量的输出SPSS导出结果 22.1 结果输出的概述结果输出的概述图图22-1输出节点选项板输出节点选项板输出节点选项板包含16种输出节点:表格、矩阵、分析、数据审核、统计量、均值、质量、报告、设置全局量、Publisher、数据库、平面文件、SPSS导出、SAS导出、Excel
2、、SPSS程序。Clementine 系统窗口的右边包含着管理工具,它可以帮助用户浏览目前的输出对象,如图22-2所示。图图22-2 管理工具的输出管理工具的输出从图22-2可以看出,用户可以:打开目前的输出对象,如直方图、评估图和表。保存输出对象。添加输出文件到目前的项目中。从目前的会话中删除未保存的输出对象。为输出对象更改名称。22.2 表节点的输出表节点的输出图图22-3 表节点的设置表节点的设置22.2.1 表节点格式设置表节点格式设置图图22-4 表格节点对话框格式页签表格节点对话框格式页签参数说明:字段:显示了被选字段的名称。格式:设置字段格式。调整:指定怎样在表格列中调整字段值。
3、默认设置是“自动”,符号型值左对齐,数值型右对齐。用户可以不考虑默认设置通过选择左、右或中间对齐。宽度:默认列的宽度是根据字段的值被自动计算出来。不考虑“自动”宽度计算,则取消“自动”宽度,并且在下一个列中输入“手控”的宽度。查看当前字段:默认对话框将显示一系列目前使用的字段。为了显示一系列没被使用的字段,则选择“查看未使用的字段设置”单选按钮。内容菜单:这个页签的内容菜单提供了各种各样的选项和更新选项设置,且还有下一级子菜单。22.2.2 通过表浏览器来操作通过表浏览器来操作图图22-5 表浏览器窗口表浏览器窗口相关参数设置如下:选择单元格:选择单个的单元格只需点击那个单元格。为了选择一个矩
4、形范围的单元格点击所要范围的一个角,拖拉鼠标到另一个角,然后松开鼠标按钮。为了选择一个完整的列,点击那一列的标题。在列的标题上按住shift+Click或按住Ctrl+Click选择多个列。重排列:用户可以移动表中的列,通过点击用户想要移动的列的标题,拖拉它到目的位置。当用户拖拉这一列时,表更新显示新列的次序。搜索表格:在主工具栏搜索按钮激活搜索工具栏,允许用户搜索指定值。用户可以在表中向前或向后搜索,用户可以指定一个区分大小写搜索(Aa按钮),并且用户可以通过使用中断搜索按钮中断一个搜索过程。如图22-6所示。图图22-6 搜索控制被启动的表搜索控制被启动的表生成:这个生成菜单包含节点生成操
5、作。如图22-5所示。(1)选择节点(“记录”):生成一个选择节点,它选择表中被选择的单元格的记录。(2)选择节点(“与”):生成一个选择节点,它选择包含表中被选择的所有值的记录。(3)选择节点(“或”):生成一个选择节点,它选择包含表中被选择的任一值的记录。(4)导出节点(“记录”):生成一个导出节点来建立一个新的标记字段。(5)导出节点(“与”):生成一个导出节点来建立一个新的标记字段。(6)导出节点(“或”):生成一个来源节点来建立一个新的标记字段。22.3 通过矩阵方式建立关系表通过矩阵方式建立关系表图图22-7 矩阵输出的设置矩阵输出的设置相关参数的设置如下:使用:使用的字段,从下列
6、选项中选择一个字段的选择类型:(1)选择:这个选项允许用户为矩阵的行和列选择一个符号型字段。矩阵的行和列通过一系列被选择的符号型字段的值来定义。这个矩阵的单元格包含了下面被选择的汇总统计量。(2)所有标志字段(真值):这个选项要求对数据中每个标志字段生成一个仅有一行和一列的一个矩阵。矩阵中的单元格对于每个标志生成变量组合都为真的计数。(3)所有数值字段:这个选项要求这样的一个矩阵,这个矩阵对于每个数值型字段都是只有一行一列的。这个矩阵中的单元格代表了对于相应的一对字段的交叉积的总和。单元格内容:如果用户已经选择了“选择”字段,用户可以指定被用在矩阵单元格的统计量,选择一个基于计数的统计量,或者
7、选择一个负载字段来概括一个数值型字段,这个概括是基于行和列字段的值的。(1)交叉列表:单元格的值是计数和/或百分数,这个百分数是代表有多少记录是有相应结合的值的。(2)函数:如果用户选择了一个汇总函数,单元值是一个被选择的负载字段值的函数,这个负载字段值是对于有适当的行和列的值的个案的。22.4 评估预测值的输出评估预测值的输出图图22-8 分析节点的分析设置分析节点的分析设置 相关的参数说明:一致性矩阵(用于字符型目标字段):显示对于符号型目标变量的每个被生成的(被预测的)字段和它的目标字段之间匹配的模式。用一个表格来显示,它的行被定义为实际值,列被定义为预测值,每一个单元格里是模式的记录数
8、。绩效评价:对符号型输出的模型显示表现评估统计量。这些统计量报告输出字段的每一类别,是一种平均信息量的度量,这些平均信息量是对于属于那种类别的预测记录的模型中的。置信度图表(如果可用):对于生成一个置信度字段的模型,这个选项报告在置信值上的统计量和它们的关系来预测。对于这个选项有两个设置:(1)阈值用于:报告在指定为百分数的精确度以上的置信度水准。(2)改善精确性:报告这样的置信度水准,在此水准之上的精度是由指定的因子提高的。按分区分割:如果定义了分割数据集,则分别显示各个数据集的分析结果。按用户定义的分析:用户可以指定自己的分析计算用来评估模型。使用CLEM表达式来指定对每个记录应该计算什么
9、和怎样把记录水平得分合并到一个全面的得分。使用函数TARGET和PREDICTED 分别表示目标值(实际输出)和预测值。如图22-9所示为定义用于分析的用户测量标准对话框。参数说明:(1)If:如果用户需要使用依据某些条件而得到不同的计算结果,指定一个条件表达语句。(2)Then:如果If条件是真,指定一个计算。(3)Else:如果If条件是假,指定一个结果。(4)计算得分为:选择一个统计量从个别的得分中计算出一个全面的得分。按字段分解分析:显示可用于中止分析的符号型字段。除了全面分析之外,对每个分解字段的每个类别的一个单独的分析将被报告。图图22-9定义用于分析的用户测量标准对话框定义用于分
10、析的用户测量标准对话框图图22-10分析输出浏览器分析输出浏览器相关的参数说明:输出字段结果:这个分析输出对每个输出字段而言包含一个项,这个输出字段相应于由一生成模型建立的预测字段。比较:在输出字段里,对于每个和那个输出字段有关联的预测字段来说,“项”是一个子部分。对于符号型输出字段,这个“项”的最高层包含一个表,这个表显示了正确和不正确的数目和百分数以及在流中记录的总数。对于符号型输出字段,这个“项”显示了下列信息,如表22-1所示。一致性矩阵:对于符号型输出字段,如果用户需要在分析选项中的一个一致性矩阵,则一个包含此矩阵的子部分就会出现在这里。它的行代表了实际观察值,而列代表了预测值。在表
11、中的单元格则代表了每一个结合了预测值和实际值的记录的数。表现评估:对于符号型输出字段,如果用户要求在分析选项中的表现评估的统计量,则这个表现评估的结果将显示在这里。每一个输出类别及它的表现评估统计量都被列在这里。置信度报告:对于符号型输出字段,如果用户要求在分析选项中的置信度,则即为此值。以下的统计量是为模型的置信度而报告的信息,如表22-2所示。两者协议:如果两个或者更多的预测相同输出字段的生成模型被包括在一个流中,用户会看到由模型生成的预测值之间的一致性统计量。这里包括对于预测值一致(对于符号型输出字段)或者错误的汇总统计量(对于数值型输出字段)的记录的数目和百分数。对于符号型的字段,它包
12、括一个将预测值同实际值对比的分析,是对模型一致(生成相同预测值)的记录的子集的分析。22.5 数据审核报告数据审核报告图图22-11 数据审核节点对话框设置数据审核节点对话框设置相关参数的设置如下:默认:使用系统默认的字段。使用定制字段:为了能初步认识数据,用户可根据自己感兴趣的数据进行分析,点击“字段选取器”图标按钮选择需要的字段。字段:要进行数据审核的字段列表。交叠:此选项在审核报告中经常用于极小图像之中,在数值型数据中,方差和协方差可以算出。显示:数据审核提供了3显示方式:图形、基本统计量、中位数和众数图图22-12 数数据据审审核核输输出出浏浏览览器器相关参数说明如下:审查结果:审查报
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据挖掘原理与SPSS Clementine应用宝典第22章 数据挖掘结果的输出 数据 挖掘 原理 SPSS Clementine 应用 宝典 22 结果 输出
限制150内