Clementine自带实例_数据审核.pptx
《Clementine自带实例_数据审核.pptx》由会员分享,可在线阅读,更多相关《Clementine自带实例_数据审核.pptx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Clementine应用程序示例分析数据准备(数据审核节点)数据审核节点为你导入Clementine中的数据提供广泛的预览功能。数据审核报告不但展示每个字段的统计摘要,还提供直方图和分布图以及让你选择缺失值、离群值、极值的处理方法。用到的文件1.demosSegmentation_Moduletelco_dataaudit.str 2.demostelco.sav加入SPSS源节点,并指向telco.sav将SPSS源节点指向新加入的类型节点并将churn置为目标字段(即方向为输出)。其他字段应为输入,所以只有churn是唯一的目标确认字段都被正确定义了,例如只有0和1二值的可以被标识为fla
2、g类型。但一些特定字段如性别,看为二值集合则更精确。技巧:要改变多个有相似值的字段的属性(如0/1),可单击“值”字段对该列进行排序,用shift键选择所有你想改变值类型的字段,然后通过右击鼠标完成。添加数据审核节点到流中,在设置标签中,保持所有设置为默认,以确保所有的字段都 在报告内。尽管churn字段是唯一的目标字段,但是它还是会自动包含在报告中的。在质量标签,保留检测缺失值,离群值和极值的默认设置,点击执行。数据审核节点即展示每个字段的缩略图和描述性统计信息。下图的工具条按钮可以改变直方图的方向,以及编辑需要展示的统计量。双击报告中的缩略图可查看完整版的图片。并且还能通过上面那排工具按钮
3、对图形进行进一步编辑。作为可选的,你可以选择一个或多个缩略图并为之产生图形节点。生成的节点会放到流画布上,可以被添加到流中复用。质量标签展示了离群值,极值和缺失值你也可以制定处理这些值的方法,并生成超节点以便自动完成 转换例如你可以选择一个或者多 个字段,再选 择相应的处理 方法,其中包 括C&RT算法。在选择相应的处理方法后,我们可以从下左图所示菜单生成缺失值超节点生成的超节点可连接至流中事实上,超节点包含了一系列转换节点,为了了解超节点是如何工作的,你可以编辑超节点,并按“放大”对于每个用算法估算的字段来说,例如将有一个独立的C&RT模型加上 填充节点用来预测并填充缺失值你可以增加,编辑或删除超节点内 部特定的节点,以便制定特定的行 为可选的,可以生成一个选择或者 过滤节点以移除或记录缺失值。例如,你可以设置质量百分比来 过滤字段字段离群值和极值也可以被相似的方 式处理。可以对每个字段做相应 的操作如强制转换,丢弃或者置 空,并产生相应的超节点用于做 转换。完成审计并将产生的节点添加到流以后,你可以继续你的分析。你还可以按自己意图添加异常检测节点,特征选择节点或其他方法,以进一步检验和展示数据。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Clementine 实例 数据 审核
限制150内