数据挖掘原理与SPSS Clementine应用第24章 SPSS_Clementine典型案例分析.ppt
《数据挖掘原理与SPSS Clementine应用第24章 SPSS_Clementine典型案例分析.ppt》由会员分享,可在线阅读,更多相关《数据挖掘原理与SPSS Clementine应用第24章 SPSS_Clementine典型案例分析.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据挖掘原理与数据挖掘原理与SPSS Clementine应用第应用第24章章 SPSS_Clementine典型案例分析典型案例分析第第24章章 SPSS Clementine典型案例分析典型案例分析本章包括:本章包括:市场购物篮分析市场购物篮分析利用决策树模型挖掘商业信息利用决策树模型挖掘商业信息利用神经网络对数据进行欺诈探测利用神经网络对数据进行欺诈探测24.1市场购物篮分析 本节的例子采用Clementine系统自带的数据 集BASKETS1n。该数据集是超市的“购物篮”(一次购物内容的集合)数据和购买者个人的背景数据,目标是发现购买物品之间的关联分析。24.1.1 定义数据源定义数据
2、源24.1.2 理解数据理解数据 在建模之前,我们需要了解数据集中都有哪些字段,这些字段如何分布,它们之间是否隐含着某种相关性等信息。只有了解这些信息后才能决定使用哪些字段,应用何种挖掘算法和算法参数。这个过程就是一个理解数据的过程。24.1.3 准备数据准备数据 在这在这18个字段中,有一些对于挖掘知识来说个字段中,有一些对于挖掘知识来说是没有用的,如是没有用的,如cardid等,这时我们就可以等,这时我们就可以把这些暂时没有用到的字段剔除出挖掘过程。把这些暂时没有用到的字段剔除出挖掘过程。这样可以节约挖掘时间和效率。这样可以节约挖掘时间和效率。24.1.4 建模建模对字段设置完毕之后,下一
3、步就是选择挖掘所需要的模型,在这里我们会选择使用三种不同的模型来挖掘该数据集。1.“Apriori”模型节点2.GRI模型 3.“网络”节点24.2 利用决策树模型挖掘商业信息利用决策树模型挖掘商业信息过程如下:Step1:添加一个“变项文件”节点。Step2:加入一个“导出”节点。Step3:对“导出”节点进行设置。Step4:加入“Healthfood”字段之后,在“导出”节点后再加入一个“类型”节点,用来选择哪些字段用来进行数据挖掘。根据挖掘的目标,可以设置个人信息为“输入”,“Healthfood”设置为“输出”Step5:加入“C5.0”节点。Step6:点选“执行(E)”Step7
4、:从“查看器”中查看该结果输出类型除了选用“决策树”之外,还可以选择“规则集”来显示结果。用“规则集”表示的结果很多时候比“决策树”更加直观、易懂。一般生成的决策树都是经过剪枝的。下面看看剪枝程度的高低对挖掘结果的影响。选中“模式”中的“专家”,把“修剪严重性”的值改为“0”,这意味着在挖掘过程中,进行的剪枝程度将很小。模型名称改为“nocut”。选择“执行(E)”。在右面管理器窗口中选中“模型(S)”,在“nocut”上右击,选择“浏览(B)”,查看生成模型结果。利用剪枝程度较高的决策树、剪枝程度低的决策树、规则集生成的结果,可以通过Clementine系统提供的很多模型来进行精度测试。在这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据挖掘原理与SPSS Clementine应用第24章 SPSS_Clementine典型案例分析 数据 挖掘 原理 SPSS Clementine 应用 24 SPSS_Clementine 典型
链接地址:https://www.taowenge.com/p-88826173.html
限制150内