2019年-数据挖掘4章节挖掘原语-语言和体系结构ppt课件.ppt
《2019年-数据挖掘4章节挖掘原语-语言和体系结构ppt课件.ppt》由会员分享,可在线阅读,更多相关《2019年-数据挖掘4章节挖掘原语-语言和体系结构ppt课件.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用挖掘原语,语言和体系结构n数据挖掘原语n数据挖掘语言n数据挖掘系统体系结构n总结数据挖掘原语划分挖掘相关的数据挖掘相关的数据 挖掘的知识类型挖掘的知识类型背景知识背景知识模式的兴趣度量模式的兴趣度量结果的表示与可视化结果的表示与可视化经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用任务相关数据任务相关数据n数据库(或数据仓库)名称数据库(或数据仓库)名称n例如:例如:AllElectr
2、onics_dbn数据库表(或数据仓库的立方体)数据库表(或数据仓库的立方体)n例如:表例如:表item,customer,purchase,items_soldn数据选择条件数据选择条件n例如:选取本年度加拿大地区购买商品的数据例如:选取本年度加拿大地区购买商品的数据n选取条件可能在概念上层次高于选取条件可能在概念上层次高于DB/DW的数据的数据n如:如:”type=home entertainment”,DB/DW中数据中数据tv,cd player,vcrn有关的属性(或维)有关的属性(或维)n例如:例如:item表的表的name,price属性属性;customer表的表的income
3、,age属性。属性。n系统应具备自动选取相关属性的机制,比如通过评估各属性与特系统应具备自动选取相关属性的机制,比如通过评估各属性与特定操作的相关程度。定操作的相关程度。n数据分组的标准数据分组的标准n例如:根据日期进行分组例如:根据日期进行分组经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用挖掘的知识类型挖掘的知识类型n描述描述(characterization)n区别分析区别分析(discrimination)n关联关联(association)n分类分类/预测预测(classification/predic
4、tion)n聚类聚类(clustering)经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用n例例:用户如果想发掘用户如果想发掘AllElectronics数据库中用户的购买数据库中用户的购买习惯,可能会选择下面关联规则:习惯,可能会选择下面关联规则:P(X:customer,W)Q(X,Y)=buys(X,Z)X是是customer表的主键,表的主键,P,Q是谓词变量是谓词变量(在相关数在相关数据中定义据中定义),W,Y,Z是目标变量。可能的挖掘结果是:是目标变量。可能的挖掘结果是:nage(X,”3039”)
5、income(X,”40k49k”)=buys(X,”VCR”)2.2%,60%naccupation(X,”student”)age(X,”2029”)=buys(X,”computer”)1.4%,70%经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用背景知识:概念层次背景知识:概念层次n概念层次概念层次n模式层次模式层次(schema hierarchy)(schema hierarchy)n例:例:Streetcityprovince_or_statecountryn集合集合-分组层次分组层次(set-g
6、rouping hierarchy)n例:例:young,middle_aged,seniorall(age)20-39=young,40-59=middle_agedn基于操作层次基于操作层次(operation-derived hierarchy)n包括信息解码,复杂数据对象的信息提取,数据聚类,数据分布分析算包括信息解码,复杂数据对象的信息提取,数据聚类,数据分布分析算法等法等n例:例:email address:login-name department university countryn基于规则层次基于规则层次(rule-based hierarchy)n例:例:low_prof
7、it_margin(X)=price(X,P1)and cost(X,P2)and(P1-P2)B)=n(A nd B)/n(all),nnoise threshold(description)n新颖程度新颖程度(novelty)n如:如:not previously known,surprising(used to remove redundant rules,e.g.,Canada vs.Vancouver rule implication support ratio经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务
8、的费用结果模式的可视化结果模式的可视化n挖掘系统应能够用多种形式来显示发掘挖掘系统应能够用多种形式来显示发掘出来的模式出来的模式n如:规则,表,报表,图表,图,决策数和立方体如:规则,表,报表,图表,图,决策数和立方体n挖掘系统应能够支持挖掘结果的多种操挖掘系统应能够支持挖掘结果的多种操作作n如:如:drill-down,roll-up,slicing,dicing,rotation经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用挖掘原语,语言和体系结构n数据挖掘原语n数据挖掘语言n数据挖掘系统体系结构n总结经营
9、者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用DMQL一个数据挖掘语言n动机动机n为了能提供交互式数据挖掘能力为了能提供交互式数据挖掘能力n通过提供一个类似通过提供一个类似SQL的语言的语言n希望能像希望能像SQL语言一样成为挖掘标准语言语言一样成为挖掘标准语言n希望成为系统开发和演化希望成为系统开发和演化(evolution)的基础的基础n希望促进信息交换,技术转移,商业化并获得广希望促进信息交换,技术转移,商业化并获得广泛承认泛承认n设计设计nDMQL 在前面介绍的挖掘原语基础之上进行设计在前面介绍的挖掘原语基
10、础之上进行设计经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用任务相关数据的语法表示任务相关数据的语法表示nuse database,or use data warehouse nfrom where nin relevance to norder by ngroup by nhaving 经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用任务相关数据语法表示(续)任务相关数据语法表示(续)n例:如果挖掘例:如果挖掘AllElectr
11、onics的加拿大顾客经常购买的商的加拿大顾客经常购买的商品之间的关联,针对顾客不同收入和年龄,并且数据品之间的关联,针对顾客不同收入和年龄,并且数据用购买日期进行分组。挖掘相关数据可以写成用购买日期进行分组。挖掘相关数据可以写成:use database AllElectronics_dbin relevance to I.name,I.price,C.income,C.agefrom customer C,item I,purchase P,item_sold Swhere I.item_ID=S.item_ID and S.trans_ID=P.trans_ID and P.cust_I
12、D=C.cust_IDgroup by P.date 经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用挖掘知识类型的语法挖掘知识类型的语法n:=|n:=Mine characterization as analyze n例:例:mine characteristics as customerPurchasing analyze count%n:=Mine comparison as for where versus where analyze n例:例:mine comparison as purchaseGro
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 数据 挖掘 章节 语言 体系结构 ppt 课件
限制150内