商务智能原理与基础之关联规则ppt课件.pptx
《商务智能原理与基础之关联规则ppt课件.pptx》由会员分享,可在线阅读,更多相关《商务智能原理与基础之关联规则ppt课件.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第0页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任目目录1 1引言引言2 2商商务智能智能过程程3 3数据数据仓库4 4商商务智能智能应用用5 5构建商构建商务智能智能环境境6 6关关联规则7 7分分类分析分析8 8聚聚类分析分析9 9概念描述概念描述商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第1页没有明确的价值取向和人生目
2、标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任3关联规则关联规则1.关联规则简介关联规则简介2.关联规则挖掘方法关联规则挖掘方法3.关联规则兴趣性关联规则兴趣性4.关联规则知识形式扩展关联规则知识形式扩展5.简单关联规则简单关联规则6.小结及练习小结及练习目目录商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第2页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确
3、的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任关关联(association)规则是当前数据挖掘研究的主要方法之一,它反映一个事是当前数据挖掘研究的主要方法之一,它反映一个事物与其他事物之物与其他事物之间的相互依存性和关的相互依存性和关联性。如果两个或者多个事物之性。如果两个或者多个事物之间存在一存在一定的关定的关联关系,那么,其中一个事物就能关系,那么,其中一个事物就能够通通过其他事物其他事物预测到到典型的关联规则发现问题是对超市中的货篮数据(Market Basket)进行分析。通过发现顾客放入货篮中的不同商品之间的关系来分析顾客的购买
4、习惯。将顾客同时购买的东西,放在比较远的位置,诱导顾客浏览并购买更多的东西。把经常同时购买的商品放在比较靠近的货架上,便于顾客同时购买。商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第3页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任如果我如果我们把商把商场内的所有商品内的所有商品设置置为一个集合,每个商品就是一个数据一个集合,每个商品就是一个数据项(item)。商)。商场的交易数据的交易数据库通常包
5、含每个通常包含每个顾客每一次客每一次购买的商品的商品记录。关。关联规则表达的就是商品表达的就是商品间联动购买的情况的情况购买羽毛球拍的顾客通常也购买浴巾,这种关联关系可以用:羽毛球拍=浴巾这样的关联规则来表示,这样的规则在数据库中是否有代表性,重要性及有用性,需要多个步骤来评判。规则中的数规则中的数据出现的是据出现的是否足够频繁否足够频繁数据之间的数据之间的联系是否足联系是否足够紧密够紧密数据之间的数据之间的联系是否符联系是否符合其他兴趣合其他兴趣性的考虑性的考虑商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第4页没有明确的价值取向和人生目标,实现自我人生价值就无从谈
6、起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任关关联规则的基本概念的基本概念(1)n设I=i1,i2,im为所有项目的集合,D为事务数据库,事务T是一个项目子集(TI)。每一个事务具有唯一的事务标识TID。对于任意非空项集A(A I),如果记录T包含A,则称记录T支持项集A。如果项集A中包含k个项目,则称其为k项集。苹果,橘子,香苹果,橘子,香蕉,梨,西瓜蕉,梨,西瓜标识标识TID项目子集项目子集1苹果2橘子,香蕉3梨,西瓜,香蕉橘子橘子梨,香蕉梨,香蕉商务智能原理与方法商务智能
7、原理与方法2023/3/21版权所有,不得翻印第5页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任关关联规则的基本概念的基本概念(2)n商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第6页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任
8、关关联规则的基本概念的基本概念(3)商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第7页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任案例:商案例:商场记录顾客客购买商品的数据,假商品的数据,假设有数据有数据库D,数据集合,数据集合I=MP3,羽,羽毛球拍,旅游鞋,浴巾,跑步机毛球拍,旅游鞋,浴巾,跑步机购买记录购买记录TID购买商品购买商品T100旅游鞋,浴巾,MP3T200浴巾,跑步机T300浴巾
9、,羽毛球拍T400旅游鞋,浴巾,跑步机T500旅游鞋,羽毛球拍T600浴巾,羽毛球拍T700旅游鞋,羽毛球拍T800旅游鞋,浴巾,羽毛球拍,MP3T900旅游鞋,浴巾,羽毛球拍商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第8页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任案例案例计算算Dsupp(羽毛球拍)=Dsupp(MP3)=Dsupp(旅游鞋,跑步机)=Dsupp(羽毛球拍,浴巾)=假设给定=
10、20%,则上述哪些是频繁集假设给定=20%,=60%,则羽毛球拍=浴巾是否是合格关联规则6/96/92/92/91/91/94/94/9商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第9页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任案例案例总结n如果指定一对项集X和Y,并且要求验证X=Y在数据集T上是否为一个合格关联规则,那么人们可以直接根据上述定义来计算X=Y的支持度和置信度,并且通过与给定的阈值
11、进行比较来判断。n这与很多模型驱动的方法类似,比如给定一个线性回归模型:Y=a+bX+,人们可以通过已经知道的数据来判断模型与数据的符合程度。商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第10页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任发现关关联规则需要需要经历两个步两个步骤,每一个步,每一个步骤都都对应规则生成生成过程中两大程中两大问题种的一个种的一个频繁项集生成满足最频繁项集生成满足最小信任
12、度阈值的规则小信任度阈值的规则找出所有频繁项集。这找出所有频繁项集。这项工作极具挑战性。项工作极具挑战性。发现关联规则需要经发现关联规则需要经历两个步骤历两个步骤规则的生成过程存在两个大问题规则的生成过程存在两个大问题规则数量问题规则质量问题商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第11页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任3关联规则关联规则1.关联规则简介关联规则简介2.关联规则挖掘
13、方法关联规则挖掘方法3.关联规则兴趣性关联规则兴趣性4.关联规则知识形式扩展关联规则知识形式扩展5.简单关联规则简单关联规则6.小结及练习小结及练习目目录商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第12页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任支持度和置信度是支持度和置信度是评估关估关联规则的两个基本的两个基本测度,度,进一步一步讨论关关联规则在在这两两个个测度上的性度上的性质对于关于关联规
14、则的挖掘和的挖掘和应用很有意用很有意义(1)n首先由于Dsupp(X=Y)=Dsupp(XY),我们可知道计算规则X=Y的支持度就等于计算项集XY的支持度。n此外,由于Dconf(X=Y)=|XY|/|X|=(|XY|/|T|)/(|X|/|T|)=Dsupp(XY)/Dsupp(X),我们知道X=Y 的置信度的计算可以通过XY和X的支持度得到。n这样一个挖掘思路就是通过扫描数据库,先计算所有项集的支持度,而后通过支持度计算置信度,而不需要对数据库再次扫描。商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第13页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。
15、人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任进一步一步讨论关关联规则(2)n商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第14页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任进一步一步讨论关关联规则(3)n据此可知,我们计算项集支持度的过程中,可以采用逐层扩展方式,即:先计算1项集,再计
16、算2项集(m-1)项集。当计算k项集支持度的时候(2km-1),只需要考虑哪些其子集是频繁集的k项集,而不必考虑包含非频繁子集的k项集,这样可以优化计算。n这里,我们把计算获得项集支持度的过程称为生成(候选)项集的过程,把计算出由频繁子集组成的项集的支持度的过程称为生成候选频繁集的过程。商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第15页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任Apriori方
17、法是基于上述思路的关方法是基于上述思路的关联规则挖掘的挖掘的经典方法,它是一种基于逐典方法,它是一种基于逐层搜搜索的迭代算法,从索的迭代算法,从k项集生成集生成满足足规则的的k+1项集。集。Apriori算法命名源于算法使算法命名源于算法使用了用了频繁繁项集性集性质的先的先验(Prior)知)知识。nApriori算法将发现关联规则的过程分为两个步骤:n通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;n利用频繁项集构造出满足用户最小信任度的规则。n挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。商务智能原理与方法商务智能原理与方法2023/3/21
18、版权所有,不得翻印第16页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任Apriori算法:算法:变量量说明(明(Ck:k-候候选项集集;Lk:k-频繁繁项集;集;minsup:最小:最小支持度支持度阈值)商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第17页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自
19、我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任实例(最小支持度例(最小支持度50%)Database TDB1st scanC1L1L2C2C22nd scanC3L33rd scanTidItems10A,C,D20B,C,E30A,B,C,E40B,EItemsetsupA2B3C3D1E3ItemsetsupA2B3C3E3ItemsetA,BA,CA,EB,CB,EC,EItemsetsupA,B1A,C2A,E1B,C2B,E3C,E2ItemsetsupA,C2B,C2B,E3C,E2ItemsetB,C,EItemsetsupB,C,E2商务智能原理与方
20、法商务智能原理与方法2023/3/21版权所有,不得翻印第18页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任案例:某案例:某电子商城的子商城的购物物记录,经理很希望知道什么理很希望知道什么样的的顾客客购买了什么了什么样的的手机,手机,购买了某种手机是否了某种手机是否还会会购买另一种手机(另一种手机(设定定=40%,=100%)顾客编号顾客编号数据项数据项女:A男:B青年:C老年:DIphone:ENokia:F1111121
21、1113111411151116111711118111911110111商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第19页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任客客户手机手机频繁集繁集1-itemsetssupport2-itemsetssupport3-itemsetssupportA60%AB0ACF40%B40%AC40%C60%AD20%D40%AE30%E70%AF50%F60
22、%BC20%BD20%BE40%BF10%CD0CE30%CF50%DE40%DF10%EF30%商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第20页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任客客户手机的关手机的关联规则ACAFCFDERulesConfRulesConfRulesConfRulesConfA=C4/6A=F5/6C=F5/6D=E1C=A4/6F=A5/6F=C5/6E=D4/
23、6ACFRulesConfRulesConfRulesConfA=CF4/6C=AF4/6F=AC4/6AC=F1AF=C4/5CF=A4/5商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第21页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任Apriori算法的不足算法的不足多次扫描数据库多次扫描数据库:Ck中的项集是用来产生频集的候选集,最后的频集Lk必须是Ck的一个子集。Ck中的每个元素需在交易数
24、据库中进行验证来决定其是否加入Lk,这里的验证过程是算法性能的一个瓶颈。这个方法要求多次扫描可能很大的交易数据库所挖掘的规则存在大量冗余所挖掘的规则存在大量冗余:算法一定要等到扫描完整个数据库后才做结合,因为在扫描的过程中,有些候选项集在若干的区段中的支持度已大于等于使用者制定的最小支持度,因此在扫描这些若干个区段后,便可以找出频集,并直接结合产生下一个层级的候选物项集商务智能原理与方法商务智能原理与方法2023/3/21版权所有,不得翻印第22页没有明确的价值取向和人生目标,实现自我人生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任没有明确的价值取向和人生目标,实现自我人
25、生价值就无从谈起。人生价值就是人生目标,就是人生责任。每承担一次责任Apriori方法被方法被认为是一个有效的是一个有效的经典的关典的关联规则挖掘方法。挖掘方法。对Apriori方法的方法的进一步一步优化化还可以从下列角度展开。可以从下列角度展开。编号编号算法算法内容内容1Apriori-Tid,Apriori-Hybrid,Hash树DHP算法在频繁项集合生成过程中,对冗余项集合进行剪枝2DIC,Eclat,MacEclat,Clique,MaxClique通过减少对数据库的扫描来提高效率3SETM,MONET从关系数据库操作角度出发,开发出基于关系数据库操作的算法4基于分区操作和基于随即的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商务 智能 原理 基础 关联 规则 ppt 课件
限制150内