《《数据仓库与数据挖掘技术》第4章:信息分析的基本技术.ppt》由会员分享,可在线阅读,更多相关《《数据仓库与数据挖掘技术》第4章:信息分析的基本技术.ppt(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4章章 信息分析的基本技术信息分析的基本技术 v4.1自动信息分析的基本技术v4.1.1 智能代理v4.1.2 群体智能v4.1.3 小波分析v4.1.4 分形技术分析v4.2联机分析v4.2.1 联机分析OLAP的基本术语v4.2.2 OLAP体系结构和处理的特性v4.2.3 OLAP多维数据结构与OLAP的分类v4.2.4 OLAP的多维数据分析方法v4.2.5 OLAP评价准则v4.2.6 OLAP的发展与流行的OLAP工具选择v4.3Rough的信息分析技术v4.3.1 粗糙集理论的基本概念和理论基础v4.3.2 粗糙集在信息分析中的特征表示v思考练习题四信息分析技术的不同方面与层
2、次分类 4.1.1智能代理智能代理v智能代理(Agent)是一种在计算机网络上无疲劳工作执行重复性、可预料任务的,为人们建立知识的软件包。v智能代理具有长期性、半自动化、参与活动,且具有适应性。1智能代理定义智能代理定义vAgent的设计是用来完成某类任务的,能在一定环境中自主发挥作用、有生命周期的计算实体。Agent 是一种抽象实体,它能作用于自身和环境,并能对环境做出反映,具有知识、目标和能力。2多多Agent与移动与移动Agentv多Agent是由多个可执行网络计算的Agent组成的集合,能对问题求解,能随环境改变而自动修改自己的行为,并能通过网络与其他Agent进行通信、交换、合作,协
3、同完成求解同一问题的分布式智能系统。v移动Agent是Agent 与Internet技术相结合的产物,它可以自主地在网络上从一台主机移动到另一台主机,根据用户指定的任务进行自动检索、收据和过滤信息,代表用户进行商务活动。3建造建造Agent的方法的方法4.1.2 群体智能群体智能1蚁群算法蚁群算法2多多Agent分布式的市场营销知识获取结构分布式的市场营销知识获取结构多Agent分布式市场营销知识获取结构4.1.3 小波分析小波分析v小波变换是一种信号处理技术,它将一个信号分解为不同频率的子波段。在实际工程中,有用信号通常表现为低频信号或是一些比较平稳的信号,而噪声(离群)则通常表现为高频信号
4、。4.1.4 分形技术分析分形技术分析v分形理论(fractal theory)的创始人Mandelbrot在20世纪60年代就应用自相似性和标度不变性,对棉花价格进行了研究。v称集F是分形的,是具备如下典型的性质:v1)F具有精细的结构,即有任意小比例的不规则的细节;v2)F是如此的不规则以至于无论它的整体和局部都不能用微积分或传统的几何语言来描述;v3)F通常有某种自相似或自仿射的性质,可能是近似的,也可能是统计近似意义上的;v4)一般地F有“分形维数”(以某种定义),通常严格大于它的拓扑维数;v5)在大多令人感兴趣情形下,F以非常简单的方法,可能由迭代给出定义;v6)F通常有“自然”的外
5、貌。4.2.1联机分析联机分析OLAP的基本术语的基本术语v定义1 OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。v定义2 OLAP(联机分析处理)是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的,并对真实反映企业数据特性的信息进行快速、一致、交互地存取,从而获得对数据更深入了解的一类软件技术(OLAP委员会的定义)。vOLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以
6、说是多维数据分析工具的集合。4.2.2 OLAP体系结构和处理的特性体系结构和处理的特性4.2.3 OLAP多维数据结构与多维数据结构与OLAP的分类的分类1OLAP多维数据结构多维数据结构2OLAP的分类的分类4.2.4 OLAP的多维数据分析方法的多维数据分析方法1切片(切片(slice)2切块(切块(Dice)3旋转(旋转(turning)/转轴转轴(pivot)4钻取钻取(drill)4.2.5 OLAP评价准则评价准则v准则1 OLAP模型必须提供多维概念视图。v准则2 透明性准则。v准则3 存取能力准则。v准则4 稳定的报表性能。v准则5 客户/服务器体系结构。v准则6 维的等同性
7、准则。v准则7 动态的稀疏矩阵处理准则。v准则8 多用户支持能力准则。v准则9 非受限的跨维操作。v准则10 直观的数据操纵。v准则11 灵活的报表生成。v准则12 非受限维与聚集层次。4.2.6 OLAP的发展与流行的的发展与流行的OLAP工具选择工具选择1OLAP的发展的发展2流行的流行的OLAP工具选择工具选择1)Hyperion Essbase:2)Oracle Express 3)IBM DB2 OLAP Server 4)Sybase Power dimension 5)Informix Metacube 4.3.1 粗糙集理论的基本概念和理论基础粗糙集理论的基本概念和理论基础1.知识、划分与等价关系知识、划分与等价关系2.信息表、不可分辨关系和基本集信息表、不可分辨关系和基本集3.粗糙集的下、上近似及边界区粗糙集的下、上近似及边界区4.3.2 粗糙集在信息分析中的特征表示粗糙集在信息分析中的特征表示v定义4 设U是论域,=1,2,m是对象集,v ,中任何对象所具有的特征所组成的集合,称为特征集(property set):T=t1,t2,tn。这些特征可由如下的“属性-值”表示:t=(a,v),。由特征集构成的表,称之为特征表
限制150内