数据仓库、OLAP和数据挖掘的比较分析.doc
《数据仓库、OLAP和数据挖掘的比较分析.doc》由会员分享,可在线阅读,更多相关《数据仓库、OLAP和数据挖掘的比较分析.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流数据仓库、OLAP和数据挖掘的比较分析.精品文档.数据仓库、OLAP和数据挖掘的比较分析我国银行的信息化可以大致划分为3个阶段:业务自动化、数据集中化、管理信息化。以工、农、中、建、交为代表的综合性大型商业银行都已陆续完成了第二阶段的转变数据集中。如何运用银行在历年经营中积累的海量数据,利用信息技术的发展,将数据转变为信息,进而发觉其中存在的商业价值,是各大银行信息化第三阶段转变的关键。数据仓库、OLAP和数据挖掘等信息技术经历了数年的应用与发展,不断趋于成熟和完善,它们为银行的信息化管理提供了可靠的技术支撑平台。 一、数据仓库、OLAP和数
2、据挖掘的关系和区别分析 1.数据仓库、OLAP和数据挖掘三者之间的关系 在比较成熟的系统中,数据分析过程都是基于以数据仓库为基础,OLAP和数据挖掘相辅相成的分析模式(如图1所示)。数据仓库将来自于各种数据源的数据,根据不同的主题进行存储,并对原始数据进行抽取、转换和加载等一系列筛选和清理工作。OLAP则将数据通过多维视角和多种层次向用户进行多方式的呈现。数据挖掘则应用不同的算法,向用户揭示数据间的规律性,从而辅助商业决策。比如,在银行间盛行的CRM(客户关系管理)的应用中,数据仓库以面向“客户”为主题进行数据筛选、存储;OLAP负责分析客户的基本信息、储蓄账户信息、历史余额信息、银行交易日志
3、等,以动态分析报表、直方图、折线图、饼图等形式展现给管理者,让他们从多方面了解和掌握客户的动态,从而发现客户的交易习性、客户流失形式,更好地针对不同类型的客户,在不同时期进行适应性产品的营销活动。数据挖掘则可以通过历史数据建立模型,在拟合历史的基础上,分析未来趋势,判断哪些因素的改变将很可能意味着客户的最终流失,进而避免其发生。 2.从数据库到数据仓库 传统的数据库技术可以划分为两大类:操作型和分析型。操作型也称为事务处理,是对数据库联机的日常操作,通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务,注重响应时间,数据的安全性和完整性;分析型是针对特定问题的联机访问和分析,通过对信
4、息多种可能的观察形式进行稳定、一致和交互性的存取,允许分析人员对数据进行深入观察。传统数据库能够满足企业日常事务处理工作,但难以实现对数据分析和多样化处理的要求,数据仓库的出现弥补了这一缺憾,将原来以单一的数据资源,即数据库为中心的数据环境发展成为一种面向主题的体系化环境,专门用于支持高层决策分析。数据仓库并不是取代数据库,绝大部分的数据仓库还是采用关系数据库管理系统来管理数据。 3.OLAP和数据挖掘的区别与联系 OLAP和数据挖掘的主要区别在于:在辅助决策时,前者是基于用户建立的一系列假设驱动,通过OLAP来证实或者推翻这些假设,是一个演绎推理的过程;数据挖掘是通过归纳的方式,在海量数据中
5、主动找寻模型,自动发掘隐藏在数据中的价值信息。比如:一个OLAP分析师可能认为,在某一区域开办信用卡的用户会更主动地进行消费。对于这个假定,他可能去观察在那些富裕地区申办信用卡的用户的信用卡账户属性。如果结果还不够明显,他也许要将年龄因素考虑进去。一直这样下去,直到他认为他找到了能够决定是否主动进行信用卡消费的各种变量,然后再根据这些变量,策划他的银行产品的营销方式,最大程度上将营销资源放在最可能接受他们产品的客户对象上。对于数据挖掘分析师,我们假设他也得出了和这个OLAP分析师同样的结论,但是他们得出结论的方式却孑然相反。数据挖掘分析师把各种因素或者变量放在数据挖掘工具中,由挖掘工具自行建立
6、模型,在去除一系列与信用卡消费不相关或者不显著的因素或者变量后,也得到了同样的结果。在这里我们假设都是区域和年龄因素,当然也可能两者得出的因素或者变量不尽相同。简单地描述两者的区别:相对于OLAP,数据挖掘把更多的主动权交给了挖掘工具,在一定程度上,可以看成是人工智能的初级应用。此外,OLAP限于结构化数据,侧重与用户的交互、快速响应以及提供多维视图,而数据挖掘还可以分析诸如文本的、空间的和多媒体的非结构化数据。 虽然两者在不同角度和层面上存在很大的差异,但OLAP与数据挖掘也有一定的互补性。OLAP本身的分析结果能够为数据挖掘提供分析依据,数据挖掘可以拓展OLAP的分析深度,发掘更为复杂、细
7、致的信息,它们之间的关系如图2所示。 二、数据仓库、OLAP和数据挖掘在银行业中的应用与比较 1.数据仓库设计 银行在近10年来的信息化进程中,从开发应用储蓄、会计、信贷、资金等业务子系统,到建立以综合业务系统为核心,其他子系统为辅助的现在银行业系统架构,积累了丰富的信息资源。面对多样化的软、硬件平台,管理者和决策者如何有效地整合分散的应用系统以提取潜在的商业价值,成为新一代银行信息化发展方向的重要课题。目前,经过市场的推广和业界的肯定,数据仓库已逐渐成为银行加强经营管理、开发新型产品、提高服务水平、提供差异化服务的重要平台。 按照数据仓库以面向主题的应用原则,我们以个人信用卡消费趋势为主题,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 OLAP 数据 挖掘 比较 分析
限制150内