数据仓库的基本特征.pptx
《数据仓库的基本特征.pptx》由会员分享,可在线阅读,更多相关《数据仓库的基本特征.pptx(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、聊城大学数学科学学院周书锋31.业务系统和决策支持系统业务系统:推动企业日常运作的系统,保证业务的正常开展例如:王先生的1012号包裹何时到达?今天,小李是否报到?小王数据结构成绩是多少?查看每个同学的选课情况?本月手机帐单是多少?欧洲的销售怎样?第1页/共51页4决策支持系统的演化信息需求的改变 从信息检索到知识发现What is the sum ofsales in Vancouverthis year?Clerks and ClientsWhat caused theincrease in salesthis year?Business users聊城大学数学科学学院周书锋What ar
2、e myprojected salesnext year?Analysts第2页/共51页聊城大学数学科学学院周书锋5决策支持系统的演化淹没于数据,但饥饿于知识VLDBKnowledgediscoveryToo much dataValuableknowledge第3页/共51页6报告聊城大学数学科学学院周书锋决策者决策支持系统的演化自然演化体系结构对于决策者的即时信息需求,直接从OLTP系统中产生报告 使DBA忙乱不堪也使OLTP负载太重!Ad hoc 存取需求生成平台第4页/共51页7决策支持系统的演化自然演化体系结构从OLTP中将决策者常用的数据抽取出来,单独物理存放,解决了OLTP系统
3、负载太重的问题。抽取数据聊城大学数学科学学院周书锋OLTP决策者第5页/共51页8决策支持系统的演化自然演化体系结构抽取的数据太多和太多层次,产生了蜘蛛网问题,由此导致了一系列问题。抽取数据聊城大学数学科学学院周书锋OLTP决策者第6页/共51页聊城大学数学科学学院周书锋9决策支持系统的演化自然演化体系结构的问题忙碌的IT人员蜘蛛网问题数据缺乏可信性生产率问题从数据到信息的转换的不可行性第7页/共51页10决策支持系统的演化数据仓库的产生为决策者建立一个集成的数据源 数据仓库数据仓库聊城大学数学科学学院周书锋内部数据和外部数据决策者第8页/共51页聊城大学数学科学学院周书锋11业务系统和决策支
4、持系统决策支持系统采取更广泛、更综合的视角,在更长的时间内比较以及采取更有利的决策;例如:本年度东部区域,每个产品每周的出货量是多少?2005年每季度的销售金额是多少?三种套餐,哪种销量最好?2005年与2004年相比,哪种商品的销售数量最多?下一季度如何进货?明年的原材料购买计划?第9页/共51页122.数据仓库的数据源传统业务系统ERP系统电子商务系统数据仓库聊城大学数学科学学院周书锋决策支持第10页/共51页聊城大学数学科学学院周书锋13ERP系统Enterprise Resource Planning,企业资源计划是20世纪90年代初由美国著名的计算机技术咨询和评估集团Garter G
5、roup Inc.提出的一整套企业管理系统体系标准,是指建立在信息技术基础上,以系统化的管理思想为企业决策层及员工提供决策运行手段的管理平台。ERP系统也是事务系统,但它们的数据结构非常标准、规范。与使用ERP系统的贸易伙伴之间处理效率会更高,改善企业内部供应链的上下纵向通信(XML)第11页/共51页聊城大学数学科学学院周书锋14电子商务系统Electronic Commerce企业对企业(B2B)的电子商务系统包括:企业内部网(Intranet)和Internet;并且这些系统都是建立在电子数据交换(EDI,Electronic Data Interchange)基础上的。XML文档(eX
6、tensible Markup Language,可扩展标记语言)第12页/共51页聊城大学数学科学学院周书锋15第13页/共51页聊城大学数学科学学院周书锋3.数据仓库的事实数据维表事实16表第14页/共51页聊城大学数学科学学院周书锋17维表和事实表维表:就是将多维模型映射到关系模型中,用于记录纬度信息的关系表。这些维组成了业务事务的基本实体。事实表:将多维模型映射到关系模型中,用于记录纬度交叉点处的度量信息的关系表。第15页/共51页聊城大学数学科学学院周书锋184.数据仓库的多维数据模型数据立方体:又称多维数据集,是维的交叉点;经典的立方体有产品、时间、地点三维;可以用一个多维数组(纬
7、度1,纬度2,纬度3,纬度n,度量值)表示;超立方体:当纬度值n3时称为超立方体;第16页/共51页数据立方体1998 1999 2000聊城大学数学科学学院周书锋广州上海时间(年)19产品计算机电冰箱电视机地点第17页/共51页聊城大学数学科学学院周书锋20维表事实表多维数据第18页/共51页聊城大学数学科学学院周书锋21产品纬度时间纬度地理纬度销售事实数据第19页/共51页聊城大学数学科学学院周书锋225.数据仓库中的关键名词1、数据提取(Data Extraction)从DW的角度来看,并不是业务数据库中所有的数据都是决策支持所必需的。通常,按照分析的主题来组织数据。例如:某超市确定以分
8、析客户的购买行为为主题建立DW,则只需将与客户购买行为相关的数据提取出来,而超市服务员工的数据就没必要;提取方式:一般通过SELECT、INSERT等语句第20页/共51页聊城大学数学科学学院周书锋23数据提取要经过许多步骤获取:从外部或内部源数据系统中获取对决策支持系统用户有用的数据。过滤:过滤掉不需要的内容。验证:从DSS用户的角度验证数据的质量。融合:将本次抽取的数据仓库中的数据进行融合。综合:对数据进行综合,生成概要级数据。装载:把新数据装入到数据仓库中。存档:把新装入的数据单独存为一个文件,以减少更新操作的数据量。第21页/共51页聊城大学数学科学学院周书锋24注意:现有的数据仓库方
9、案中都有数据提取功能;但是,抽取和转换过分复杂时,需要用户自己编写抽取程序。SQL 2008中能接受第三方的抽取程序(程序按OLE DB规定格式编写)第22页/共51页聊城大学数学科学学院周书锋25数据仓库中的关键名词(续)2、数据清洗(Data Cleaning)和转换清洗:就是将错误的、不一致的数据在进入DW之前予以更正或删除,以免影响决策支持系统的正确性;由于企业常常为不同的应用对象建立不同的业务数据库,如电信公司:计费数据库、帐务数据库、客户数据库、客户投诉数据库等;不同的数据库可能使用不同数据库公司的产品,这样同一数据在不同数据库就会有不一致现象,在转入到DW之前必须进行转换。第23
10、页/共51页聊城大学数学科学学院周书锋26数据仓库中的关键名词(续)3、外部数据源(External Source)指从系统外部获取的同分析主题相关的数据;对于一个好的决策,不但需要系统内部的信息,还需要来自系统外部的相关信息。例如:超市的采购部门要确定采购货单,不但要了解超市内部产品的销售情况,还要了解市场上各种商品的价格水平、质量水平、竞争对手的采购信息等。因此,一个好的决策支持系统必须要综合考虑系统内部和外部的相关数据。第24页/共51页聊城大学数学科学学院周书锋27数据仓库中的关键名词(续)4.数据:内部数据和外部数据5.元数据:描述数据的数据,提供了有关数据的环境。DW元数据包含两类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 基本特征
限制150内