分布式数据仓库PPT.ppt
《分布式数据仓库PPT.ppt》由会员分享,可在线阅读,更多相关《分布式数据仓库PPT.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、少壮不努力,老大徒悲伤 少壮不努力,老大徒悲伤2023/5/19分布式数据仓库PPT锲而不舍,金石可镂 锲而不舍,金石可镂 第6章 分布式数据仓库 6.1分布式数据仓库的类型 6.2开发项目的本质特征 6.3分布式数据仓库的开发 6.4在多种层次上构建数据仓库 6.5多个小组建立当前细节级 6.6公共细节数据采用多种平台 6.7小结 锲而不舍,金石可镂 锲而不舍,金石可镂 6.1 分布式数据仓库的类型 6.1.1局部数据仓库和全局数据仓库 6.1.2技术分布式数据仓库 6.1.3独立开发的分布式数据仓库锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库 业务是在不同
2、地域或不同的生产线上进行的。在这种情况下就出现了局部数据仓库和全局数据仓库。局部数据仓库是在远程站点上提供和处理数据,而全局数据仓库提供的是在整个业务范围集成后的数据。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库什么情况下需要建立分布式数据仓库?当一个企业遍及世界各地时,总部和分支机构都需要信息。中心数据仓库负责采集数据,同时可以满足总部对企业信息需求。但是对于分布在不同国家的各个分支机构,仍然有建立各自的数据仓库的需要。这种情况下,就需要建立分布式数据仓库。数据以集中式和分布式两种方式存在。锲而不舍,金石可镂 锲而不舍,金石可镂站点A站点B 总部站点C 操作
3、型处理 图6-1 许多企业典型的业务处理拓扑图 6.1.1 局部数据仓库和全局数据仓库锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库站点A站点B 总部站点C捕获信息活动捕获信息活动操作型处理图6-2 某些场合,在站点层处理一些基本业务活动捕获信息活动锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库站点A站点B 总部站点C局部操作型处理局部操作型处理局部操作型处理全局操作型处理图6-3 在分支机构要做许多操作型处理锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库1.局部数据仓库局部数据仓库是数据仓库的一种
4、形式,仅包含对分支机构有意义的数据。每个局部数据仓库都有自己的技术、数据、处理器等。局部数据仓库除了作用环境是局部的外,具有与任何其他数据仓库相同的功能。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库图6-5 局部数据仓库锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库2.全局数据仓库局部数据仓库的数据来源于相应的操作型系统,企业全局数据仓库的数据来源通常是局部数据仓库,有时全局数据仓库可能直接被更新。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库图6-6从局部操作型环境到局部数据仓库的数据流锲而不舍
5、,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库全局数据仓库包含了必须在企业级被集成的信息。某些情况下,仅仅包含财务信息,有些情况下,可能包含客户、产品等集成的信息。有相当多的信息专属或仅用于分支机构,而其他企业通用信息需要在企业层次上共享和被管理。全局数据仓库中包含那些需要被全局管理的数据。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库每个局部数据仓库都有自己独有的数据和结构。图6-7局部数据仓库的不同锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库3.全局和局部数据的重叠图6-8全局数据仓库中数据来自于远程
6、的操作型系统锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库分布式数据仓库环境成功的关键是如何将局部操作型系统中数据映射到全局数据仓库的数据结构中。这种映射决定哪些数据要进入到全局数据仓库、数据的结构、必须做的转换。映射是全局数据仓库设计很重要的部分,对于每一个局部数据仓库来说映射都不同。局部商业行为的差异决定了映射到全局数据仓库的方式。锲而不舍,金石可镂 锲而不舍,金石可镂图6-9全局数据仓库有一个公共结构,每个局部站点以不同的方式映射到公共结构锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库局部/全局数据仓库的一种变化形式:将全局
7、数据仓库的数据缓冲区域保存在分时机构。每个局部区域在将全局数据仓库数据传送到中心位置前先将其缓冲。同时有一个重要的问题是:当缓冲全局数据的局部数据仓库中保存的缓冲数据传送到全局数据仓库后应不应该清空,如果分支机构不删除这些信息,将出现冗余数据。锲而不舍,金石可镂 锲而不舍,金石可镂 图6-10全局数据仓库可能在局部层上进行缓冲,然后传送到总部层的全局数据仓库锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库4.冗余全局数据仓库和局部数据仓库的问题之一就是数据的冗余或重叠。(1)一些细节级的数据不用经过任何的转换或变化就进入到全局数据仓库。(2)多数数据在从局部数据仓
8、库导入到全局数据仓库时,要经过某种形式的换算、转化、重新分类或者汇总。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库6-11数据可以存放在局部数据仓库或全局数据仓库,但不能在两者中都放锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库大量冗余:没有正确定义不同级别的数据仓库所辖的范围。蜘蛛网系统不一致的结果、不能很容易的创建新系统、操作的代价问题等等因此,除了少量数据的偶然重叠外,应当对局部数据和全局数据实行互斥,这是一种很重要的策略。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库5.局部和全局数据存取
9、图6-12需要解决的一个重要问题是局部站点是否应访问全局数据仓库锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库这些存取方式正确与否是与查询有关的,他们可能是或者不是数据仓库的正确使用方法。如果分支机构的意图是提高分支机构的效益,那么在分支机构对全局数据的存取可能就是一个好的政策。如果在存取过程中,全局数据被作为信息使用并且仅被访问一次以提高局部业务运作,那么在分支机构上这种存取方式就可能是正确的。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库体系结构化信息环境中信息请求的路径选择问题:当仅仅存在一个中心数据仓库时,此关系问题不大,
10、但当数据分布在一种复杂环境中时,例如分布式数据仓库,就需要考虑如何确保信息请求来自正确的地方。锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库数据从局部数据仓库到全局数据仓库的传输,对这个问题需要考虑很多因素:*从局部环境到全局环境数据传输的频率如何?全局数据仓库要求数据传输要多快?在分支机构出现了多少业务活动?要传输的数据量是多少?锲而不舍,金石可镂 锲而不舍,金石可镂 6.1.1 局部数据仓库和全局数据仓库*从局部环境到全局数据仓库的传输是否合法?一些国家有严格的规定来限制一些特定数据的传输出入。*从局部环境到全局环境的数据传输需要什么样的网络?在因特网上可以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 数据仓库 PPT
限制150内