网站数据分析的一些问题3:数据仓库相关的问题.doc
《网站数据分析的一些问题3:数据仓库相关的问题.doc》由会员分享,可在线阅读,更多相关《网站数据分析的一些问题3:数据仓库相关的问题.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流网站数据分析的一些问题3:数据仓库相关的问题.精品文档.之前的文章网站数据分析的一些问题2中主要整理了BI相关的问题,这篇文章主要想整理一些数据仓库相关的问题。因为最近重新在看一些数据仓库的资料和书籍,想把之前以及当前遇到的主要问题提出来(博客中有关数据仓库的相关内容请参阅网站数据仓库这个目录),同时自己也对数据仓库方面的知识进行下重新的整理和认识,而且很久没有在博客发新的文章了,不能让自己过于懒散了。之前看过Inmon的构建数据仓库和DW 2.0,而另外一位数据仓库大师Kimball的数据仓库生命周期工具箱一直没有时间阅读,最近才有时间看完
2、了大部分,就迫不及待想写点东西了。其实数据仓库领域普遍认为Inmon和Kimball的理论是对立的,两者在构建数据仓库上方向性的差异一直争论不休,谁也无法说服谁到底哪种方法更好。我的Evernote的笔记里面不知什么时候从哪里摘录过来了对两者观点的概括性描述,非常简洁明了而一针见血:Inmon vs KimballKimball Let everybody build what they want when they want it, well integrate it all when and if we need to. (BOTTOM-UP APPROACH)Pros: fast to
3、build, quick ROI, nimbleCons: harder to maintain as an enterprise resource, often redundant, often difficult to integrate data martsInmon Dont do anything until youve designed everything. (TOP-DOWN APPROACH)Pros: easy to maitain, tightly integratedCons: takes way too long to deliver first projects,
4、rigid其实看了数据仓库生命周期工具箱之后,发现两者的观点没有那么大的本质性差异,可能随着数据仓库的不断发展,两者在整体的架构上慢慢趋同。基本上,构建统一的企业级数据仓库的方向是一致的,而Inmon偏向于从底层的数据集成出发,而Kimball则趋向于从上层的需求角度出发,这可能跟两者从事的项目和所处的位置有关。有了上面这段高质量的概括,第一个问题你更偏向于以何种方式搭建数据仓库(BOTTOM-UP or TOP-DOWN),分别有什么优劣势?其实就不用问了,所以下面主要提几个在实际中可能经常遇到或者需要想清楚的问题:Q1、数据仓库的技术解决方案有哪些,这些解决方案的优势在哪,瓶颈在哪?随着数
5、据仓库的不断发展和成熟,“大数据”概念的风靡,有越来越多的相关产品出来,最常见的技术解决方案包括hadoop和hive,oracle,mysql的infobright,greenplum及nosql,或者多个结合使用。其实归纳起来就两类:一是用传统RDBMS为主导的数据库管理数据,oracle、mysql等都是基于传统的关系型数据库,优势就是有更严谨的数据结构,关系型数据库对数据的管理更加规范,数据处理过程中可能出现的非人为误差极小,而且标准的SQL接口使数据获取的成本较低,数据的查询和获取更加灵活和高效;但劣势也很明显,对海量数据的处理和存储的能力不足,当数据量达到一定程度的时候就会出现明显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网站 数据 分析 一些 问题 数据仓库 相关
限制150内