第4章数据仓库中的维度与粒度精选PPT.ppt
《第4章数据仓库中的维度与粒度精选PPT.ppt》由会员分享,可在线阅读,更多相关《第4章数据仓库中的维度与粒度精选PPT.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章数据仓库中的维度与粒度第1页,本讲稿共25页4.3 溢出存储器溢出存储器n应该考虑五年后如下因素:n有更多的技术管理大量数据n硬件费用下降n功能更强大的软件工具n最终用户更加专业化第2页,本讲稿共25页4.3 溢出存储器溢出存储器n历史数据与细节数据造成了数据的显著增长n根据数据使用频率,可将数据分为二类:n经常使用的数据n不经常使用的数据(睡眠数据)n解决方案:n睡眠数据转移至海量备用存储器或近线存储器n常用的溢出存储器可分为:n低性能的磁盘存储器n近线存储器n串行磁带n第3页,本讲稿共25页4.4 确定粒度级别确定粒度级别n一方面,合理推测粒度级别n确定粒度还需要通过一定量的反复分析
2、,根据用户反馈不断改进n另一方面,预测不同体系结构的需求n数据仓库中的数据需要处于最低的公共细节水平第4页,本讲稿共25页4.5 反馈技巧反馈技巧n提高数据粒度的方法:n数据进入数据仓库时,进行汇总n数据进入数据仓库时,求平均值n数据集的最大/最小值放入数据仓库n只放入显然需要的数据n用条件逻辑选择需要的数据n系统需求了解到50%左右时即可以开始建造数据仓库n当正常的业务事务记录准备放入数据仓库时,高粒度级别的数据可能需要分解到低粒度级别。n而对于一些低粒度级的数据,如生产过程控制、网络环境中产生的点击流数据等,必须对数据进行编辑、重新排序和汇总等处理。第5页,本讲稿共25页第6页,本讲稿共2
3、5页第7页,本讲稿共25页第8页,本讲稿共25页第9页,本讲稿共25页4.6 填充数据集市填充数据集市n数据粒度需要考虑的另一重要因素:n用于填充数据集市n数据仓库中的数据粒度必须是任何数据集市所需要数据中的最小粒度。第10页,本讲稿共25页维度设计第11页,本讲稿共25页维度表n维度表是事实表不可分割的伴侣n维度表倾向于将行数做得相当少(通常100万行),而将列数做得特别大n数据仓库的能力与维度的质量和深度成正比n一个用户要按星期与商标来查看销售额,星期与商标就必须是可的维度属性第12页,本讲稿共25页维度内容n维度属性是查询的约束条件、分组与报表标签生成的基本来源n每个维度用单一的主关键字
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 中的 维度 粒度 精选 PPT
限制150内