欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第4章数据仓库中的维度与粒度优秀PPT.ppt

    • 资源ID:52225345       资源大小:1.96MB        全文页数:25页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第4章数据仓库中的维度与粒度优秀PPT.ppt

    第4章数据仓库中的维度与粒度现在学习的是第1页,共25页4.3 溢出存储器溢出存储器n应该考虑五年后如下因素:n有更多的技术管理大量数据n硬件费用下降n功能更强大的软件工具n最终用户更加专业化现在学习的是第2页,共25页4.3 溢出存储器溢出存储器n历史数据与细节数据造成了数据的显著增长n根据数据使用频率,可将数据分为二类:n经常使用的数据n不经常使用的数据(睡眠数据)n解决方案:n睡眠数据转移至海量备用存储器或近线存储器n常用的溢出存储器可分为:n低性能的磁盘存储器n近线存储器n串行磁带n现在学习的是第3页,共25页4.4 确定粒度级别确定粒度级别n一方面,合理推测粒度级别n确定粒度还需要通过一定量的反复分析,根据用户反馈不断改进n另一方面,预测不同体系结构的需求n数据仓库中的数据需要处于最低的公共细节水平现在学习的是第4页,共25页4.5 反馈技巧反馈技巧n提高数据粒度的方法:n数据进入数据仓库时,进行汇总n数据进入数据仓库时,求平均值n数据集的最大/最小值放入数据仓库n只放入显然需要的数据n用条件逻辑选择需要的数据n系统需求了解到50%左右时即可以开始建造数据仓库n当正常的业务事务记录准备放入数据仓库时,高粒度级别的数据可能需要分解到低粒度级别。n而对于一些低粒度级的数据,如生产过程控制、网络环境中产生的点击流数据等,必须对数据进行编辑、重新排序和汇总等处理。现在学习的是第5页,共25页现在学习的是第6页,共25页现在学习的是第7页,共25页现在学习的是第8页,共25页现在学习的是第9页,共25页4.6 填充数据集市填充数据集市n数据粒度需要考虑的另一重要因素:n用于填充数据集市n数据仓库中的数据粒度必须是任何数据集市所需要数据中的最小粒度。现在学习的是第10页,共25页维度设计现在学习的是第11页,共25页维度表n维度表是事实表不可分割的伴侣n维度表倾向于将行数做得相当少(通常100万行),而将列数做得特别大n数据仓库的能力与维度的质量和深度成正比n一个用户要按星期与商标来查看销售额,星期与商标就必须是可的维度属性现在学习的是第12页,共25页维度内容n维度属性是查询的约束条件、分组与报表标签生成的基本来源n每个维度用单一的主关键字进行定义,主关键字是确保与之相连的事实表存在完整性的基础。n非直接相关属性n产品:包裹大小与品牌n非规范化n很多维度变化很缓慢n多级层次结构n维度表通常有多种多级层次结构现在学习的是第13页,共25页维度中的文本与数字n维度应当是文本和离散的n尽量使用详细的文本信息取代编码n数字属性放入维度表还是事实表应当看它是一个含有许多取值并参与运算的度量(应放入事实表),还是变化不多并参与约束条件的离散取值(应放入维度表)n产品尺寸-维度表n产品生产成本-事实表现在学习的是第14页,共25页事实表的内容n事实表的主键是所有维度表主键的组合键n主要是数字属性n表很长,但不宽n稀疏的数据n假期记录可能为空n退化的维度n既不是事实也不是维属性的数据元素n如发票号、订单号等现在学习的是第15页,共25页粒度设计n原子数据应成为每个事实表设计的基础n好处:可以只通过添加维度,满足新的查询要求n商场的最佳维度应是POS事务的单列项n促销效果、限时打折都需要低粒度数据现在学习的是第16页,共25页事实表设计n毛利润=销售-成本;在已有销售和成本字段的情况下,是否应物理存储毛利润字段?n应存储n减少用户出错n便于生成报表现在学习的是第17页,共25页n例:业务数据的E-R图销售销售日期商店号商品号销售数量销售单位商品商品号商品名商品类号存货星期商店号商品号数量1m1m商店商店号商店名地址城市省邮编地区号1mm11商品类商品类号商品类名部门号m1m地区地区号地区名现在学习的是第18页,共25页nE-R图向多维表的转换n该问题的多维表模型中,商品维包括部门、商品和商品大类,地点维包括地区和商店,忽略存货,而只注意销售事实。在E-R图中不出现的时间,在多维模型中增加时间维。n在多维模型中,实体与维之间建立映射关系,联系多个实体的实体就成为事实,此处销售实体作为事实,其他实体作为维。然后用维关键字将它转换为星型模型,如图所示。现在学习的是第19页,共25页商品维地区维时间维部门地区年商品大类商店月商品周日销售事实E-R图向多维模型的转换图向多维模型的转换现在学习的是第20页,共25页利用维关键字制定的星型模型利用维关键字制定的星型模型现在学习的是第21页,共25页n在各维中,只有部门,商品类,地区,商店的编号没有具体的说明。n为了打印报表将增加这些编号的名称说明,即部门名、商店名等,在维表中增加这些说明,即修改该星型模型n 现在学习的是第22页,共25页修改后的星型模型修改后的星型模型现在学习的是第23页,共25页产品维度表n产品关键字(PK)、产品描述、商标描述、分类描述、部门描述、包装类型、包装尺寸、重量、储藏类型、货架类型、货架高度、货架深度。n产品维度表每行都有与产品相关的商标与分类,有冗余但易于使用现在学习的是第24页,共25页n日期维度:日期关键字、日期描述、星期、年历月、年历周、年历日、月编号、周编号、日编号、财政日、财政月、周末指示符、节假日指示符、销售旺季、重点事件。n商场维度:商场关键字、名称、街道、城市、省、邮编、面积、开业时间。n促销维度:促销关键字、名称、类型、媒体、广告、优惠卷、促销价、开始时间、结束时间。现在学习的是第25页,共25页

    注意事项

    本文(第4章数据仓库中的维度与粒度优秀PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开