商务智能理论与应用4-数据仓库34650.pptx
《商务智能理论与应用4-数据仓库34650.pptx》由会员分享,可在线阅读,更多相关《商务智能理论与应用4-数据仓库34650.pptx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据与数据挖掘-数据仓库一、决策支持系统二、商务智能 人们对商务智能的理解如同那七个印度盲人对大象的理解:有人认为它是高级管理人员信息系统(EIS),有人认为它是管理信息系统(MIS),有人认为它是决策支持系统(DSS);有人说它是数据库技术,有人说它是数据仓库,有人说它是数据集市,有人说它是数据整合与清洗工具,有人说它是查询和报告工具,有人说它是在线分析处理工具,有人说它是数据挖掘,有人说它是统计分析;有人把它当做分析性ERP,有人把它当做分析性CRM,有人把它当做分析性SCM,有人把它当做企业绩效管理,有人把它当作平衡记分卡 商业智能技术,它以数据仓库(Data Warehousing)
2、、在线分析处理(OLAP)、数据挖掘(Data Mining)3种技术的整合为基础,建立企业数据中心和业务分析模型,以提高企业获取经营分析信息的能力,从而提高企业经营和决策的质量与速度。三、商务智能组 成1、关系型数据库2、数据仓库(数据系统整合,收集,清洗)3、多维分析 (不同维度之间的剖析,自定义)4、数据挖掘 (灵魂,产生价值的地方)5、展示 (可视化界面)在线分析处理技术(OLAP:Online Online Analytical ProcessingAnalytical Processing)数据挖掘技术(Data Mining)数据仓库技术(Data Warehousing)数据整
3、合集成各系统的历史数据,建立面向主题的企业数据中心数据分析灵活、动态、快速的多维分析、随机查询、即席报表知识发现通过数学模型发现隐藏的、潜在的规律,以辅助决策三、商务智能体系四、关系型数据库关系型数据库就是由二维表及其之间的联系组成的一个数据组织,关系数据库中的数据结构就是一张二维表,以表格(关系)的形式存放数据。比如:订单数据库包括一个用列表示的描述一个客户信息的表格:名字、住址、电话号码,等等。另外的一个表格会描述一个订单:产品、客户、日期、销售价格,等等。报表:是关系型数据库时代将数据转化为信息的主要手段,但是报表是需要事先由开发人员定制的。比如:2013年5月份的废单报表五、数据仓库我
4、们可以从多个菜市场,挑选我们做需要的蔬菜,肉类等。当然,我们处在一个选择的过程。如果菜不新鲜,我们完全可以不要它.六、多维分析 OALP掌握数据仓库先要了解OLAP多维数据分析OLAP是以海量数据为基础的复杂数据分析技术。侧重于对决策人员和高层管理人员的决策支持,可以快速、灵活地进行大数据量的复杂处理,并且以一种直观易懂的形式将结果提供给决策人员。OLAP的特性:的特性:快速性:系统能在数秒内对用户的多数分析要求做出反应可分析性:用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户所希望的方式给出报告多维性:提供对数据分析的多维视图和分析信息性:能及时获得信息,并且管理大容量信息
5、大家知道数据透视表吗?对于数据的查询,可以有以下两种形式产品名称销售地区销售数量电器电器电器电器服装服装服装服装汇总汇总汇总汇总江苏上海北京汇总江苏上海北京汇总江苏上海北京汇总9404503401730830350270145017708006103180 关系数据库的汇总 查询时除了查询销售量外,有时还查询涉及多个数据项求和,若采取临时进行汇总计算,会使查询效率大大降低。多维数据库的OLAP,多维数据库(MDDB)是以多维方式组织数据,即以维作为坐标系,采用类似于数组形式存储数据。多维数据库中的元素具有形同类型的数值,如销售量。例,多维数据库存储数据如表所示:反映不同产品在不同地区的销售情况
6、江江江江苏苏上海上海上海上海北京北京北京北京电电器器器器服装服装服装服装940940830830450450350350340340270270 江江江江苏苏上海上海上海上海北京北京北京北京汇总汇总电电器器器器服装服装服装服装汇总汇总94094083083017701770450450350350800800340340270270610610173017301450145031803180 多维数据库的汇总在多维数据库中只需要按行或列进行求和,增加汇总的维成员即可。2023/5/1216假设以假设以“产品、城市、时间产品、城市、时间”三维数据为例三维数据为例以上关系可简单的抽象成多维数据分析
7、模式以上关系可简单的抽象成多维数据分析模式 比较发现多维数据比关系数据库表达的关系更加清晰明了,而且所消耗的存贮容量更少,查询处理也格外简单,若要查某地区的销售量,只要按列统计一下即可,若要查某个产品的销售量,则只要按行统计即可。多维数据的表示方法星型模式星型模式雪花型模式雪花型模式星型模式的关系数据星型模式的关系数据库库表示表示产品品ID销售商售商ID地址地址ID时间ID销售数量售数量销售成本售成本总收入收入地理位置地理位置维表表时间维表表产品品维表表产品品ID时间ID销售商售商ID地址地址ID销售售商商维度表度表v雪花模式在关系数据雪花模式在关系数据库中的表示中的表示 地理地理位置位置维表
8、表时间维表表产品品ID产品名称品名称公司公司ID公司名称公司名称产品品颜色色ID产品品颜色色产品商品商标ID商商标名称名称产品品类型型ID产品品类型名型名销售售商商维度表度表产品品ID销售商售商ID地址地址ID时间ID销售数量售数量销售成本售成本总收入收入产品品ID公司公司ID产品品颜色色ID产品商品商标ID产品品类型型ID产品品维表表产品品ID销售商售商ID时间ID地址地址ID图图雪花模式的关系数据雪花模式的关系数据库库表示表示OLAP中的常用术语切片/切块上卷/下钻穿透赚取旋转维度事实在多维分析过程中,如果对多维数据集的某个维选定一维成员,这种选择操作就称为切片。也即:如有(维1,维2,维
9、i,维n,观察变量)多维数据集,对维i选定了某个维成员,则(维1,维2,维i成员,维n,观察变量)就是多维数据集(维1,维2,维i,维n,观察变量)在维i上的一个切片。这种切片的数量完全取决于维i上的维成员个数,如果维数越多,可以做的切片也就越多。例:对时间维的切片操作,它对中心数据立方体使用条件:时间=“Q1”选择销售数据。1、切片Q1Q2Q3Q4计算机算机安全安全家庭家庭娱乐电话南京南京北京北京上海上海广州广州605825144003951560440地区地区(城市城市)时间(季季)类型型切片切片广州广州上海上海北京北京南京南京计算机算机安全安全家庭家庭娱乐电话605 825 14 400
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商务 智能 理论 应用 数据仓库 34650
限制150内