数据仓库的决策支持幻灯片.ppt
《数据仓库的决策支持幻灯片.ppt》由会员分享,可在线阅读,更多相关《数据仓库的决策支持幻灯片.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库的决策支持数据仓库的决策支持第1页,共59页,编辑于2022年,星期六51数据仓库的用户数据仓库的用户5.2数据仓库的决策支持与决策支持系统数据仓库的决策支持与决策支持系统5.3数据仓库应用实例数据仓库应用实例第2页,共59页,编辑于2022年,星期六51数据仓库的用户数据仓库的用户5.1.1数据仓库的信息使用者数据仓库的信息使用者5.1.2数据仓库的探索者数据仓库的探索者第3页,共59页,编辑于2022年,星期六数据仓库的用户有两类:信息使用者和探索者数据仓库的用户有两类:信息使用者和探索者n信息使用者是使用数据仓库的大量用户。信息使用者是使用数据仓库的大量用户。信息使用者以一种可预
2、测的、重发性的方式使用信息使用者以一种可预测的、重发性的方式使用数据仓库平台。数据仓库平台。信息使用者通常查看概括数据或聚集数,查看信息使用者通常查看概括数据或聚集数,查看相同的商业维度(如产品、客户、时间)和指标相同的商业维度(如产品、客户、时间)和指标(如收入和成本)随时间的发展趋势。(如收入和成本)随时间的发展趋势。第4页,共59页,编辑于2022年,星期六n探索者完全不同于信息使用者,他们有一个完全不可探索者完全不同于信息使用者,他们有一个完全不可预测的、非重复性的数据使用模式。预测的、非重复性的数据使用模式。探索者的任务是寻找公司数据内隐含的价值并且探索者的任务是寻找公司数据内隐含的
3、价值并且根据过去事件努力预测未来决策的结果。根据过去事件努力预测未来决策的结果。探索者是典型的数据挖掘者。探索者是典型的数据挖掘者。第5页,共59页,编辑于2022年,星期六5.1.1数据仓库的信息使用者数据仓库的信息使用者n1.信息使用者使用数据仓库的性能优化信息使用者使用数据仓库的性能优化n2.探索者使用数据仓库的性能优化探索者使用数据仓库的性能优化第6页,共59页,编辑于2022年,星期六信息使用者的性能需求信息使用者的性能需求n非规格化非规格化规范化的作用是产生一种完全没有数据冗余的设计规范化的作用是产生一种完全没有数据冗余的设计方法。方法。但是,有时在数据仓库设计中引入一些有限的数据
4、但是,有时在数据仓库设计中引入一些有限的数据冗余来提高数据访问效果。冗余来提高数据访问效果。n创建数据阵列创建数据阵列创建数据阵列,将相关类型的数据创建数据阵列,将相关类型的数据(如:如:1月、月、2月、月、3月等月份中的数据月等月份中的数据)存储在一起,提高访问效果。存储在一起,提高访问效果。第7页,共59页,编辑于2022年,星期六n预连接表格预连接表格一个公用键和共同使用的数据将表格合并在一起。一个公用键和共同使用的数据将表格合并在一起。共享一个公用键,可以将多个表格合并到一个物理表格中。这样做共享一个公用键,可以将多个表格合并到一个物理表格中。这样做可以很大程度的提高数据访问效率。可以
5、很大程度的提高数据访问效率。n预聚集数据预聚集数据根据根据“滚动概括滚动概括”结构来组织数据。结构来组织数据。当数据被输入到数据仓库中时,以每小时为基础存储数据。在当数据被输入到数据仓库中时,以每小时为基础存储数据。在这一天结束时,以每天为基础存储累加每小时的数据。在一这一天结束时,以每天为基础存储累加每小时的数据。在一周结束时,以每周为基础存储累加每天的数据。月末时,则周结束时,以每周为基础存储累加每天的数据。月末时,则以每月为基础存储累加每周的数据。以每月为基础存储累加每周的数据。第8页,共59页,编辑于2022年,星期六n聚类数据聚类数据将不同类型的数据记录放置在相同的物理位置。将不同类
6、型的数据记录放置在相同的物理位置。这为用户查看这些记录,可以在同一地点找这为用户查看这些记录,可以在同一地点找到它们,提高查询效率。到它们,提高查询效率。n压缩数据压缩数据压缩可以使可读取的数据量极大。压缩可以使可读取的数据量极大。第9页,共59页,编辑于2022年,星期六n定期净化数据定期净化数据定期删除数据仓库中不需要的数据,可以为每定期删除数据仓库中不需要的数据,可以为每个用户提高性能。个用户提高性能。n合并查询合并查询如果查询定期发生,那么可以通过把这些查询合并到如果查询定期发生,那么可以通过把这些查询合并到同一个表格中,从而节省大量资源。同一个表格中,从而节省大量资源。第10页,共5
7、9页,编辑于2022年,星期六5.1.2数据仓库的探索者数据仓库的探索者探索者要做的工作有:概括分析、抽取、建模和分类。探索者要做的工作有:概括分析、抽取、建模和分类。(1)概括分析概括分析探索者开始以分析数据的完整性和准确性(数据质量)。在探索者开始以分析数据的完整性和准确性(数据质量)。在概括分析活动中,要询问的典型问题包括:概括分析活动中,要询问的典型问题包括:n家庭收入如何分配?家庭收入如何分配?n有多少帐户每月消费超过有多少帐户每月消费超过200元?元?n有多少客户有两个以上的小孩并居住在市区?有多少客户有两个以上的小孩并居住在市区?第11页,共59页,编辑于2022年,星期六(2)
8、抽取抽取从数据仓库中抽取指定的数据,并组织起来,送入从数据仓库中抽取指定的数据,并组织起来,送入支持探索者分析的探索仓库中。支持探索者分析的探索仓库中。(3)建模建模探索者通过概括分析来理解数据,通过抽取来准备探索者通过概括分析来理解数据,通过抽取来准备数据,通过建模来分析数据。数据,通过建模来分析数据。第12页,共59页,编辑于2022年,星期六建模是开发一种用来描述实体(如客户、商品、渠建模是开发一种用来描述实体(如客户、商品、渠道等)的关系模型的过程。探索者使用的模型有:道等)的关系模型的过程。探索者使用的模型有:n客户分段客户分段n后续产品后续产品n欺诈检测欺诈检测n渠道响应(例如,电
9、话销售和直接邮寄)渠道响应(例如,电话销售和直接邮寄)n信用风险信用风险n客户生存期价值客户生存期价值n推销响应推销响应第13页,共59页,编辑于2022年,星期六例如,例如,利用建模来确认有可能拖延支付电话帐单的客户:利用建模来确认有可能拖延支付电话帐单的客户:首先首先,建立一个模型(利用统计学和行为科学)来确认经常,建立一个模型(利用统计学和行为科学)来确认经常拖延支付电话帐单的客户特征。拖延支付电话帐单的客户特征。然后然后,根据客户与模型的密切程度,对所有的客户分类。,根据客户与模型的密切程度,对所有的客户分类。这样,可以提供谁将不支付电话帐单的某种可能性预测。这样,可以提供谁将不支付电
10、话帐单的某种可能性预测。第14页,共59页,编辑于2022年,星期六5.2 5.2 数据仓的决策支持与决策支持系统数据仓的决策支持与决策支持系统5.2.1查询与报表查询与报表5.2.2多维分析与原因分析多维分析与原因分析5.2.3预测未来预测未来5.2.4实时决策实时决策5.2.5自动决策自动决策5.2.6决策支持系统决策支持系统第15页,共59页,编辑于2022年,星期六数据仓库是一种能够提供重要战略信息,并获得竞数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,从而得到迅速的发展。争优势的新技术,从而得到迅速的发展。具体的战略信息有:具体的战略信息有:n给出销售量最好的产品名单给
11、出销售量最好的产品名单n找出出现问题的地区(切片)找出出现问题的地区(切片)n追踪查找出现问题原因(向下钻取)追踪查找出现问题原因(向下钻取)n对比其他的数据(横向钻取)对比其他的数据(横向钻取)n显示最大的利润显示最大的利润n当一个地区的销售低于目标值时,提出警告信息。当一个地区的销售低于目标值时,提出警告信息。第16页,共59页,编辑于2022年,星期六n建立数据仓库的目的不只是为了存储更多的数据,建立数据仓库的目的不只是为了存储更多的数据,而是要对这些数据进行处理并转换成商业信息和知而是要对这些数据进行处理并转换成商业信息和知识,利用这些信息和知识来支持企业进行正确的商识,利用这些信息和
12、知识来支持企业进行正确的商业行动,并最终获得效益。业行动,并最终获得效益。n数据仓库的功能是在恰当的时间,把准确的信息传递数据仓库的功能是在恰当的时间,把准确的信息传递给决策者,使他能作出正确的商业决策。给决策者,使他能作出正确的商业决策。第17页,共59页,编辑于2022年,星期六5.2.1查询与报表查询与报表1.查询查询(1)能向用户提供查询的初始化,公式表示和结果显示等)能向用户提供查询的初始化,公式表示和结果显示等功能。功能。(2)由元数据来引导查询过程)由元数据来引导查询过程(3)用户能够轻松地浏览数据结构)用户能够轻松地浏览数据结构(4)信息是用户自己主动索取的,而不是数据仓库强加
13、给)信息是用户自己主动索取的,而不是数据仓库强加给他们的他们的(5)查询环境必须要灵活地适应不同类型的用户)查询环境必须要灵活地适应不同类型的用户第18页,共59页,编辑于2022年,星期六2.报表报表(1)预格式化报表。)预格式化报表。(2)参数驱动的预定义报表。)参数驱动的预定义报表。(3)简单的报表开发。)简单的报表开发。(4)公布和订阅。)公布和订阅。(5)传递选项。)传递选项。(6)多数据操作选项。)多数据操作选项。(7)多种展现方式选项。)多种展现方式选项。第19页,共59页,编辑于2022年,星期六5.2.2多维分析与原因分析多维分析与原因分析1、多维分析、多维分析通过多维分析将
14、获得在各种不同维度下的实际商业活动通过多维分析将获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化值和差值,达值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果。到辅助决策效果。例如通过多维分析得到如下信息:例如通过多维分析得到如下信息:n今年以来,公司的哪些产品量是最有利润的?今年以来,公司的哪些产品量是最有利润的?n最有利润的产品是不是和去年一样的?最有利润的产品是不是和去年一样的?第20页,共59页,编辑于2022年,星期六2、原因分析、原因分析查找问题出现的原因是一项很重要的决策查找问题出现的原因是一项很重要的决策支持任务,一般通过多维数据分析的支持任务,一
15、般通过多维数据分析的“向下钻取向下钻取”操作来完成。操作来完成。某公司从分析报表中得知最近几个月来整某公司从分析报表中得知最近几个月来整个企业的利润在急速下滑,通过人机交个企业的利润在急速下滑,通过人机交互找出该企业利润下滑的原因。互找出该企业利润下滑的原因。第21页,共59页,编辑于2022年,星期六(1)查询整个公司最近)查询整个公司最近3个月来各个月份的销售额和利润,显个月来各个月份的销售额和利润,显示销售额正常,但利润下降。示销售额正常,但利润下降。(2)查询全世界各个区域每个月的销售额和利润,显示欧洲地区销)查询全世界各个区域每个月的销售额和利润,显示欧洲地区销售额下降,利润急剧下降
16、。售额下降,利润急剧下降。(3)查询欧洲各国销售额和利润。显示一些国家利润率上升,一些)查询欧洲各国销售额和利润。显示一些国家利润率上升,一些国家持平,欧盟国家利润率急剧下降。国家持平,欧盟国家利润率急剧下降。(4)查询欧盟国家中的直接和间接成本。得到直接成本没有问题,但间)查询欧盟国家中的直接和间接成本。得到直接成本没有问题,但间接成本提高了。接成本提高了。(5)查询间接成本的详细情况。得出企业征收了额外附加税,)查询间接成本的详细情况。得出企业征收了额外附加税,使利润下降。使利润下降。通过原因分析,得到企业利润下滑的真正原因是欧盟国家征收通过原因分析,得到企业利润下滑的真正原因是欧盟国家征
17、收了额外附加税造成。了额外附加税造成。第22页,共59页,编辑于2022年,星期六5.2.3预测未来预测未来预测未来使决策者了解预测未来使决策者了解“将要发生什么将要发生什么”。数据仓库中存放了大量的历史数据,数据仓库中存放了大量的历史数据,从历史数据中找从历史数据中找出变化规律,将可以用来预测未来出变化规律,将可以用来预测未来。在进行预测。在进行预测的时候需要用到一些的时候需要用到一些预测模型预测模型。最常用的预测方。最常用的预测方法是采用回归模型,包括线性回归或非线性回归。法是采用回归模型,包括线性回归或非线性回归。采用聚类模型或分类模型也能达到一定的预测效果。采用聚类模型或分类模型也能达
18、到一定的预测效果。第23页,共59页,编辑于2022年,星期六5.2.4实时决策实时决策n企业需要准确了解企业需要准确了解“正在发生什么正在发生什么”,从而需要建,从而需要建立立动态数据仓库(实时数据库动态数据仓库(实时数据库),用于支持战术),用于支持战术型决策,即实时决策。型决策,即实时决策。n战术性决策支持的重点则在企业外部,支持的是执行战术性决策支持的重点则在企业外部,支持的是执行公司战略的员工。第四种侧重在战术性决策支持。公司战略的员工。第四种侧重在战术性决策支持。第24页,共59页,编辑于2022年,星期六以货运为例以货运为例n卡车上的货物常常需要把某些货物从一辆车转移到另一辆车卡
19、车上的货物常常需要把某些货物从一辆车转移到另一辆车上,以便最终送抵各自的目的地。上,以便最终送抵各自的目的地。n当某些卡车晚点时,就要做出艰难的决定:是让后继的运当某些卡车晚点时,就要做出艰难的决定:是让后继的运输车等待迟到的货物,还是让其按时出发。输车等待迟到的货物,还是让其按时出发。n如果后继车辆按时出发而未等待迟到的包裹,那么迟到如果后继车辆按时出发而未等待迟到的包裹,那么迟到包裹的服务等级就会大打折扣。包裹的服务等级就会大打折扣。n反过来说,等待迟到的包裹则将损害在后继的运输车上的其他待反过来说,等待迟到的包裹则将损害在后继的运输车上的其他待运包裹的服务等级。运包裹的服务等级。n运输车
20、究竟等待多长时间,取决于需卸装到该车辆的所有延运输车究竟等待多长时间,取决于需卸装到该车辆的所有延迟迟货物的服务等级货物的服务等级和已经装载到该车辆的货物的服务等级。和已经装载到该车辆的货物的服务等级。第25页,共59页,编辑于2022年,星期六5.2.5自动决策自动决策n利用动态数据库自动决策,达到利用动态数据库自动决策,达到“希望发生什么希望发生什么”。为了寻求决策的有效性和连续性,企业就会趋向为了寻求决策的有效性和连续性,企业就会趋向于采取自动决策。于采取自动决策。n动态数据仓库可以为整个企业提供战略决策支持,动态数据仓库可以为整个企业提供战略决策支持,也可提供战术决策支持。确切地说,动
21、态数据仓也可提供战术决策支持。确切地说,动态数据仓库同时支持这两种方式。库同时支持这两种方式。n随着技术的进步,越来越多的决策由事件触发,自动随着技术的进步,越来越多的决策由事件触发,自动发生。发生。第26页,共59页,编辑于2022年,星期六5.2.6决策支持系统决策支持系统n数据仓库整合了企业的各种信息来源,能确保一致与正确数据仓库整合了企业的各种信息来源,能确保一致与正确详细的数据。它是一个庞大的数据资源。要将数据转换成详细的数据。它是一个庞大的数据资源。要将数据转换成商业智能,就需要利用数据仓库来建立决策支持系统。商业智能,就需要利用数据仓库来建立决策支持系统。n基于数据仓库的决策支持
22、系统是针对实际问题,基于数据仓库的决策支持系统是针对实际问题,利用分析工具利用分析工具或者编制程序,采用一种或多种组合的决策支持能力,对数或者编制程序,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析,据仓库中的数据进行多维分析,从而掌握企业的经营现状,从而掌握企业的经营现状,找出现状的原因,并预测未来发展趋势,找出现状的原因,并预测未来发展趋势,协助企业制定决协助企业制定决策增强竞争优势策增强竞争优势。第27页,共59页,编辑于2022年,星期六5.3数据仓库应用实例数据仓库应用实例5.3.1航空公司数据仓库决策支持系统简例航空公司数据仓库决策支持系统简例5.3.2统计业数据
23、仓库解决方案统计业数据仓库解决方案5.3.3沃尔玛数据仓库系统沃尔玛数据仓库系统第28页,共59页,编辑于2022年,星期六5.3.1航空公司数据仓库决策支持系统简例航空公司数据仓库决策支持系统简例1.航空公司数据仓库系统的功能航空公司数据仓库系统的功能2.数据仓库系统的决策支持数据仓库系统的决策支持3.决策支持系统简例决策支持系统简例第29页,共59页,编辑于2022年,星期六1.1.航空公司数据仓库系统的功能航空公司数据仓库系统的功能航空公司数据仓库功能模块有:航空公司数据仓库功能模块有:市场分析市场分析:分析国内、国际、地区航线上的各项生产指标;:分析国内、国际、地区航线上的各项生产指标
24、;航班分析航班分析:分析某个特定市场上所有航班的生产情况;:分析某个特定市场上所有航班的生产情况;班期分析班期分析:分析某个特定市场上各班期的旅客、货运分布:分析某个特定市场上各班期的旅客、货运分布 情况;情况;第30页,共59页,编辑于2022年,星期六 2.2.数据仓库系统的决策支持数据仓库系统的决策支持 利用数据仓库系统提供的决策支持有:利用数据仓库系统提供的决策支持有:l l一段时间内某特定市场占有率、同期比较、增长趋势;一段时间内某特定市场占有率、同期比较、增长趋势;l l各条航线的收益分析;各条航线的收益分析;l l计划完成情况;计划完成情况;l l流量、流向分析;流量、流向分析;
25、l l航线上各项生产指标变化趋势的分析;航线上各项生产指标变化趋势的分析;第31页,共59页,编辑于2022年,星期六 通通过过查查询询“北北京京到到各各地地区区的的航航空空市市场场情情况况”,发发现现西西南南地地区区总总周周转转量量出出现现了了最最大大负负增增长长量量。该该决决策策支支持持系系统统简简例例就就是完成对此问题进行多维分析和原因分析,找出出现原因。是完成对此问题进行多维分析和原因分析,找出出现原因。决策支持系统运行结构图如下:决策支持系统运行结构图如下:3.3.决策支持系统简例决策支持系统简例第32页,共59页,编辑于2022年,星期六数据仓库服务器数据仓库服务器客户端客户端查询
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 决策 支持 幻灯片
限制150内