数据仓库与数据挖掘UNIT1决策支持系统的发展省公共课一等奖全国赛课获奖课件.pptx
《数据仓库与数据挖掘UNIT1决策支持系统的发展省公共课一等奖全国赛课获奖课件.pptx》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘UNIT1决策支持系统的发展省公共课一等奖全国赛课获奖课件.pptx(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、UNIT oneUNIT one决议支持系统决议支持系统发展发展1第1页学完本讲后,你应该能够了解:1.决议支持系统演化过程受硬件发展、软件技术、数据积累和应用需求影响2.自然演化体系结构阶段存在三大问题:数据缺乏可信性、生产率低下以及难以将数据转换为信息;3.OLTP数据&应用与DDS数据&应用之间差异;4.数据仓库体系结构设计中要考虑主要问题:结构层次划分、冗余、粒度和集成问题;5.数据仓库用户和需求特征;6.数据仓库开发生命周期特点;7.建立物理数据仓库好处;8.监控数据仓库环境两个主要内容:数据与数据使用,以有效地管理运行中数据仓库环境。本 讲 主 要 目 标2第2页一决议支持系统演化
2、过程一决议支持系统演化过程二自然演化体系结构问题二自然演化体系结构问题三数据仓库体系结构设计环境三数据仓库体系结构设计环境四数据仓库用户及需求特征四数据仓库用户及需求特征五数据仓库开发生命周期五数据仓库开发生命周期六六.建立物理数据仓库建立物理数据仓库七七.监控数据仓库环境监控数据仓库环境3第3页决议支持系统决议支持系统演化过程演化过程4第4页决决议议支支持持系系统统演演化化过过程程1.信息需求改变 从信息检索到知识发觉Business usersBusiness usersWhat caused the What caused the What caused the increase in
3、sales increase in sales increase in sales this year?this year?this year?AnalystsAnalystsWhat are my What are my What are my projected sales projected sales projected sales next year?next year?next year?What is the sum of What is the sum of What is the sum of sales in Vancouver sales in Vancouver sal
4、es in Vancouver this year?this year?this year?Clerks and ClientsClerks and Clients5第5页决决议议支支持持系系统统演演化化过过程程2.淹没于数据,但饥饿于知识Knowledge discoveryVLDBToo much dataValuable knowledge6第6页决决议议支支持持系系统统演演化化过过程程直接存放设备产生第四代程序设计语言技术7第7页决决议议支支持持系系统统演演化化过过程程3.演化过程进行到抽取程序阶段为何抽取程序受欢迎:u性能:用抽取程序能将数据从高性能联机事务处理方式中转移出来,所以,
5、在需要总体分析数据时就与OLTP处理性能不发生冲突u控制:当用抽取程序将数据从OLTP内移出时,数据控制方式发生了改变。最终用户一旦开始控制数据,就最终“拥有”了这些数据8第8页自然演化体系自然演化体系结构问题结构问题9第9页自自然然演演化化体体系系结结构构问问题题1.自然演化体系结构贯通于企业或组织抽取处理模式很常见,这种由失控抽取过程产生结构被称为“自然演化体系结构”-当一个组织以放任自流态度处理整个软、硬件体系结构时,就会发生这种情况。组织越庞大,越成熟,自然演化体系结构问题就变得越严重10第10页自自然然演演化化体体系系结结构构问问题题1.自然演化体系结构对于决议者即时信息需求,直接从
6、OLTP系统中产生汇报 使DBA忙乱不堪也使OLTP负载太重!汇报汇报汇报汇报决议者决议者决议者决议者生成平台生成平台生成平台生成平台Ad hoc Ad hoc 存取需求存取需求存取需求存取需求11第11页自自然然演演化化体体系系结结构构问问题题1.自然演化体系结构从OLTP中将决议者惯用数据抽取出来,单独物理存放,处理了OLTP系统负载太重问题抽取数据抽取数据抽取数据抽取数据OLTPOLTP决议者决议者决议者决议者12第12页自自然然演演化化体体系系结结构构问问题题1.自然演化体系结构抽取数据太多和太多层次,产生了蜘蛛网问题,由此造成了一系列问题抽取数据抽取数据抽取数据抽取数据OLTPOLT
7、P决议者决议者决议者决议者13第13页自自然然演演化化体体系系结结构构问问题题2.自然演化体系结构问题u忙碌IT人员u蜘蛛网问题u数据缺乏可信性u生产率问题u从数据到信息转换不可行性14第14页自自然然演演化化体体系系结结构构问问题题3.忙碌IT人员15第15页自自然然演演化化体体系系结结构构问问题题4.蜘蛛网问题16第16页自自然然演演化化体体系系结结构构问问题题5.数据缺乏可信性17第17页自自然然演演化化体体系系结结构构问问题题5.数据缺乏可信性数据缺乏可信性原因:u数据无时基u数据算法上差异u抽取多层次u外部数据问题u无起始公共数据源18第18页自自然然演演化化体体系系结结构构问问题题
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 UNIT1 决策 支持系统 发展 公共课 一等奖 全国 获奖 课件
限制150内