(精品)数据仓库与数据挖掘综述.ppt
数据仓库与数据挖掘综述数据仓库与数据挖掘综述概念、体系结构、趋势、应用概念、体系结构、趋势、应用报告人:朱建秋报告人:朱建秋报告人:朱建秋报告人:朱建秋 20012001年年年年6 6月月月月7 7日日日日提纲提纲vv数据仓库概念数据仓库概念vv数据仓库体系结构及组件数据仓库体系结构及组件vv数据仓库设计数据仓库设计vv数据仓库技术(与数据库技术的区别)数据仓库技术(与数据库技术的区别)vv数据仓库性能数据仓库性能vv数据仓库应用数据仓库应用vv数据挖掘应用概述数据挖掘应用概述vv数据挖掘技术与趋势数据挖掘技术与趋势vv数据挖掘应用平台(科委申请项目)数据挖掘应用平台(科委申请项目)数据仓库概念数据仓库概念vv基本概念基本概念vv对数据仓库的一些误解对数据仓库的一些误解基本概念基本概念数据仓库数据仓库vvData warehouse is a subject oriented,Data warehouse is a subject oriented,Data warehouse is a subject oriented,Data warehouse is a subject oriented,integrated,non-volatile and time variant integrated,non-volatile and time variant integrated,non-volatile and time variant integrated,non-volatile and time variant collection of datacollection of datacollection of datacollection of data in support of in support of in support of in support of managementmanagementmanagementmanagement s decision s decision s decision s decision InmonInmonInmonInmon,1996,1996,1996,1996.vvData warehouse is Data warehouse is Data warehouse is Data warehouse is a set of methods,a set of methods,a set of methods,a set of methods,techniques,and toolstechniques,and toolstechniques,and toolstechniques,and tools that may be leveraged that may be leveraged that may be leveraged that may be leveraged together to produce a vehicle that delivers together to produce a vehicle that delivers together to produce a vehicle that delivers together to produce a vehicle that delivers data to end-users on an integrated platform data to end-users on an integrated platform data to end-users on an integrated platform data to end-users on an integrated platform LadleyLadleyLadleyLadley,1997,1997,1997,1997.vvData warehouse is Data warehouse is Data warehouse is Data warehouse is a processa processa processa process of crating,of crating,of crating,of crating,maintaining,and using a decision-support maintaining,and using a decision-support maintaining,and using a decision-support maintaining,and using a decision-support infrastructure infrastructure infrastructure infrastructure Appleton,1995Haley,1997Gardner 1998.Appleton,1995Haley,1997Gardner 1998.Appleton,1995Haley,1997Gardner 1998.Appleton,1995Haley,1997Gardner 1998.基本概念基本概念数据仓库特征数据仓库特征 InmonInmon,1996,1996vv面向主题面向主题面向主题面向主题n n一个主题领域的表来源于多个操作型应用(如:客户主题,来源于:一个主题领域的表来源于多个操作型应用(如:客户主题,来源于:一个主题领域的表来源于多个操作型应用(如:客户主题,来源于:一个主题领域的表来源于多个操作型应用(如:客户主题,来源于:定单处理;应收帐目;应付帐目;定单处理;应收帐目;应付帐目;定单处理;应收帐目;应付帐目;定单处理;应收帐目;应付帐目;)n n典型的主题领域:客户;产品;交易;帐目典型的主题领域:客户;产品;交易;帐目典型的主题领域:客户;产品;交易;帐目典型的主题领域:客户;产品;交易;帐目n n主题领域以一组相关的表来具体实现主题领域以一组相关的表来具体实现主题领域以一组相关的表来具体实现主题领域以一组相关的表来具体实现n n相关的表通过公共的键码联系起来(如:顾客标识号相关的表通过公共的键码联系起来(如:顾客标识号相关的表通过公共的键码联系起来(如:顾客标识号相关的表通过公共的键码联系起来(如:顾客标识号Customer IDCustomer ID)n n每个键码都有时间元素(从日期到日期;每月累积;单独日期每个键码都有时间元素(从日期到日期;每月累积;单独日期每个键码都有时间元素(从日期到日期;每月累积;单独日期每个键码都有时间元素(从日期到日期;每月累积;单独日期)n n主题内数据可以存储在不同介质上(综合级,细节级,多粒度)主题内数据可以存储在不同介质上(综合级,细节级,多粒度)主题内数据可以存储在不同介质上(综合级,细节级,多粒度)主题内数据可以存储在不同介质上(综合级,细节级,多粒度)vv集成集成集成集成n n数据提取、净化、转换、装载数据提取、净化、转换、装载数据提取、净化、转换、装载数据提取、净化、转换、装载vv稳定性稳定性稳定性稳定性n n批处理增加,仓库已经存在的数据不会改变批处理增加,仓库已经存在的数据不会改变批处理增加,仓库已经存在的数据不会改变批处理增加,仓库已经存在的数据不会改变vv随时间而变化(时间维)随时间而变化(时间维)随时间而变化(时间维)随时间而变化(时间维)vv管理决策支持管理决策支持管理决策支持管理决策支持基本概念基本概念Data Mart,ODSvvData MartData Martn n数据集市数据集市数据集市数据集市-小型的,面向部门或工作组级小型的,面向部门或工作组级小型的,面向部门或工作组级小型的,面向部门或工作组级数据仓库。数据仓库。数据仓库。数据仓库。vvOperation Data StoreOperation Data Storen n操作数据存储操作数据存储操作数据存储操作数据存储 ODSODSODSODS是能支持企业日常的全是能支持企业日常的全是能支持企业日常的全是能支持企业日常的全局应用的数据集合局应用的数据集合局应用的数据集合局应用的数据集合,是不同于是不同于是不同于是不同于DBDBDBDB的一种新的数的一种新的数的一种新的数的一种新的数据环境据环境据环境据环境,是是是是DW DW DW DW 扩展后得到的一个混合形式。扩展后得到的一个混合形式。扩展后得到的一个混合形式。扩展后得到的一个混合形式。四个基本特点:面向主题的四个基本特点:面向主题的四个基本特点:面向主题的四个基本特点:面向主题的(Subject-Subject-Subject-Subject-Oriented)Oriented)Oriented)Oriented)、集成的、可变的、集成的、可变的、集成的、可变的、集成的、可变的、当前或接近当前或接近当前或接近当前或接近当前的。当前的。当前的。当前的。基本概念基本概念ETL,元数据,粒度,分割元数据,粒度,分割vvETLn nETLETL(Extract/Transformation/LoadExtract/Transformation/Load)数据装载、转数据装载、转数据装载、转数据装载、转换、抽取工具。换、抽取工具。换、抽取工具。换、抽取工具。Microsoft DTS;IBM Visual Microsoft DTS;IBM Visual Warehouse etc.Warehouse etc.vv元数据元数据n n关于数据的数据,关于数据的数据,关于数据的数据,关于数据的数据,用于构造、维持、管理、和使用数据用于构造、维持、管理、和使用数据用于构造、维持、管理、和使用数据用于构造、维持、管理、和使用数据仓库,仓库,仓库,仓库,在数据仓库中尤为重要。在数据仓库中尤为重要。在数据仓库中尤为重要。在数据仓库中尤为重要。vv粒度粒度n n数据仓库的数据单位中保存数据的细化或综合程度的级数据仓库的数据单位中保存数据的细化或综合程度的级数据仓库的数据单位中保存数据的细化或综合程度的级数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度越小。别。细化程度越高,粒度越小。别。细化程度越高,粒度越小。别。细化程度越高,粒度越小。vv分割分割n n数据分散到各自的物理单元中去,它们能独立地处理。数据分散到各自的物理单元中去,它们能独立地处理。数据分散到各自的物理单元中去,它们能独立地处理。数据分散到各自的物理单元中去,它们能独立地处理。对数据仓库的一些误解对数据仓库的一些误解vv数据仓库与数据仓库与OLAPn n星型数据模型星型数据模型星型数据模型星型数据模型n n多维分析多维分析多维分析多维分析vv数据仓库不是一个虚拟的概念数据仓库不是一个虚拟的概念vv数据仓库与范式理论数据仓库与范式理论n n需要非范式化处理需要非范式化处理需要非范式化处理需要非范式化处理提纲提纲vv数据仓库概念数据仓库概念vv数据仓库体系结构及组件数据仓库体系结构及组件vv数据仓库设计数据仓库设计vv数据仓库技术(与数据库技术的区别)数据仓库技术(与数据库技术的区别)vv数据仓库性能数据仓库性能vv数据仓库应用数据仓库应用vv数据挖掘应用概述数据挖掘应用概述vv数据挖掘技术与趋势数据挖掘技术与趋势vv数据挖掘应用平台(科委申请项目)数据挖掘应用平台(科委申请项目)数据仓库体系结构及组件数据仓库体系结构及组件vv体系结构体系结构vvETL工具工具vv元数据库元数据库(Repository)及元数据管理及元数据管理vv数据访问和分析工具数据访问和分析工具体系结构体系结构 PieterPieter,1998,1998 SourceDatabasesData Extraction,Transformation,loadWarehouseAdmin.ToolsExtract,Transformand LoadDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisEnd-UserDW ToolsCentral DataWarehouseCentral DataWarehouseMid-TierMid-TierDataMartDataMartLocal MetadataLocal MetadataLocal MetadataMetadataExchangeMDBDataCleansingToolRelationalAppl.PackageLegacyExternalRDBMSRDBMS带带ODS的体系结构的体系结构SourceDatabasesHub-Data Extraction,Transformation,loadWarehouseAdmin.ToolsExtract,Transformand LoadDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisCentral Data Ware-house and ODSCentral DataWarehouseMid-TierRDBMSDataMartMid-TierRDBMSDataMartLocal MetadataLocal MetadataLocal MetadataMetadataExchangeODSOLTPToolsDataCleansingToolRelationalAppl.PackageLegacyExternalMDBEnd-UserDW Tools现实环境现实环境异质性异质性 Douglas Hackney,2001Douglas Hackney,2001 CustomCustomMarketingMarketingData Data WarehouseWarehousePackagedPackagedOracle Oracle FinancialFinancialData Data WarehouseWarehousePackagedPackagedI2 Supply ChainI2 Supply ChainNon-Non-ArchitectedArchitectedData MartData MartSubsetSubsetData MartsData MartsOracle FinancialsOracle Financialsi2 Supply Chaini2 Supply ChainSiebelSiebel CRM CRM3 3rd Partyrd Partye-Commercee-Commerce联合型数据仓库联合型数据仓库/数据集市体系结构数据集市体系结构Real TimeReal TimeODSODSFederatedFederatedFinancialFinancialData Data WarehouseWarehouseSubsetSubsetData MartsData MartsCommonCommonStagingStagingAreaAreaOracle FinancialsOracle Financialsi2 Supply Chaini2 Supply ChainSiebelSiebel CRM CRM3 3rd Partyrd PartyFederatedFederatedPackagedPackagedI2 SupplyI2 SupplyChainChainData MartsData MartsAnalyticalAnalyticalApplicationsApplicationse-Commercee-CommerceReal TimeReal TimeData MiningData Miningand Analyticsand AnalyticsReal TimeReal TimeSegmentation,Segmentation,Classification,Classification,Qualification,Qualification,Offerings,etc.Offerings,etc.FederatedFederatedMarketingMarketingData Data WarehouseWarehouseETL tools&DW ETL tools&DW templatestemplatesData profiling&Data profiling&reengineering toolsreengineering toolsDemand-driven data Demand-driven data acquisition&analysisacquisition&analysisMetadata InterchangeMetadata InterchangeFederated data Federated data warehouse and data warehouse and data mart systemsmart systemsDecision engine Decision engine models,rules and models,rules and metricsmetricsOLAP&data mining OLAP&data mining tools,tools,Analysis templatesAnalysis templatesAnalytic application Analytic application development tools&development tools&componentscomponentsAnalytic applicationsAnalytic applicationsFront-and back-Front-and back-office OLTPoffice OLTPe-Business e-Business systemssystemsExternal information External information providersprovidersCRM CRM Analytics&Analytics&ReportingReportingSupply Chain Supply Chain Analytics&Analytics&ReportingReportingEKP-Enterprise EKP-Enterprise Knowledge Knowledge Management PortalManagement PortalEPM EPM Analytics&Analytics&ReportingReportingBusiness Business information&information&recommendationsrecommendationsInformed Informed decisions decisions&actions&actionsFinancial Financial Analytics&Analytics&ReportingReportingHR Analytics HR Analytics&Reporting&Reporting闭环的联合型闭环的联合型BI体系结构体系结构数据仓库的焦点问题数据仓库的焦点问题-数据的获得、存储和使用数据的获得、存储和使用数据的获得、存储和使用数据的获得、存储和使用RelationalPackageLegacyExternalsourceDataCleanToolDataStagingEnterprise DataWarehouse DatamartDatamartRDBMSROLAPRDBMSEnd-UserToolEnd-UserToolMDBEnd-UserToolEnd-UserToolvv数据仓库和集市的加载能力至关重要数据仓库和集市的加载能力至关重要vv数据仓库和集市的查询输出能力至关重数据仓库和集市的查询输出能力至关重要要ETL工具工具vv去掉操作型数据库中的不需要的数据去掉操作型数据库中的不需要的数据vv统一转换数据的名称和定义统一转换数据的名称和定义vv计算汇总数据和派生数据计算汇总数据和派生数据vv估计遗失数据的缺省值估计遗失数据的缺省值vv调节源数据的定义变化调节源数据的定义变化 ETL工具体系结构工具体系结构元数据库及元数据管理元数据库及元数据管理vv元元数数据据分分类类:技技术术元元数数据据;商商业业元元数数据据;数据仓库操作型信息。数据仓库操作型信息。-Alex Alex Berson Berson etc,1999etc,1999 vv技术元数据技术元数据n n包包包包括括括括为为为为数数数数据据据据仓仓仓仓库库库库设设设设计计计计人人人人员员员员和和和和管管管管理理理理员员员员使使使使用用用用的的的的数数数数据据据据仓仓仓仓库库库库数数数数据信息,用于执行数据仓库开发和管理任务。包括:据信息,用于执行数据仓库开发和管理任务。包括:据信息,用于执行数据仓库开发和管理任务。包括:据信息,用于执行数据仓库开发和管理任务。包括:n n数据源信息数据源信息数据源信息数据源信息n n转换描述(从操作数据库到数据仓库的映射方法,以转换描述(从操作数据库到数据仓库的映射方法,以转换描述(从操作数据库到数据仓库的映射方法,以转换描述(从操作数据库到数据仓库的映射方法,以及转换数据的算法)及转换数据的算法)及转换数据的算法)及转换数据的算法)n n目标数据的仓库对象和数据结构定义目标数据的仓库对象和数据结构定义目标数据的仓库对象和数据结构定义目标数据的仓库对象和数据结构定义n n数据清洗和数据增加的规则数据清洗和数据增加的规则数据清洗和数据增加的规则数据清洗和数据增加的规则n n数据映射操作数据映射操作数据映射操作数据映射操作n n访问权限,备份历史,存档历史,信息传输历史,数访问权限,备份历史,存档历史,信息传输历史,数访问权限,备份历史,存档历史,信息传输历史,数访问权限,备份历史,存档历史,信息传输历史,数据获取历史,数据访问,等等据获取历史,数据访问,等等据获取历史,数据访问,等等据获取历史,数据访问,等等元数据库及元数据管理元数据库及元数据管理vv商业元数据商业元数据n n给用户易于理解的信息,包括:给用户易于理解的信息,包括:给用户易于理解的信息,包括:给用户易于理解的信息,包括:n n主题区和信息对象类型,包括查询、报表、图像、音主题区和信息对象类型,包括查询、报表、图像、音主题区和信息对象类型,包括查询、报表、图像、音主题区和信息对象类型,包括查询、报表、图像、音频、视频等频、视频等频、视频等频、视频等n nInternetInternet主页主页主页主页n n支持数据仓库的其它信息,例如对于信息传输系统包支持数据仓库的其它信息,例如对于信息传输系统包支持数据仓库的其它信息,例如对于信息传输系统包支持数据仓库的其它信息,例如对于信息传输系统包括预约信息、调度信息、传送目标的详细描述、商业括预约信息、调度信息、传送目标的详细描述、商业括预约信息、调度信息、传送目标的详细描述、商业括预约信息、调度信息、传送目标的详细描述、商业查询对象,等查询对象,等查询对象,等查询对象,等vv数据仓库操作型信息数据仓库操作型信息n n例如,数据历史(快照,版本),拥有权,抽取的审例如,数据历史(快照,版本),拥有权,抽取的审例如,数据历史(快照,版本),拥有权,抽取的审例如,数据历史(快照,版本),拥有权,抽取的审计轨迹,数据用法计轨迹,数据用法计轨迹,数据用法计轨迹,数据用法 元数据库及元数据管理元数据库及元数据管理vv元数据库(元数据库(metadatarepository)和工具和工具 Martin Martin StardtStardt,20002000 数据访问和分析工具数据访问和分析工具vv报表报表vvOLAPvv数据挖掘数据挖掘提纲提纲vv数据仓库概念数据仓库概念vv数据仓库体系结构及组件数据仓库体系结构及组件vv数据仓库设计数据仓库设计vv数据仓库技术(与数据库技术的区别)数据仓库技术(与数据库技术的区别)vv数据仓库性能数据仓库性能vv数据仓库应用数据仓库应用vv数据挖掘应用概述数据挖掘应用概述vv数据挖掘技术与趋势数据挖掘技术与趋势vv数据挖掘应用平台(科委申请项目)数据挖掘应用平台(科委申请项目)数据仓库设计数据仓库设计vv自上而下(自上而下(Top-Down)vv自底而上(自底而上(Bottom Up)vv混合的方法混合的方法vv数据仓库建模数据仓库建模Top-down ApproachvBuild Enterprise data warehouseHCommon central data modelHData re-engineering performed onceHMinimize redundancy and inconsistencyHDetailed and history data;global data discoveryvBuild datamarts from the Enterprise Data Warehouse(EDW)HSubset of EDW relevant to departmentHMostly summarized dataHDirect dependency on EDW data availabilityLocal Data MartLocal Data MartExternal DataLocal Data MartOperational DataEnterprise Warehouse自底而上设计方法自底而上设计方法创建部门的数据集市创建部门的数据集市n范围局限于一个主题区域n快速的 ROI-局部的商业需求得到满足H本部门自治-设计上具有灵活性H对其他部门数据集市是一个好的指导H容易复制到其他部门 H需要为每个部门做数据重建H有一定级别的冗余和不一致性H一个切实可行的方法一个切实可行的方法v扩大到企业数据仓库扩大到企业数据仓库n创建EDB作为一个长期的目标局部数据集市局部数据集市外部数据外部数据操作型数据操作型数据(全部全部)操作型数据操作型数据(局部局部)操作型数据操作型数据(局部局部)局部数据集市局部数据集市企业数据仓库企业数据仓库EDB数据仓库建模数据仓库建模 星型模式星型模式vvExample of Star SchemaDateMonthYearDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProductNoProdNameProdDescCategoryQOHProductStoreIDCityStateCountryRegionStore数据仓库建模数据仓库建模 雪片模式雪片模式 DateMonthDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProductNoProdNameProdDescCategoryQOHProductMonthYearMonthYearYearCityStateCityCountryRegionCountryStateCountryStateStoreIDCityStorevvExample of Snowflake Schema操作型(操作型(OLTP)数据源数据源-销售库销售库星形模式星形模式时间维时间维事实表事实表多维模型多维模型事实事实度量度量(Metrics)时间维时间维时间维的属性时间维的属性提纲提纲vv数据仓库概念数据仓库概念vv数据仓库体系结构及组件数据仓库体系结构及组件vv数据仓库设计数据仓库设计vv数据仓库技术(与数据库技术的区别)数据仓库技术(与数据库技术的区别)vv数据仓库性能数据仓库性能vv数据仓库应用数据仓库应用vv数据挖掘应用概述数据挖掘应用概述vv数据挖掘技术与趋势数据挖掘技术与趋势vv数据挖掘应用平台(科委申请项目)数据挖掘应用平台(科委申请项目)数据仓库技术数据仓库技术 InmonInmon,199619961.1.1.1.管理大量数据管理大量数据管理大量数据管理大量数据n n能够管理大量数据的能力能够管理大量数据的能力能够管理大量数据的能力能够管理大量数据的能力n n能够管理好的能力能够管理好的能力能够管理好的能力能够管理好的能力2.2.2.2.管理多介质(层次)管理多介质(层次)管理多介质(层次)管理多介质(层次)n n主存、扩展内存、高速缓存、主存、扩展内存、高速缓存、主存、扩展内存、高速缓存、主存、扩展内存、高速缓存、DASDDASDDASDDASD、光盘、缩微胶片光盘、缩微胶片光盘、缩微胶片光盘、缩微胶片3.3.3.3.监视数据监视数据监视数据监视数据n n决定是否应数据重组决定是否应数据重组决定是否应数据重组决定是否应数据重组n n决定索引是否建立得不恰当决定索引是否建立得不恰当决定索引是否建立得不恰当决定索引是否建立得不恰当n n决定是否有太多数据溢出决定是否有太多数据溢出决定是否有太多数据溢出决定是否有太多数据溢出n n决定剩余的可用空间决定剩余的可用空间决定剩余的可用空间决定剩余的可用空间4.4.4.4.利用多种技术获得和传送数据利用多种技术获得和传送数据利用多种技术获得和传送数据利用多种技术获得和传送数据n n批模式,联机模式并不非常有用批模式,联机模式并不非常有用批模式,联机模式并不非常有用批模式,联机模式并不非常有用5.5.5.5.程序员程序员程序员程序员/设计者对数据存放位置的控制(块设计者对数据存放位置的控制(块设计者对数据存放位置的控制(块设计者对数据存放位置的控制(块/页)页)页)页)6.6.6.6.数据的并行存储数据的并行存储数据的并行存储数据的并行存储/管理管理管理管理7.7.7.7.元数据管理元数据管理元数据管理元数据管理数据仓库技术数据仓库技术 InmonInmon,199619968.8.8.8.数据仓库语言接口数据仓库语言接口数据仓库语言接口数据仓库语言接口n n能够一次访问一组数据能够一次访问一组数据能够一次访问一组数据能够一次访问一组数据n n能够一次访问一条记录能够一次访问一条记录能够一次访问一条记录能够一次访问一条记录n n支持一个或多个索引支持一个或多个索引支持一个或多个索引支持一个或多个索引n n有有有有SQLSQLSQLSQL接口接口接口接口9.9.9.9.数据的高效装入数据的高效装入数据的高效装入数据的高效装入10.10.10.10.高效索引的利用高效索引的利用高效索引的利用高效索引的利用n n用位映像的方法、多级索引等用位映像的方法、多级索引等用位映像的方法、多级索引等用位映像的方法、多级索引等11.11.11.11.数据压缩数据压缩数据压缩数据压缩n nI/OI/OI/OI/O资源比资源比资源比资源比CPUCPUCPUCPU资源少得多,因此数据解压缩不是主要问题资源少得多,因此数据解压缩不是主要问题资源少得多,因此数据解压缩不是主要问题资源少得多,因此数据解压缩不是主要问题12.12.12.12.复合键码(因为数据随时间变化)复合键码(因为数据随时间变化)复合键码(因为数据随时间变化)复合键码(因为数据随时间变化)13.13.13.13.变长数据变长数据变长数据变长数据14.14.14.14.加锁管理(程序员能显式控制锁管理程序)加锁管理(程序员能显式控制锁管理程序)加锁管理(程序员能显式控制锁管理程序)加锁管理(程序员能显式控制锁管理程序)15.15.15.15.单独索引处理(查看索引就能提供某些服务)单独索引处理(查看索引就能提供某些服务)单独索引处理(查看索引就能提供某些服务)单独索引处理(查看索引就能提供某些服务)16.16.16.16.快速恢复快速恢复快速恢复快速恢复数据仓库技术数据仓库技术 InmonInmon,1996199617.17.17.17.其他技术特征,传统技术起很小作用其他技术特征,传统技术起很小作用其他技术特征,传统技术起很小作用其他技术特征,传统技术起很小作用n n事务集成性、高速缓存、行事务集成性、高速缓存、行事务集成性、高速缓存、行事务集成性、高速缓存、行/页级锁定、参照完整性、数据视图页级锁定、参照完整性、数据视图页级锁定、参照完整性、数据视图页级锁定、参照完整性、数据视图18.18.18.18.传统传统传统传统DBMSDBMSDBMSDBMS与数据仓库与数据仓库与数据仓库与数据仓库DBMSDBMSDBMSDBMS区别区别区别区别n n为数据仓库和决策支持优化设计为数据仓库和决策支持优化设计为数据仓库和决策支持优化设计为数据仓库和决策支持优化设计n n管理更多数据:管理更多数据:管理更多数据:管理更多数据:10101010GB/100GB/TBGB/100GB/TBGB/100GB/TBGB/100GB/TBn n传统传统传统传统DBMSDBMSDBMSDBMS适合记录级更新,提供:锁定适合记录级更新,提供:锁定适合记录级更新,提供:锁定适合记录级更新,提供:锁定LockLockLockLock、提交提交提交提交CommitCommitCommitCommit、检测点检测点检测点检测点CheckPointCheckPointCheckPointCheckPoint、日志处理日志处理日志处理日志处理LogLogLogLog、死锁处理死锁处理死锁处理死锁处理DeadLockDeadLockDeadLockDeadLock、回退回退回退回退 RoolbackRoolbackRoolbackRoolback.n n基本数据管理,如:块管理,传统基本数据管理,如:块管理,传统基本数据管理,如:块管理,传统基本数据管理,如:块管理,传统DBMSDBMSDBMSDBMS需要预留空间需要预留空间需要预留空间需要预留空间n n索引区别:传统索引区别:传统索引区别:传统索引区别:传统DBMSDBMSDBMSDBMS限制索引数量,数据仓库限制索引数量,数据仓库限制索引数量,数据仓库限制索引数量,数据仓库DBMSDBMSDBMSDBMS没有限制没有限制没有限制没有限制n n通用通用通用通用DBMSDBMSDBMSDBMS物理上优化便于事务访问处理,而数据仓库便于物理上优化便于事务访问处理,而数据仓库便于物理上优化便于事务访问处理,而数据仓库便于物理上优化便于事务访问处理,而数据仓库便于DSSDSSDSSDSS访问分析访问分析访问分析访问分析19.19.19.19.改变改变改变改变DBMSDBMSDBMSDBMS技术技术技术技术20.20.20.20.多维多维多维多维D D D DBMSBMSBMSBMS和数据仓库和数据仓库和数据仓库和数据仓库n n多维多维多维多维DBMSDBMSDBMSDBMS作为数据仓库的数据库技术,这种想法是不正确的作为数据仓库的数据库技术,这种想法是不正确的作为数据仓库的数据库技术,这种想法是不正确的作为数据仓库的数据库技术,这种想法是不正确的n n多维多维多维多维DBMSDBMSDBMSDBMS(OLAPOLAPOLAPOLAP)是一种技术,数据仓库是一种体系结构的基础是一种技术,数据仓库是一种体系结构的基础是一种技术,数据仓库是一种体系结构的基础是一种技术,数据仓库是一种体系结构的基础21.21.21.21.双重粒度级别(双重粒度级别(双重粒度级别(双重粒度级别(DASD/DASD/DASD/DASD/磁带)磁带)磁带)磁带)数据仓库技术数据仓库技术