构建FoodMart数据仓库模板.pptx
《构建FoodMart数据仓库模板.pptx》由会员分享,可在线阅读,更多相关《构建FoodMart数据仓库模板.pptx(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 FoodMart数据库涉及到公司经营的各个方面,包括产品、库存、人事、客户和销售等。一个真正的商业智能应用应该对这些业务需求进行全面地考虑。本章截取这些需求中的销售部分构建商业智能 打开配套文件中附带的foodmart.mdf文件,可以看到如图2-1所示的表 第1页/共71页第2页/共71页各个表的说明人事管理人事管理三个表中:员工信息:员工信息employee、职务信息position、员工所属部门department,对应二个维度二个维度employee和department维度。库存管理业务中的仓库类型存储在warehouse_class表中,具体的仓库存储在warehouse中。第3
2、页/共71页四个多维数据集Warehouse and Sales多维数据集HR多维数据集多维数据集Budget多维数据集多维数据集Sales and Employee多维数据集多维数据集第4页/共71页 设计数据仓库逻辑模型设计数据仓库逻辑模型 福马特市场部的商务需求是要对1998年进行的所有销售业务数据进行多角度分析,以便市场分析人员能在查询数据库时获取快速的响应,高层管理人员也能从总体上把握影响本年度销售的因素。这需要利用存储在公司业务数据库中的数据,建立数据仓库,进而创建可用于分析的多维数据结构。第5页/共71页 设计数据仓库逻辑模型设计数据仓库逻辑模型 如前所述,这里只着眼于销售方面的
3、数据,因而把与销售相关的表提炼销售相关的表提炼出来进行分析。在foodmart数据库中,销售业务的数据和时间、促时间、促销手段、产品和店铺销手段、产品和店铺等都有关系,它们的关系体现在表与表之间的逻辑关系上。要从业务数据出发设计数据仓库的结构,必须明确业务数据本身的结构,而业务数据的关系一般是基于关系数据库设计的范式。数据仓库中表的关系不受关系数据库设计范式的约束,但也要遵循一定的结构规范,如星形结构和雪花形结构即是这种类型的规范。第6页/共71页这里希望用雪花形结构来构建福马特商店的销售数据仓库,逻辑结构设计图如图2-2所示 第7页/共71页销售数据仓库雪花形结构设计图 第8页/共71页在数
4、据仓库的逻辑结构中,数据表可以划分为两类:一类是事实数据表(简称为“事实表”),用来存储数据仓库中的实际数据,如这里存储1998年销售数据的sales_fact_1998表即为事实表;另一类是维度数据表(简称为“维度表”),用来存储数据仓库中的维度数据,如这里的关于时间、促销手段和产品时间、促销手段和产品等分析要素的表均为维度表。第9页/共71页注意:注意:在本例中设计的维度表和事实表与原始数据中的表名及结构都一致,这主要是由原始数据的特点和本章作为入门章节的定位决定的。在实际设计的时候,通常需要根据需求情况重新建立通常需要根据需求情况重新建立与原始数据不同的表结构与原始数据不同的表结构。这主
5、要是由于传统业务的数据库是用来进行事务处理的(即OLTP),而数据仓库则是用来进行分析处理的(即OLAP),用途的不同决定了其结构的不同。这一点在以后复杂的数据仓库设计中会通过示例体现出来。第10页/共71页 创建创建foodmartsale数据仓库数据仓库数据仓库也是一种数据库,其管理同样是通过数据库管理系统(DBMS)来进行的。因此数据仓库可以像普通数据库一样进行创建、修改和删除。当数据仓库的逻辑结构设计完后,就可以创建物理数据仓库了第11页/共71页在SQL Server Management Studio建立名为“foodmartsaleDW”的数据库,然后把这里设计的表创建好,数据类
6、型依据原始数据库中的各个表和字段的数据类型设置。但由于这里数据仓库的表结构与原始数据库中的表结构基本一致,因此,创建foodmartsaleDW数据仓库的物理结构过程也可以在ETL阶段完成 第12页/共71页2.2 设计和使用设计和使用ETL这里的任务就是要把数据从其他类型数据库或其他类型数据载体如access中装载到foodmartsaleDW数据仓库中。需要使用到SQL Server Integration Services服务,即SSIS 第13页/共71页SSIS(1)打开Business Intelligence Development Studio,选择【文件】【新建】【项目】命令
7、,弹出“新建项目”对话框,展开“商业智能项目”,在“模板”窗格中,单击“Integration Services项目”,把项目命名为“foodmartsale ETL”,如图2-3所示。第14页/共71页SSIS第15页/共71页SSIS这时会在BI Studio环境中打开用于设计SSIS的各种工具和窗口,数据提取、转换和加载数据提取、转换和加载的操作都在这个界面下进行。(2)选择【项目】【SSIS导入和导出向导】命令,这时会弹出SSIS导入和导出向导的欢迎界面,单击【下一步】按钮。(3)在“选择数据源”窗口中的“数据源”下拉列表框中选择Access数据源选项,如图2-4所示。然后在路径选择中
8、选择此项目文件夹中的foodmart 2000.mdb文件。第16页/共71页SSIS第17页/共71页SSIS第18页/共71页2-7第19页/共71页SSIS第20页/共71页SSIS这时会让用户选择源表和源视图,如图2-7所示。按照前面对数据仓库的设计,这里选择原始表中的7个表:time_by_day、promotion、product、product_class、customer、store和sales_fact_1998表作为需要输入的表。第21页/共71页这里对原始表中需要导入到数据仓库的数据有很强的可定制性,对这些已经选择的表中的字段还对这些已经选择的表中的字段还可以进行筛选和改
9、变,对不需要的字段进行去除可以进行筛选和改变,对不需要的字段进行去除操作,这就是所谓的数据清洗操作,这就是所谓的数据清洗。当然也可以选择其他的表一起导入数据仓库中。可以看到,不一定所有的业务数据库中的数据都必须体现在数据仓库中,数据仓库中的数据也有可能是经过业务数据库中的数据运算而得到的,这都取决于具体商务活动的需求。第22页/共71页在图2-7的界面中,还可以对数据导入的目标进行定制,可以对映射方式进行编辑,甚至可以自己写“CREATE TABLE”语句作为复制的目标表。这些改变都可以体现在数据仓库的物理结构中。第23页/共71页这里不对映射及其目标进行变更,保持默认的状态,使生成的数据仓库
10、的物理模型完全符合前面对数据仓库的逻辑模型的设计。(7)以上操作完成后,单击【下一步】按钮,系统将会把前面的操作列表并要求用户确认,并提示将会把包以“Package1.dtsx”作为文件名保存在项目文件夹下面,而且不会立即执行不会立即执行。确认无误后单击【完成】按钮。(8)在“解决方案资源管理器”中展开“SSIS包”文件夹,在Package1.dtsx上单击鼠标右键,在弹出的快捷菜单中选择【设为启动对象设为启动对象】命令,如图2-8所示。第24页/共71页第25页/共71页(9)单击工具条上的运行按钮运行按钮运行这个工程,可以发现在SSIS设计界面的“控制流”和“数据流”等选项卡内都有对象在活
11、动,这是系统正在把数据从foodmart 2000.mdb数据库中按照前面所确定的规则装载入foodmartsaleDW数据仓库中。注意:新建的数据仓库中的表需要设置必要需要设置必要的主键及外键的主键及外键,否则无法建立多维数据集第26页/共71页第27页/共71页2.3 创建创建OLAP数据立方数据立方设计好了结构良好的数据仓库,并且将需要分析的业务数据装载到了数据仓库中之后,就为满足商务决策的全方位需求打下了根基,以后的操作都是基于这些拥有数据的数据仓库进行的。但是,对数据的多维分析却并不是主要针对数据仓库,而是针对从数据仓库中提取的子集,如数据集市和多维数据集(也称为数据立方)。因此通常
12、还需要在具体分析数据之前创建数据立方。第28页/共71页数据立方的创建和管理需要用到SQL Server 2005中Business Intelligence Development Studio的Analysis Services组件,即SSAS。第29页/共71页这里将创建用于福马特商店销售分析的数据立方,首先要创建一个SSAS的项目。打开Business Intelligence Development Studio,选择【文件】【新建】【项目】命令,或按【Ctrl+Shift+N】组合键以显示“新建项目”对话框。在“新建项目”对话框中,从“项目类型”选项组中选择“商业智能项目”。从“V
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 构建 FoodMart 数据仓库 模板
限制150内