边-数据仓库和数据挖掘导读212641.pptx
《边-数据仓库和数据挖掘导读212641.pptx》由会员分享,可在线阅读,更多相关《边-数据仓库和数据挖掘导读212641.pptx(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实例实例我们现在的身份是我们现在的身份是FoodMartCorporation的数的数据库管理员。据库管理员。FoodMart是一家大型的连锁店,是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。通过下面在美国、墨西哥和加拿大有销售业务。通过下面建立的三个多维数据集示例,即建立的三个多维数据集示例,即Marketing(市(市场营销)、场营销)、HR(人力资源)和(人力资源)和ExpenseBudget(开支预算),您将建立访问数据所需的(开支预算),您将建立访问数据所需的各种连接,定义多维数据集,以最为有效的方式各种连接,定义多维数据集,以最为有效的方式分析数据。分析数据。1、建立系统数
2、据源连接、建立系统数据源连接数据源包含访问一个对象源数据所需的信息。数据源包含访问一个对象源数据所需的信息。为什么?在开始使用在开始使用AnalysisManager之前,必须首先在之前,必须首先在ODBC数据源管理器中设置和源数据的连接。数据源管理器中设置和源数据的连接。如何设置系统数据源名称(DSN)MicrosoftWindowsNT4.0用户:单击用户:单击“开始开始”按钮,按钮,指向指向“设置设置”,单击,单击“控制面板控制面板”,然后双击,然后双击“数据源数据源(ODBC)”。Windows2000用户:单击用户:单击“开始开始”按钮,按钮,指向指向“设置设置”,单击,单击“控制面
3、板控制面板”,然后双击,然后双击“管理工具管理工具”,再双击,再双击“数据源数据源(ODBC)”。在在“系统系统DSN”选项卡上单击选项卡上单击“添加添加”按钮。按钮。选择选择“MicrosoftAccess驱动程序驱动程序(*.mdb)”,然后单,然后单击击“完成完成”按钮。按钮。在在“数据源名数据源名”框中,输入框中,输入“教程教程”,然后在,然后在“数据库数据库”下,单击下,单击“选择选择”。在在“选择数据库选择数据库”对话框中,浏览到对话框中,浏览到“C:ProgramFilesMicrosoftAnalysisServicesSamples”,然后单,然后单击击“FoodMart20
4、00.mdb”。单击。单击“确定确定”按钮。按钮。在在“ODBCMicrosoftAccess安装安装”对话框中单击对话框中单击“确定确定”按钮。按钮。在在“ODBC数据源管理器数据源管理器”对话框中单击对话框中单击“确定确定”按钮。按钮。2、启动、启动AnalysisManagerAnalysisManager是一个在是一个在Microsoft管理控管理控制台制台(MMC)上运行的管理单元程序。上运行的管理单元程序。可以使用可以使用AnalysisManager管理管理OLAP和数据和数据挖掘对象及数据。挖掘对象及数据。如何启动 Analysis Manager单击单击“开始开始”按钮,依次
5、指向按钮,依次指向“程序程序”、“MicrosoftSQLServer”和和“AnalysisServices”,然后单击,然后单击“AnalysisManager”。3、建立数据库和数据源 现在即可以开始使用现在即可以开始使用AnalysisManager!为什么?为什么?在设计多维数据集前,需要建立一个数据库结构。数据库是在设计多维数据集前,需要建立一个数据库结构。数据库是指在其中存放多维数据集、角色、数据源、共享维度和挖掘指在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后需要和早期在模型的一种结构。然后需要和早期在ODBC数据源管理器数据源管理器中建立的数据源连接。
6、中建立的数据源连接。如何建立数据库结构在在AnalysisManager树视图中展开树视图中展开“AnalysisServers”。单击服务器名称,即可建立与单击服务器名称,即可建立与AnalysisServers的连接。的连接。右击服务器名称,然后单击右击服务器名称,然后单击“新建数据库新建数据库”命令。命令。在在“数据库数据库”对话框中的对话框中的“数据库名称数据库名称”框中,输入框中,输入“教教程程”,然后单击,然后单击“确定确定”按钮。按钮。在在AnalysisManager树窗格中展开服务器,然后展开刚树窗格中展开服务器,然后展开刚才创建的才创建的“教程教程”数据库。数据库。新的新的
7、“教程教程”数据库包含下列项目:数据库包含下列项目:数据源数据源多维数据集多维数据集共享维度共享维度挖掘模型挖掘模型数据库角色数据库角色然后,建立到然后,建立到“教程教程”数据源中的示例数据的连数据源中的示例数据的连接。接。在在AnalysisManager中中建立一个数据源建立一个数据源,将数,将数据库连接到在据库连接到在ODBC数据源管理器中建立的系统数据源管理器中建立的系统数据源名称数据源名称(DSN)上。在建立多维数据集的过程上。在建立多维数据集的过程中,所有的数据都将来自这个源。中,所有的数据都将来自这个源。如何建立数据源如何建立数据源在在AnalysisManager树窗格树窗格中
8、,右击中,右击“教程教程”数据库下的数据库下的“数据源数据源”文件夹,然后单击文件夹,然后单击“新数据源新数据源”命令。命令。在在“数据链接属性数据链接属性”对话框中,对话框中,单击单击“提供者提供者”选项卡,然后选项卡,然后单击单击“MicrosoftOLEDBProviderforODBCDrivers”。单击单击“连接连接”选项卡,然后从选项卡,然后从“使使用数据源名称用数据源名称”列表中单击列表中单击“教程教程”。单击单击“测试连接测试连接”以确保一切工作以确保一切工作正常。在正常。在“Microsoft数据链接数据链接”对话框中应出现一条消息,说明连对话框中应出现一条消息,说明连接成
9、功。在消息框中单击接成功。在消息框中单击“确定确定”按钮。按钮。单击单击“确定确定”按钮关闭按钮关闭“数据链接数据链接属性属性”对话框。对话框。4、建立多维数据集多维数据集是数据的一种多维结构。多维数据集由多维数据集是数据的一种多维结构。多维数据集由维度维度和和度量值度量值的集合进行定义。的集合进行定义。为什么?为什么?以多维方式建立数据模型可简化联机业务分析,提高查询以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建数据多维数据集,性能。通过创建数据多维数据集,AnalysisManager可可将存储在关系数据库中的数据转换为具有实际含义并且易将存储在关系数据库中的数据转换为具
10、有实际含义并且易于查询的业务信息。于查询的业务信息。管理关系数据以进行多维使用的最常用的方式是管理关系数据以进行多维使用的最常用的方式是星型架构。星型架构。星型架构由一个事实数据表和链接到该事实数据表的多个星型架构由一个事实数据表和链接到该事实数据表的多个维度表组成。维度表组成。市场部市场部想要按产品和顾客分析想要按产品和顾客分析1998年进行的所有销售业年进行的所有销售业务数据。使用存储在公司数据仓库中的数据,您就能建立务数据。使用存储在公司数据仓库中的数据,您就能建立多维数据结构(多维数据集),以便在市场分析人员查询多维数据结构(多维数据集),以便在市场分析人员查询数据库时获取快速的响应。
11、数据库时获取快速的响应。您将在本节建立一个您将在本节建立一个多维数据多维数据集集,用于进行销售分析。,用于进行销售分析。如何打开多维数据集向导如何打开多维数据集向导在在AnalysisManager树窗格中,树窗格中,“教程教程”数据库下,右数据库下,右击击“多维数据集多维数据集”文件夹,单击文件夹,单击“新建多维数据集新建多维数据集”菜单,菜单,然后单击然后单击“向导向导”命令。命令。如何向多维数据集添加度量值如何向多维数据集添加度量值度量值是要进行分析的数据库中的量化值。度量值是要进行分析的数据库中的量化值。常用的度量值常用的度量值为销售、成本和预算数据。为销售、成本和预算数据。度量值根据
12、多维数据集不同的度量值根据多维数据集不同的维度类别进行分析。维度类别进行分析。在多维数据集向导的在多维数据集向导的“欢迎欢迎”步骤,单击步骤,单击“下一步下一步”按钮。按钮。在在“从数据源中选择事实数据表从数据源中选择事实数据表”步骤,展开步骤,展开“教程教程”数数据源,然后单击据源,然后单击“sales_fact_1998”。单击单击“浏览数据浏览数据”按钮可以查看按钮可以查看“sales_fact_1998”表表中的数据。数据浏览完毕后,关闭中的数据。数据浏览完毕后,关闭“浏览数据浏览数据”窗口,然窗口,然后单击后单击“下一步下一步”按钮。按钮。若要定义多维数据集的度量值,在若要定义多维数
13、据集的度量值,在“事实数据表数据列事实数据表数据列”下,下,双击双击“store_sales”。对。对“store_cost”和和“unit_sales”列重复此步骤,然后单击列重复此步骤,然后单击“下一步下一步”按钮。按钮。如何建立时间维度如何建立时间维度在向导的在向导的“选择多维数据集的维度选择多维数据集的维度”步骤,单击步骤,单击“新建维度新建维度”命令。此操作将调用维度向导。命令。此操作将调用维度向导。在在“欢迎欢迎”步骤,单击步骤,单击“下一步下一步”按钮。按钮。在在“选择维度的创建方式选择维度的创建方式”步骤,选择步骤,选择“星型架构星型架构:单个维度:单个维度表表”选项,然后单击
14、选项,然后单击“下一步下一步”按钮。按钮。在在“选择维度表选择维度表”步骤,单击步骤,单击“time_by_day”。查看完。查看完“time_by_day”表后,单击表后,单击“下一步下一步”按钮。按钮。在在“选择维度类型选择维度类型”步骤,选择步骤,选择“时间维度时间维度”选项,然后单击选项,然后单击“下一步下一步”按钮。按钮。接下来,将定义维度的级别。在接下来,将定义维度的级别。在“创建时间维创建时间维度级别度级别”步骤,单击步骤,单击“选择时间级别选择时间级别”,单击,单击“年、季度、月年、季度、月”,然后单击,然后单击“下一步下一步”按钮。按钮。在在“选择高级选项选择高级选项”步骤,
15、单击步骤,单击“下一步下一步”按按钮。钮。在向导的最后一步,输入在向导的最后一步,输入“Time”作为新维度作为新维度的名称。的名称。单击单击“完成完成”返回到多维数据集向导。返回到多维数据集向导。在多维数据集向导中,现在应能在在多维数据集向导中,现在应能在“多维数据多维数据集维度集维度”列表中看到列表中看到“Time”维度。维度。如何建立产品维度如何建立产品维度再次单击再次单击“新建维度新建维度”命令。在命令。在“欢迎进入维度欢迎进入维度向导向导”步骤,单击步骤,单击“下一步下一步”按钮。按钮。在在“选择创建维度的方式选择创建维度的方式”步骤,选择步骤,选择“雪花架雪花架构构:多个相关维度表
16、多个相关维度表”选项,然后单击选项,然后单击“下一步下一步”按钮。按钮。在在“选择维度表选择维度表”步骤,双击步骤,双击“Product”和和“product_class”将它们添加到将它们添加到“选定的表选定的表”。单击单击“下一步下一步”按钮。按钮。在维度向导的在维度向导的“创建和编辑联接创建和编辑联接”步骤,显示在步骤,显示在上一步选定的两个表以及它们之间的联接。单击上一步选定的两个表以及它们之间的联接。单击“下一步下一步”按钮。按钮。若要定义维度的级别,在若要定义维度的级别,在“可用的列可用的列”下,按顺序双击下,按顺序双击“product_category”、“product_sub
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 导读 212641
限制150内