2023年数据仓库与数据挖掘期末试题.docx
《2023年数据仓库与数据挖掘期末试题.docx》由会员分享,可在线阅读,更多相关《2023年数据仓库与数据挖掘期末试题.docx(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023年数据仓库与数据挖掘期末试题 广西财经学院20232023学年2023级数据仓库与数据挖掘卷 2、请列举您使用过的各种数据仓库工具软件(包括建模工具,ETL工具,前端展现工具,OLAP Server、数据库、数据挖掘工具)和熟悉程度。 ETL工具:Ascential DataStage ,IBM warehouse MANAGER、Informatica公司的PowerCenter、Cognos 公司的DecisionStream 市场上的主流数据仓库存储层软件有:SQL SERVER、SYBASE、ORACLE、DB 2、TERADATA 但是使用过的只有SQL SERVER和数据挖
2、掘工具Analysis Services,而且不大熟悉。 3、请谈一下你对元数据管理在数据仓库中的运用的理解。 元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:()描述哪些数据在数据仓库中;()定义要进入数据仓库中的数据和从数据仓库中产生的数据;()记录根据业务事件发生而随之进行的数据抽取工作时间安排;()记录并检测系统数据一致性的要求和执行情况;()衡量数据质量。 4、数据挖掘对聚类的数据要求是什么? (1)可伸缩性(2)处理不同类型属性的能力(3)发现任意形状的聚类(4)使
3、输入参数的领域知识最小化(5)处理噪声数据的能力(6)对于输入顺序不敏感 (7)高维性(8)基于约束的聚类(9)可解释性和可利用性 5、简述Apriori算法的思想,谈谈该算法的应用领域并举例。 思想:其发现关联规则分两步,第一是通过迭代,检索出数据源中所有烦琐项集,即支持度不低于用户设定的阀值的项即集,第二是利用第一步中检索出的烦琐项集构造出满足用户最小信任度的规则,其中,第一步即挖掘出所有频繁项集是该算法的核心,也占整个算法工作量的大部分。 在商务、金融、保险等领域皆有应用。 在建筑陶瓷行业中的交叉销售应用,主要采用了Apriori 算法 三、翻译分析题(30分) 1、附件有一名为“Dat
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 数据仓库 数据 挖掘 期末 试题
限制150内