数据仓库与数据挖掘考试试题(共4页).doc
《数据仓库与数据挖掘考试试题(共4页).doc》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘考试试题(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上一、 填空题(15分)1.数据仓库的特点分别是 面向主题 、 集成 、 相对稳定 、反映历史变化。2.元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为 技术 元数据和 业务 元数据两类。3.OLAP技术多维分析过程中,多维分析操作包括 切片 、 切块 、 钻取 、 旋转 等。4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“ 中心和辐射 ”架构,其中 企业级数据仓库 是中心,源数据系统和数据集市在输入和输出范围的两端。5.ODS实际上是一个集成的、 面向主题的 、 可更新的 、 当前值的 、 企业级的 、详细的数据
2、库,也叫运营数据存储。二、 多项选择题(10分)6.在数据挖掘的分析方法中,直接数据挖掘包括( )A 分类 B 关联 C 估值 D 预言7.数据仓库的数据ETL过程中,ETL软件的主要功能包括()A 数据抽取 B 数据转换 C 数据加载 D 数据稽核8.数据分类的评价准则包括( ABCD )A 精确度 B 查全率和查准率 C F-Measure D 几何均值9.层次聚类方法包括( BC )A 划分聚类方法 B 凝聚型层次聚类方法 C 分解型层次聚类方法 D 基于密度聚类方法10.贝叶斯网络由两部分组成,分别是( A D )A 网络结构 B 先验概率 C 后验概率 D 条件概率表三、 计算题(3
3、0分)11.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定supmin=40%,confmin=40%,使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。(15分)事务项目事务项目 T1 T2 T3面包、果冻、花生酱面包、花生酱面包、牛奶、花生酱 T4 T5啤酒、面包啤酒、牛奶解:(1)由I=面包、果冻、花生酱、牛奶、啤酒的所有项目直接产生1-候选C1,计算其支持度,取出支持度小于supmin的项集,形成1-频繁集L1,如下表所示:项集C1 支持度 项集L1 支持度面包 花生酱 牛奶 啤酒 4/53/52/52/5面
4、包 花生酱 牛奶 啤酒 4/5 3/5 2/5 2/5(2)组合连接L1中的各项目,产生2-候选集C2,计算其支持度,取出支持度小于supmin的项集,形成2-频繁集L2,如下表所示:项集C2 支持度 项集L2支持度面包、花生酱 3/5面包、花生酱 3/5至此,所有频繁集都被找到,算法结束,所以,confidence(面包花生酱)=(4/5)/(3/5)=4/3 confmin confidence( 花生酱面包)=(3/5)/(4/5)=3/4 confmin所以,关联规则面包花生酱、 花生酱面包均是强关联规则。12.给定以下数据集(2,4,10,12,15,3,21),进行K-Means聚
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 考试 试题
限制150内