2011年数据挖掘与数据仓库考试题(共2页).doc
《2011年数据挖掘与数据仓库考试题(共2页).doc》由会员分享,可在线阅读,更多相关《2011年数据挖掘与数据仓库考试题(共2页).doc(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上2011年数据挖掘与数据仓库考试题1 (10分)讨论::下列每项活动是否是数据挖掘任务?简单陈述你的理由。(a) 根据性别划分公司的顾客。(b) 根据可赢利性划分公司的顾客。(c) 预测投一对骰子的结果。(d) 使用历史记录预测某公司未来的股票价格。2 (10分)列举3种数据挖掘功能,对每种举2个实际应用的例子。3 (10分)比较急切分类(如,判定树、贝叶斯、神经网络)相对于懒散分类(如,k -最临近、基于案例的推理)的优缺点。4 (10分)假定你作为一个数据分析人员,受雇于一家移动通讯公司。通过一个例子说明打算如何使用数据挖掘技术为公司提供帮助。你的例子应包含问题描
2、述,使用何种数据挖掘方法解决该问题,理由和预期效果(不需要定量分析)。5 (10分)假设数据挖掘的任务是将如下的八个点(用(x,y)代表位置)聚类为三个类。A1(2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C2(4,9)距离函数是Euclidean函数。假设初始我们选择A1,B1,和C1为每个簇的中心,用k-means算法来给出(a) 在第一次循环执行后的三个簇中心(b) 最后的三个簇6 (10分)考虑下面的由Big-University的学生数据库挖掘的关联规则major(X,”science”) status(X,”under
3、grad”) (1) 假定学校的学生人数(即,任务相关的元组数)为5000,其中56%的在校本科生的专业是科学,64%的学生注册本科学位课程,70%的学生主修科学(science)。(a) 计算规则(1)的支持度和置信度。(b) 考虑下面的规则major(X,”biology”) status(X,”undergrad”) 17%,80% (2)假定主攻科学的学生30%专业为biology。与规则(1)对比,你认为规则(2)新颖吗?解释你的结论。7 (15分)考虑为产品销售问题建立数据仓库。关注的主题是销售,用销售量、销售价和成本度量(由此可以计算销售金额和利润)。销售涉及销售的产品、时间、客
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2011 数据 挖掘 数据仓库 考试题
限制150内