数据挖掘考试题目——聚类(共5页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据挖掘考试题目——聚类(共5页).doc》由会员分享,可在线阅读,更多相关《数据挖掘考试题目——聚类(共5页).doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上数据挖掘考试题目聚类一 、填空题1、密度的基于中心的方法使得我们可以将点分类为:_、_ 、_。2、DBSCAN算法在最坏的情况下,时间复杂度是_、空间复杂度是_。3、DBSCAN算法的优点是_、_。4、DBSCAN算法的缺点是处理_、_的数据效果不好。5、DBSCAN算法的参数有:_、_。6、簇的有效性的非监督度量常常可以分为两类:_、_,它常采用的指标为_。7、簇的有效性的监督度量通常称为_,它度量簇标号与外部提供的标号的匹配程度主要借助_。8、在相似度矩阵评价的聚类中,如果有明显分离的簇,则相似度矩阵应当粗略地是_。9、DBSCAN算法的参数确定的基本方法是观察_
2、的特性。10、不引用附加的信息,评估聚类分析结果对数据拟合情况属于_技术。答案:1、 核心点 边界点 噪声点2、 O(n2) O(n)3、 耐噪声 能够处理任意大小和形状的簇4、 高维数据 变密度的5、 EPS MinPts6、 簇的凝聚性 簇的分离性 均方差(SSE)7、 外部指标 监督指标的熵8、 块对角的9、 点到它的第K个最近邻的距离(K-距离)10、非监督二、选择题1、DBSCAN算法的过程是(B)。 删除噪声点。 每组连通的核心点形成一个簇。 将所有点标记为核心点、边界点和噪声点。 将每个边界点指派到一个与之关联的核心点的簇中。 为距离在Eps之内的所有核心点之间赋予一条边。A:B
3、:C:D:2、如果有m个点,DBSCAN在最坏的情况下的时间复杂度度为(C)。A O(m) B O(mlogm) C O(m2) D O(logm)3、在基本DBSCAN的参数选择方法中,点到它的K个最近邻的距离中的K选作为哪一个参数(B)。A Eps B MinPts C 质心 D 边界4、当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为(A)。A 噪声 B 核心簇 C 边界簇 D以上都不对5、如果处理以下形状的数据时,适宜采用DBSCAN的是(B)A 球形 B SS形 C 椭球形 D 方形6、DBSCAN之所以难
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 考试 题目 聚类
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内