DBSCAN聚类算法复习课程.ppt





《DBSCAN聚类算法复习课程.ppt》由会员分享,可在线阅读,更多相关《DBSCAN聚类算法复习课程.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、DBSCAN聚类算法目目录基于密度的聚类算法的介绍DBSCAN算法的介绍DBSCAN算法在生物学领域的应用 DBSCANDBSCAN点分点分类基于密度定义,我们将点分为:稠密区域内部的点(核心点核心点)稠密区域边缘上的点(边界点界点)稀疏区域中的点(噪声或背景点噪声或背景点).DBSCANDBSCAN点分点分类核心点(core point):在半径Eps内含有超过MinPts数目的点,则该点为核心点 这些点都是在簇内的边界点(border point):在半径Eps内点的数量小于MinPts,但是在核心点的邻居噪音点(noise point):任何不是核心点或边界点的点.MinPts:给定点在
2、E领域内成为核心对象的最小领域点数 DBSCAN:DBSCAN:核心点、核心点、边界点和噪音点界点和噪音点DBSCAN:DBSCAN:核心点、核心点、边界点和噪音点界点和噪音点Original PointsPoint types:core,border and noiseEps=10,MinPts=4DBSCANDBSCAN算法概念算法概念Eps邻域域:给定对象半径Eps内的邻域称为该对象的Eps邻域,我们用 表示点p的Eps-半径内的点的集合,即:核心核心对象象:如果对象的Eps邻域至少包含最小数目MinPts的对象,则称该对象为核心对象。边界点:界点:边界点不是核心点,但落在某个核心点的邻
3、域内。噪音点:噪音点:既不是核心点,也不是边界点的任何点DBSCANDBSCAN算法概念算法概念直接密度可达:直接密度可达:给定一个对象集合D,如果p在q的Eps邻域内,而q是一个核心对象,则称对象p 从对象q出发时是直接密度可达的(directly density-reachable)。密度可达:密度可达:如果存在一个对象链 ,对于 ,是从 关于Eps和MinPts直接密度可达的,则对象p是从对象q关于Eps和MinPts密度可达的(density-reachable)密度相密度相连:如果存在对象OD,使对象p和q都是从O关于Eps和MinPts密度可达的,那么对象p到q是关于Eps和Min
4、Pts密度相连的(density-connected)。DBSCANDBSCAN算法概念示例算法概念示例如图所示,Eps用一个相应的半径表示,设MinPts=3,请分析Q,M,P,S,O,R这5个样本点之间的关系。“直接密度可达”和“密度可达”概念示意描述解答解答根据以上概念知道:由于有标记的各点M、P、O和R的Eps近邻均包含3个以上的点,因此它们都是核对象;M是从P“直接密度可达”;而Q则是从M“直接密度可达”;基于上述结果,Q是从P“密度可达”;但P从Q无法“密度可达”(非对称)。类似地,S和R从O是“密度可达”的;O、R和S均是“密度相连”的DBSCANDBSCAN算法原理算法原理DB
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DBSCAN 算法 复习 课程

限制150内