数据挖掘--DBSCAN

Posted hupcMaster

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘--DBSCAN相关的知识,希望对你有一定的参考价值。

DBSCAN:Density Based Spatial Clustering of Applications with Noise

Basic idea:

  • If an object p is density connected to q, then p and q belong to the same cluster
  • If an object is not density connected to any other object

    it is considered noise

 

Definitions

 

 

 

 

 

DBSCAN工作过程

从任意一个数据对象p开始,如果p是一个核心对象,则根据输入的两个参数和MinPts,通过广度优先搜索提取所有从p密度可达的数据对象,将它们标记为当前族,并从它们进一步扩展。

如果p是一个边界对象,则将p标记为噪声,再随机选取另外一个数据对象进行处理。

依次进行下去,直到找到一个完整的族。

然后再选择一个新的其它数据对象开始扩展,得到下一个族,算法一直进行到所有的数据对象都被标记过为止。

 

 

OPTICS: 针对该问题进行改进

 

 

以上是关于数据挖掘--DBSCAN的主要内容,如果未能解决你的问题,请参考以下文章

DBSCAN 按位置和密度对数据进行聚类

数据挖掘算法:DBSCAN算法的C++实现

DBSCAN聚类算法原理总结

如何用 DBSCAN 聚类算法做数据分析?

使用 dbscan 对角度数据进行聚类

DBSCAN 用于地理位置数据的聚类