基于地理坐标查找具有最大间距的聚类

Posted

技术标签:

【中文标题】基于地理坐标查找具有最大间距的聚类【英文标题】:Finding Clusters with Max Intra-Distance Based on Geo Co-ordinates 【发布时间】:2019-01-28 12:44:14 【问题描述】:

我有包含经纬度数据的数据集。

('ID','Latitude','Longitude')

('A0001',19.222,71.555)

使用这些数据我计算了距离矩阵,其中 M[i][j] 是 ID:i 和 ID:j 之间的距离。

使用以下代码计算距离:

geopy.distance.vincenty((a,b),(c,d)).miles

有没有找到半径 X 英里内的集群的最佳方法。

目前的大多数集群,如“DBSCAN”K-Means 都提供了最小距离和最小样本的选项,但是我正在寻找提供最大距离的聚类方法。

其次,如果不需要,我可以不计算距离矩阵。

【问题讨论】:

【参考方案1】:

做完整的链接层次聚类。

如果在距离 x 处切割树,同一簇中的任意两个点的距离最多为 x。它不是最优的(因为那将是 NP 完全的)但通常足够好。

【讨论】:

以上是关于基于地理坐标查找具有最大间距的聚类的主要内容,如果未能解决你的问题,请参考以下文章

为什么说K-Means是基于距离的聚类算法?

为什么说K-Means是基于距离的聚类算法?

查找地理点的聚类(距离聚类中心 y 距离内的最小 x 点)的算法

高维数据的聚类小记

基于位置信息的聚类算法介绍及模型选择

密度聚类算法:利用DBSCAN观察用户的地理分布