首页 > 解决方案 > 基于地理坐标查找具有最大内部距离的聚类

问题描述

我有包含 Lat long 数据的 DataSet。

('ID','Latitude','Longitude')

('A0001',19.222,71.555)

使用这些数据,我计算了距离矩阵,其中 M[i][j] 是 ID:i 和 ID:j 之间的距离。

使用以下代码计算距离:

geopy.distance.vincenty((a,b),(c,d)).miles

有没有找到半径 X 英里内的集群的最佳方法。

大多数当前集群,如“DBSCAN”K-Means 提供了最小距离和最小样本的选项,但是我正在寻找提供最大距离的聚类方法。

其次,如果不需要,我可以不计算距离矩阵。

标签: pythongeolocationcluster-analysislatitude-longitudedistance-matrix

解决方案


做完整的链接层次聚类。

如果您在距离 x 处切割树,则同一簇中的任何两个点的距离最多为 x。它不是最优的(因为那将是 NP 完整的)但通常足够好。


推荐阅读