首页 > 解决方案 > 是否有用于时空聚类的 python 函数?

问题描述

我正在使用具有纬度、经度和日期时间的数据集,每天有 500 万个点。而且我没有预期的集群数量,并且取决于它应该改变的日子。

我正在编码Python,使用 aclickhouse database来存储源数据。

==>有没有办法做一个spatiotemporal clustering包括3个功能的?

到目前为止,我已经对 3 个功能进行了缩放/标准化,并使用了 MiniBatchKMeans (当前使用的解决方案)或 a Euclidian distance,但我失去了点之间物理距离的概念。

DBSCANHDBSCANwithHavresine仅接受 2 个特征(以弧度表示的纬度)。

此外,无法扩展的体积排除非优化解决方案(我已经尝试了 GitHub 上提供的 ST-DBSCAN,我在仅 2 小时的数据运行 15 小时后停止了它)。

我希望让我的数据点集群将位置和时间上最近的点重新组合在一起。

标签: pythoncluster-analysisspatialclickhousetemporal

解决方案


推荐阅读