python - 是否有用于时空聚类的 python 函数?
问题描述
我正在使用具有纬度、经度和日期时间的数据集,每天有 500 万个点。而且我没有预期的集群数量,并且取决于它应该改变的日子。
我正在编码Python
,使用 aclickhouse database
来存储源数据。
==>有没有办法做一个spatiotemporal clustering
包括3个功能的?
到目前为止,我已经对 3 个功能进行了缩放/标准化,并使用了 MiniBatchKMeans (当前使用的解决方案)或 a Euclidian distance
,但我失去了点之间物理距离的概念。
DBSCAN
或HDBSCAN
withHavresine
仅接受 2 个特征(以弧度表示的纬度)。
此外,无法扩展的体积排除非优化解决方案(我已经尝试了 GitHub 上提供的 ST-DBSCAN,我在仅 2 小时的数据运行 15 小时后停止了它)。
我希望让我的数据点集群将位置和时间上最近的点重新组合在一起。
解决方案
推荐阅读
- java - java.nio.ByteBuffer 包装方法部分使用 sbt run
- php - 如何在 API Platform Swagger UI 中将 HTTP 设置为默认方案?
- excel - Excel根据切片器选择隐藏/取消隐藏文本框
- python - 在 python 中从 ax 导入 RangeParameter 时出错
- python - 错误:AttributeError:“NoneType”对象没有属性“find”
- ruby - 卡在 ruby 上的多项选择游戏中
- javascript - (Javascript)数字不会加起来
- mysql - 用 MySQL 比较一张表中的行
- javascript - 未捕获的类型错误:无法在评估中读取未定义的属性“使用”(app.js_+_120_modules:29481)
- google-chrome-extension - 即使规则另有说明,DeclarativeNetRequest 也会截获发起者 = localhost 的请求