首页 > 解决方案 > 具有多个特征的大型数据集的动态时间规整 (DTW)

问题描述

我是 DTW 的新手,并试图将其应用于具有约 700,000 行和 9 个特征的数据集。我有两个数组(矩阵)的形式,

[
   [0 1 0 0 0 0 0 0 0],
   [0 0 0 0 1 0 0 0 0],
   ...
   [0 0 0 0 0 0 1 0 0],
   [0 0 1 0 0 0 0 0 0],
]

我已经探索了fastdtwdtaidistance包。'fastdtw' 能够在大约 5 分钟内给出上述矩阵的输出距离。此外,我还希望将结果可视化,并应用层次聚类。我没有在 fastdtw 中找到任何函数来可视化路径/结果和聚类。

dtaidistance确实提供了这些功能,但运行时间太长(我为上面相同的两个系列运行它,15-20分钟后它仍在运行)。有没有办法处理这个?或者我可以用fastdtw的结果进行聚类和可视化吗?

我真的很感激对此的一些帮助。

标签: pythonhierarchical-clusteringdtw

解决方案


推荐阅读