python - 具有多个特征的大型数据集的动态时间规整 (DTW)
问题描述
我是 DTW 的新手,并试图将其应用于具有约 700,000 行和 9 个特征的数据集。我有两个数组(矩阵)的形式,
[
[0 1 0 0 0 0 0 0 0],
[0 0 0 0 1 0 0 0 0],
...
[0 0 0 0 0 0 1 0 0],
[0 0 1 0 0 0 0 0 0],
]
我已经探索了fastdtw和dtaidistance包。'fastdtw' 能够在大约 5 分钟内给出上述矩阵的输出距离。此外,我还希望将结果可视化,并应用层次聚类。我没有在 fastdtw 中找到任何函数来可视化路径/结果和聚类。
dtaidistance确实提供了这些功能,但运行时间太长(我为上面相同的两个系列运行它,15-20分钟后它仍在运行)。有没有办法处理这个?或者我可以用fastdtw的结果进行聚类和可视化吗?
我真的很感激对此的一些帮助。
解决方案
推荐阅读
- python - python3.6 PEXPECT 没有将日志写入日志文件
- c# - C# 忽略异常
- javascript - 在 Javascript 中从 JSON 获取多个无组织的值
- android - 从字符串数组中过滤数字并获取android中最后两个更大数字的索引
- java - 原始对象会受此代码影响吗?
- sql - DB2 选择不同的日期格式
- php - 更改/重组 Wordpress REST API 的输出以包含更多数据
- python - 在将图片保存到python3中的docx文件时调整图片的高度和宽度
- android - 谷歌应用内结算取消测试购买
- javascript - node.js 中的内存泄漏:使用 EventEmmiters 寻找内存泄漏的最小可行示例