cluster-analysis - 为 kmeans 聚类分析准备相关数据
问题描述
我有一个矩阵类型数据集,其中包含所有对象之间的距离。数据由(一大组)曲线之间的(hausdorff)距离组成。我的第一个直觉是将这些转换为 x 维向量并使用 kmeans 进行聚类。分析证明,一张合理准确的地图所需的维度数量迅速增加,数据根本不像可以放在二维地图中。这是excel中的一个小子集:
[![前 6 条曲线的数据][1]][1]
前 6 条曲线的数据
计算前两行的 2D 相当容易:
[![上两行坐标,下两行计算距离的差异][2]][2]
上 2 行中的坐标,下行中计算距离的差异,表明没有再现高阶距离。求解器的应用通常不会成功地仅基于 2 个坐标产生更好的结果,这里最后一列“已解决”,底部单元格是平方误差的总和:
[![应用求解器][3]][3]
那么问题来了:当只有相对测量值可用时,任何人都可以建议一种更好的方法来解决聚类数据的问题。我希望我的曝光能有所帮助。提前致谢![1] : https ://i.stack.imgur.com/BgWou.png [ 2 ]: https ://i.stack.imgur.com/ENsEB.png [3]:https://i.stack。 imgur.com/Rleq4.png
解决方案
推荐阅读
- php - 无法从 Laravel Eloquent 关系中获取数据
- python - ModuleNotFoundError:没有名为“后端”的模块
- reactjs - 如何使用 GitHub 托管我的 React 应用程序?
- java - 无法在回收站视图中显示数据
- java - Spring WebFlux Filepart DataBuffer 无法读取超过 108 行
- javascript - 如何在 React.cloneElement 中获取给定反应组件的文本元素?
- php - 使用 php/exec 或 php/mysqli 的 Mysql Server 性能
- java - 拥有环绕任何形状布局/视图的彩色阴影的最佳方式是什么?
- java - SpringBoot/JPA——数据行级授权
- flutter - 我构建的功能只能统一工作,解决方案是什么?