首页 > 解决方案 > 为 kmeans 聚类分析准备相关数据

问题描述

我有一个矩阵类型数据集,其中包含所有对象之间的距离。数据由(一大组)曲线之间的(hausdorff)距离组成。我的第一个直觉是将这些转换为 x 维向量并使用 kmeans 进行聚类。分析证明,一张合理准确的地图所需的维度数量迅速增加,数据根本不像可以放在二维地图中。这是excel中的一个小子集:

[![前 6 条曲线的数据][1]][1]

前 6 条曲线的数据

计算前两行的 2D 相当容易:

[![上两行坐标,下两行计算距离的差异][2]][2]

上 2 行中的坐标,下行中计算距离的差异,表明没有再现高阶距离。求解器的应用通常不会成功地仅基于 2 个坐标产生更好的结果,这里最后一列“已解决”,底部单元格是平方误差的总和:

[![应用求解器][3]][3]

那么问题来了:当只有相对测量值可用时,任何人都可以建议一种更好的方法来解决聚类数据的问题。我希望我的曝光能有所帮助。提前致谢![1] : https ://i.stack.imgur.com/BgWou.png [ 2 ]: https ://i.stack.imgur.com/ENsEB.png [3]:https://i.stack。 imgur.com/Rleq4.png

标签: cluster-analysis

解决方案


推荐阅读