首页 > 解决方案 > 正确的手动集群,使它们更相关

问题描述

我有集群。它们是手动完成的。我知道机器学习算法旨在有效地分割配置文件,但我不会放弃我拥有的集群。我只想稍微改变它们以使它们相关。当然,结果不会像 K-means 输出那么好。您是否知道任何来自现有集群并尝试优化/纠正它们的方法?非常感谢

标签: cluster-computingcluster-analysisclustered-indexclustering-key

解决方案


对于所有实际目的,自动集群往往比您手动标记的任何内容更糟糕。

所以我认为你不需要“优化”它们。

但是有一些明显的方法:

  • 对于 KMeans 和 PAM 等方法,您可以使用手动集群作为初始质心。只要确保它们不会退化...
  • 有约束聚类算法,您可以在其中使用现有标签作为约束,并让聚类算法找到具有最佳一致性的解决方案。

但不要高估聚类。它对参数、预处理、归一化非常敏感,...... - 它不是那么可靠。


推荐阅读