cluster-computing - 正确的手动集群,使它们更相关
问题描述
我有集群。它们是手动完成的。我知道机器学习算法旨在有效地分割配置文件,但我不会放弃我拥有的集群。我只想稍微改变它们以使它们相关。当然,结果不会像 K-means 输出那么好。您是否知道任何来自现有集群并尝试优化/纠正它们的方法?非常感谢
解决方案
对于所有实际目的,自动集群往往比您手动标记的任何内容更糟糕。
所以我认为你不需要“优化”它们。
但是有一些明显的方法:
- 对于 KMeans 和 PAM 等方法,您可以使用手动集群作为初始质心。只要确保它们不会退化...
- 有约束聚类算法,您可以在其中使用现有标签作为约束,并让聚类算法找到具有最佳一致性的解决方案。
但不要高估聚类。它对参数、预处理、归一化非常敏感,...... - 它不是那么可靠。
推荐阅读
- string - C++ std::experimental::is_detected 在 MSVC 中不起作用
- airflow - 如何使用环境变量在 Airflow 中定义 https 连接
- node.js - 错误 wtf UnMute 命令:无法读取未定义的属性“id”
- mysql - MySQL GENERATED ALWAYS AS ...导入时出现虚拟语法错误
- spring-boot - 我如何模拟 1 个依赖项并自动装配另一个?
- codeigniter - 在 codeigniter 中使用生成的 pdf 发送邮件
- python - 我部署的烧瓶应用程序中的错误,显示 500 内部服务器错误
- excel - 您如何在 Excel 中根据单元格值总计预定义值
- html - HTML如何根据选定的下拉值保存输入
- google-sheets - 如何使用静态索引从多个来源创建摘要页面