首页 > 解决方案 > 是否有关于肘部方法中 k 值的最佳范围的研究?

问题描述

我的主要问题是以某种方式定位 k 值的范围以执行肘部分析。目前我只能想到 2 到 min(num_rows, num_columns) 之间的范围。是否有任何其他可能更合适的最佳方法,特别是如果您有一个包含大量行和列的数据集?

PS,还有,有没有办法让它自动化,这样我们就不必看肘部图了?目前,我正在使用 Kneed 库的 KneeLocator 功能,但我想考虑更多选项。

谢谢你。

标签: pythoncluster-analysisk-means

解决方案


您可能知道,并不总是有“肘部”。即使有一个,也不一定代表最佳的集群数量。

Kneed 的 KneeLocator 函数可能是您最好的选择,因为它会找到具有最大曲率的 K。


推荐阅读