首页 > 解决方案 > 良好的霍普金斯分数,但聚类质量差

问题描述

在执行聚类之前,我使用 pyclustertend 的 Hopkins 分数来了解聚类形成的可能性。结果为 0.049,表明数据适合聚类。

然而,在聚类之后,通过轮廓分数评估的聚类质量并不令人印象深刻(0.37)。

据我了解,这似乎很矛盾。如果霍普金斯分数低,我会期待更高的轮廓分数。

我误解了这个吗?这是否暗示聚类过程出现问题?

谢谢!

标签: pandascluster-analysisk-means

解决方案


我以前没有使用过该模块,所以这可能不完全正确。

较低的 hopkins 分数表示良好的潜在聚类,理论上,也应该给出更高的轮廓分数。不得不进行一些挖掘,但显然,轮廓分数衡量了一个对象与其自己的集群与其他对象的相似程度。

我怀疑基于明显矛盾的信息可能是集群数量的结果。可能是某些对象靠近多个集群。尝试更改集群的数量。看看这如何改变这些物体的轮廓分数。或者查看大多数其他对象的轮廓分数如何。


推荐阅读