pandas - 良好的霍普金斯分数,但聚类质量差
问题描述
在执行聚类之前,我使用 pyclustertend 的 Hopkins 分数来了解聚类形成的可能性。结果为 0.049,表明数据适合聚类。
然而,在聚类之后,通过轮廓分数评估的聚类质量并不令人印象深刻(0.37)。
据我了解,这似乎很矛盾。如果霍普金斯分数低,我会期待更高的轮廓分数。
我误解了这个吗?这是否暗示聚类过程出现问题?
谢谢!
解决方案
我以前没有使用过该模块,所以这可能不完全正确。
较低的 hopkins 分数表示良好的潜在聚类,理论上,也应该给出更高的轮廓分数。不得不进行一些挖掘,但显然,轮廓分数衡量了一个对象与其自己的集群与其他对象的相似程度。
我怀疑基于明显矛盾的信息可能是集群数量的结果。可能是某些对象靠近多个集群。尝试更改集群的数量。看看这如何改变这些物体的轮廓分数。或者查看大多数其他对象的轮廓分数如何。
推荐阅读
- flutter - Flutter:在折线图中隐藏线和轴
- python - SELECT 语句是 MySql 使用 python 返回错误值
- reactjs - 如何使内容可用于高级 React Native
- c - 为什么我得到一个'public_stream!= nullptr' 执行时出错,即使我已成功使用 'fopen_s' 读取文件?
- rabbitmq - RabbitMQ LDAP 身份验证问题
- visual-studio-code - vscode 自定义编辑器扩展开发:没有与文档关联的编辑器
- python - Python中小型进程的快速多处理
- ios - Flutter 构建 iOS 失败
- json - 使用 NewtonSoft 将 json 字符串转换并解析为键值对
- xml - 带有 & 符号 ( ) 的 xpath 属性引发错误“XPST0003: 没有关闭 ';' 为实体或字符参考找到'