首页 > 解决方案 > 如何计算不同聚类之间的 Jaccard 相似度

问题描述

我想使用 Python 来计算不同集群之间的 Jaccard 相似度。在我的数据集中,已经有一些集群被标记了。结果必须是根据集群的邻接矩阵。我已经看到了关于不同行之间的 Jaccard 相似度的问题,但我仍然不知道应该为每个集群计算哪个值以及如何处理。

下面是我的数据集: 只有前 5 行,实际上有 3000 行和 12 个集群

标签: pythondataframescipydata-mining

解决方案


推荐阅读