python - 如何计算不同聚类之间的 Jaccard 相似度
问题描述
我想使用 Python 来计算不同集群之间的 Jaccard 相似度。在我的数据集中,已经有一些集群被标记了。结果必须是根据集群的邻接矩阵。我已经看到了关于不同行之间的 Jaccard 相似度的问题,但我仍然不知道应该为每个集群计算哪个值以及如何处理。
下面是我的数据集: 只有前 5 行,实际上有 3000 行和 12 个集群
解决方案
推荐阅读
- java - java项目中使用的目录“src/main/resources”是什么?
- java - Add Duplicate Keys in JSON - Java
- node.js - Mocha only runs one test case
- python - 在 ubuntu linux 中升级 docker compose 版本
- javascript - 这是如何在 try catch 块中出现未处理的 Promise 拒绝?
- r - POSIXct 上的时区转换不起作用
- reactjs - React redux:如何在按下后退按钮时清除 redux 存储状态
- javascript - 如何将参数从路由器传输到组件?
- javascript - Sessionstorage 保持整个网站的选择
- sql - 使用带有 ->> 或 #>> 的 JSON 字段中的数组选择多个键?