python - 如何比较 Python 中预定义集群的整体相似性?
问题描述
我有一个数据框,它分为 3 个预定义的组 - 即基于某些规则,这并不重要。我想获得总体相似度得分或可视化它们之间的相似度 - 跨越一系列指标。我已经查看了单个指标的分布以及数值指标的平均值/最小值/最大值等。但是有没有一种统计方法可以用来显示总体上人口的相似程度?这些组不是使用聚类技术构建的,所以我没有任何输出。这些指标是分类、二进制和数字的混合——如果需要,我可以使用 get dummies 将分类的转换为二进制,如果有帮助的话,可以缩放数字的。
解决方案
推荐阅读
- android - 有没有办法在 WebView 中显示 Chromecast 按钮?
- jackson - 从 Spring Batch 3 迁移到 4
- regex - 正则表达式模式,除了逗号之外不允许任何内容
- php - 如何在 URL 中使用 id 进行路由
- javascript - 加载电子渲染器时,http://和file://的require有什么区别?
- c# - C# 正则表达式匹配精确数字(包括整数和小数)
- android - 如何解决 adb:连接错误 f 或写入:已关闭
- r - 如果 R 中的语句涉及日期
- daterangepicker - 如何在侧边栏的选择器中更改 Bootstrap daterangepicker 语言
- javascript - 构建后如何在 Vue.js 项目中存储 Firebase 凭据(env_var)