首页 > 解决方案 > 如何比较 Python 中预定义集群的整体相似性?

问题描述

我有一个数据框,它分为 3 个预定义的组 - 即基于某些规则,这并不重要。我想获得总体相似度得分或可视化它们之间的相似度 - 跨越一系列指标。我已经查看了单个指标的分布以及数值指标的平均值/最小值/最大值等。但是有没有一种统计方法可以用来显示总体上人口的相似程度?这些组不是使用聚类技术构建的,所以我没有任何输出。这些指标是分类、二进制和数字的混合——如果需要,我可以使用 get dummies 将分类的转换为二进制,如果有帮助的话,可以缩放数字的。

标签: pythoncluster-analysissimilarity

解决方案


推荐阅读