首页 > 解决方案 > 如何为R中不同变量组的聚类结果创建统计摘要

问题描述

我想知道是否有软件包或快速方法可以为聚类结果生成统计汇总表。我想我可以选择感兴趣的变量并按簇数分组,然后计算平均值和最大值等。我正在寻找一种快速的方法来做到这一点。有什么我可以使用的包吗?

谢谢

标签: rgroup-bycluster-analysis

解决方案


最快和最简单的方法可能取决于您想要的确切结果。最简单的方法可能是summary()在基础 R 中,更通用的是使用dplyr具有其功能的包group_by()summarize(). 对于特定类型的数据,其他包可能会提供更实用的总结。

一个例子:

DF <- data.frame(groups = sample(LETTERS, 20, replace = TRUE),
                 var = runif(20))

summary(DF)

library(dplyr)
DF %>%
  group_by(groups) %>%
  summarize(mean_by_group = mean(var),
            number = n())

推荐阅读