首页 > 解决方案 > 一种在 R 中对一个因子内的水平进行统计聚类/分组的方法

问题描述

我有一个由数字因变量和许多数字和分类解释变量构成的大数据库。我的一个类别变量中有太多级别,我正在寻找一种统计方法将一些级别聚集在一起。

类别变量与此类似:

crops<- c("barley", "wheat", "broccoli", "sunflower", "cabbage", "carrot", "cheak_pea", "clover", "jojoba"....)

我已经做了anova,发现不同级别之间存在差异,而tukey只给了我所有对之间的差异。有什么建议可以找到我可以结合并最终得到少量关卡的接近关卡吗?

谢谢!

标签: cluster-analysisanovahierarchical-clusteringposthoc

解决方案


推荐阅读