cluster-analysis - 一种在 R 中对一个因子内的水平进行统计聚类/分组的方法
问题描述
我有一个由数字因变量和许多数字和分类解释变量构成的大数据库。我的一个类别变量中有太多级别,我正在寻找一种统计方法将一些级别聚集在一起。
类别变量与此类似:
crops<- c("barley", "wheat", "broccoli", "sunflower", "cabbage", "carrot", "cheak_pea", "clover", "jojoba"....)
我已经做了anova,发现不同级别之间存在差异,而tukey只给了我所有对之间的差异。有什么建议可以找到我可以结合并最终得到少量关卡的接近关卡吗?
谢谢!
解决方案
推荐阅读
- c# - 从以 varbinary 格式保存的 SQL 读取数据并在系统发送的电子邮件中附加文件?
- javascript - 如何使用反应测试库测试自定义 Hook
- excel - 保存自动过滤器设置并重新应用
- javascript - 如何在提交后立即显示评论而不在 Vue 中渲染页面
- javascript - Div 在点击时显示,但仅显示一秒钟
- html - 在 THTMLViewer 上修改元素样式
- python - 如何将对列表转换为字典,其中每个元素作为配对值列表的键?
- c# - 将架构更改为 x64 后,Lucene IndexWriter.AddDocument 变慢
- angular - 在 Nativescript 中初始化组件时随机出现错误
- python - 使用 python 在 selenium 中滚动时出错