首页 > 解决方案 > 如何将值分组为数据集中的较小值集?

问题描述

基本上我有一个包含 53 个值的单列数据集。我想要实现的是根据 400 点的差异将它们分成集合,范围从 ~500 到 4500。如果需要,你可以含糊其词并说明这样做的功能,我可以解决剩下的

标签: rbioinformatics

解决方案


一个dplyr选项

library(dplyr)
df_test <- data.frame(x = runif(1000, 400, 5000),
                      y = rep("A", 1000))

df_test <- df_test %>% 
  mutate(bins = case_when(between(x, 400, 800) ~ "Set 1",
                          between(x, 801, 1600) ~ "Set 2",
                          between(x, 1601, 5000) ~ "Set 3"))
head(df_test)
              x y  bins
    1 1687.2854 A Set 3
    2 3454.1035 A Set 3
    3 4979.5434 A Set 3
    4  796.6475 A Set 1
    5 3665.7444 A Set 3
    6 3083.8969 A Set 3

您当然可以根据需要调整between范围。


推荐阅读