首页 > 解决方案 > 根据参数将数据集拆分为多个数据集

问题描述

我有一个大型数据集,并希望根据特定列值将其拆分为多个数据集。此列是以英里为单位的距离(例如,从 1.34 英里到 19.92 英里),我想将其拆分为每 1/4 英里。

我需要使用子集还是拆分?

标签: r

解决方案


您可以使用dplyr::ntile,但是如文档中所述,它是“一个粗略的排名,它将输入向量分成 n 个桶。

library(dplyr)
num_bins = ceiling((19.92 - 1.34)/0.25)
df %>%
  mutate(bin = ntile(value, num_bins)) %>% 
  group_split(bin)

推荐阅读