r - 根据参数将数据集拆分为多个数据集
问题描述
我有一个大型数据集,并希望根据特定列值将其拆分为多个数据集。此列是以英里为单位的距离(例如,从 1.34 英里到 19.92 英里),我想将其拆分为每 1/4 英里。
我需要使用子集还是拆分?
解决方案
您可以使用dplyr::ntile
,但是如文档中所述,它是“一个粗略的排名,它将输入向量分成 n 个桶。 ”
library(dplyr)
num_bins = ceiling((19.92 - 1.34)/0.25)
df %>%
mutate(bin = ntile(value, num_bins)) %>%
group_split(bin)
推荐阅读
- r - RShiny 错误:.getReactiveEnvironment()$currentContext() 中的错误
- javascript - 如何以角度获取请求标头引用网址?
- wordpress - 在 WordPress 中打开自定义单个帖子
- c# - ServiceStack Redis(AWS ElastiCache 实施)使用 .Net 核心导致错误 No master found in: redis-cluster-xxxxxxxx:637
- angular - 如何在 Angular 单元测试中对当前日期和时间编写单元测试?
- laravel - 如何检测表单是否正在提交到 Laravel 中的外部链接?
- java - Camunda bpmn计时器事件找不到java委托
- c# - 在 Visual Studio 中运行所有测试的命令或 Powershell
- java - java.lang.RuntimeException:无法在 Androidstudio 中启动活动
- swift - Swift 中的模型和视图模型关系 (MVVM)