sql - 基于不同的字段值在 R 中创建子集数据集
问题描述
我正在尝试根据不同的字段值将数据集拆分为多个子集。例如:
SaleID Country
Sale1 US
Sale2 Mexico
Sale3 US
Sale4 Canada
Sale5 Canada
Sale6 Mexico
Sale7 Canada
期望的输出(3 个子集)
Data 1
SaleID Country
Sale1 US
Sale3 US
Data 2
SaleID Country
Sale2 Mexico
Sale6 Mexico
Data 3
Sale4 Canada
Sale5 Canada
Sale7 Canada
有任何想法吗?我的实际数据集有近 100 个不同的国家。我已经探索过在 R 中使用 sqldf 包,但还没有运气。任何帮助,将不胜感激
解决方案
最好创建L
这些数据集的列表。然后您可以引用L$US
or L[["US"]]
,比如说,并使用 引用所有名称names(L)
。
L <- split(DF, DF$Country)
可以使用以下行将它们复制到全局环境中的单个数据帧,但实际上并不推荐:
list2env(L, .GlobalEnv)
推荐阅读
- java - 尝试时没有这样的元素异常
- mysql - 如何改进这个内部连接查询?
- python - 如何优化加权值并输出到最少的行和字符?
- discord.js - 获取“#ReferenceError:未定义连接”
- node.js - error passing empty credentials to firestore emulator
- python - Python中的PDF到图像转换器代码错误
- mongodb - Why does my mongoDB account have 292 connections?
- mysql - 需要帮助优化大型表上的 sql JOIN 查询和索引
- python - 找不到 LSTM 的 dnn 实现
- c++ - 修改系统卷时如何修改 WASAPI 环回捕获卷?