r - 如何通过 r 中列的不同值平均分割数据帧?
问题描述
我有一个数据框 df ,我想按列中的特定值对其进行拆分/子集。包含这些值的列是列 ID。这样做的原因是因为我想为每个不同的 ID 生成折线图。我的真实数据集有很多唯一的 ID,因此如果我为同一页面中的每个 ID 生成折线图,将很难阅读它们。因此,我正在考虑将数据集拆分为较小的数据集,其中包含 5 个不同的 ID。有没有人可以提供帮助或想出更好的主意?
dput(df)
structure(list(ID = c("F1", "F1", "F1", "F1", "F1", "F1", "F1",
"F2", "F2", "F2", "F2", "F2", "F2", "F2", "F2", "F3", "F3", "F3",
"F3", "F3", "F3", "F3", "F3", "F3", "F4", "F4", "F4", "F4", "F4",
"F4", "F4", "F4"), Date = c("22/6/2021", "23/6/2021", "24/6/2021",
"25/6/2021", "26/6/2021", "27/6/2021", "28/6/2021", "22/6/2021",
"23/6/2021", "24/6/2021", "25/6/2021", "26/6/2021", "27/6/2021",
"28/6/2021", "29/6/2021", "22/6/2021", "23/6/2021", "24/6/2021",
"25/6/2021", "26/6/2021", "27/6/2021", "28/6/2021", "29/6/2021",
"30/6/2021", "22/6/2021", "23/6/2021", "24/6/2021", "25/6/2021",
"26/6/2021", "27/6/2021", "28/6/2021", "29/6/2021"), Values = c(9.6,
9.8, 10.2, 9.8, 9.9, 9.9, 9.9, 1.2, 1.2, 1.8, 1.5, 1.5, 1.6,
1.4, 1.1, 3266, 3256, 7044, 6868, 6556, 3405, 3410, 3980, 5567,
59.4, 56, 52.8, 52.4, 55.5, 54, 61, 53.6)), class = "data.frame", row.names = c(NA,
-32L))
这些是折线图的代码行。问题是有很多不同的 ID,当我运行此代码时,所有折线图都在同一页面上,很难阅读它们。此外,由于所有内容都被挤压,因此无法显示日期。我可以只将所有线条放在一个图表中,但每个 ID 的值范围都不同。
ggplot(data = df, aes(x = factor(Date), y = Values)) +
geom_line(aes(group = ID)) + geom_point() +
facet_wrap(~ID, scales = 'free')
解决方案
我们可以使用%/%
在split
创建的序列索引上执行match
library(dplyr)
library(ggplot2)
library(gridExtra)
library(purrr)
lst1 <- df %>%
group_split(grp =((match(ID, unique(ID)) -1) %/% 5 + 1))
现在,遍历列表map
并创建绘图并另存为.pdf
out <- map(lst1, ~ .x %>%
ggplot(aes(x = factor(Date), y = Values)) +
geom_line(aes(group = ID)) + geom_point() +
facet_wrap(~ID, scales = 'free'))
ggsave(
filename = "plots.pdf",
plot = marrangeGrob(out, nrow=1, ncol=1),
width = 15, height = 9
)
推荐阅读
- javascript - 如何在 React.js 的 return 方法中编写 JS 代码
- go - Go 运行时错误:恐慌:运行时错误:无效的内存地址或 nil 指针取消引用
- python - 使用分类嵌入器包时出现问题
- python - 是否可以在端到端测试中使用 Selenium + Webdriver 模拟语音输入?
- git - 提交日历与 PC 时间不同步
- sql - postgresql 连接两个没有关系的表
- reactjs - 由于 eslint 导入/no-webpack-loader-syntax,CRA 无法构建
- powershell - 创建没有密码的 SecretStore 保险库
- reactjs - 如何根据他们的 id 过滤掉数据?
- java - 找不到符号队列 Java