r - 重塑数据框,以便匹配的家庭成员拥有自己的列
问题描述
我有一个数据框...
df <- tibble(
id = 1:5,
family = c("a","a","b","b","c"),
twin = c(1,2,1,2,1),
datacol1 = 11:15,
datacol2 = 21:25
)
对于每一对双胞胎(同一个家庭的成员),我需要第二个“datacol”与其他双胞胎的数据。这应该只发生在匹配的双胞胎中,所以第 5 行(来自“c”族)应该有重复的空列。
理想情况下,到最后数据将如下所示......
df <- tibble(
id = 1:5,
family = c("a","a","b","b","c"),
twin = c(1,2,1,2,1),
datacol1 = 11:15,
datacol1.b = c(12,11,14,13,NA),
datacol2 = 21:25,
datacol2.b = c(22,21,24,23,NA)
)
我添加了一张图片来帮助说明我想要达到的目的。
我希望能够对所有列或选定的列执行此操作,并且最好使用 tidyverse。
解决方案
我们也可以使用mutate_at
library(dplyr)
df %>%
group_by(family) %>%
mutate_at(vars(starts_with('datacol')), list(`2` =
~if(n() == 1) NA_integer_ else rev(.)))
# A tibble: 5 x 7
# Groups: family [3]
# id family twin datacol1 datacol2 datacol1_2 datacol2_2
# <int> <chr> <dbl> <int> <int> <int> <int>
#1 1 a 1 11 21 12 22
#2 2 a 2 12 22 11 21
#3 3 b 1 13 23 14 24
#4 4 b 2 14 24 13 23
#5 5 c 1 15 25 NA NA
推荐阅读
- c++ - 为什么从另一个构造函数内部调用的 C++ 构造函数不修改类变量?
- azure-devops - 将新标签推送到 github.com 时,如何在 Azure Pipelines 中触发构建?
- r - ifelse() 条件不适用于 ggplot
- angular - 以角度形式获取资源列表
- c# - 错误 405,在 C# 中的 HTTPRequest 上不允许使用方法
- python-3.x - PyCharm 不会安装 PyTorch - 构建轮失败
- javascript - WebSocket 在代码中返回 undefined 但在控制台中没有
- java - 更改约束中元素的可见性。组
- c++ - 创建 25 个应用程序窗口时 Qt Quick 应用程序锁定
- sas - 结合 IN、KEEP、DROP 和 RENAME 语句