r - 在现有行之间添加具有特定值的行
问题描述
我有曲棍球数据,称为df
structure(list(event_index = 1:57, coords_x = c(80, 53, 31, -56,
-34, -33, -40, 30, -66, -36, 45, 17, -6, 47, -51, -31, -69, -86,
-70, 80, 65, -76, -71, 81, -57, 80, 75, 77, -71, -40, -83, 62,
77, 76, NA, -61, 69, -45, 68, 31, 58, 61, 80, 34, 80, -85, -37,
-57, 76, 14, 49, -82, -34, -36, -83, -84, -55), coords_y = c(-1,
14, -30, 17, 26, -23, -37, 17, -32, -18, 25, 17, -38, 21, 28,
22, 17, 13, 10, -37, -17, 9, 18, -11, 21, -7, 3, 3, -38, 31,
8, -30, -2, 4, NA, -5, 15, 10, -30, -34, 20, 27, -4, 8, -18,
19, 32, -21, 0, 40, -4, -30, -24, -28, -2, -3, 34), event_rinkside = c("R",
"R", "R", "L", "L", "L", "L", "R", "L", "L", "R", "N", "N", "R",
"L", "L", "L", "L", "L", "R", "R", "L", "L", "R", "L", "R", "R",
"R", "L", "L", "L", "R", "R", "R", NA, "L", "R", "L", "R", "R",
"R", "R", "R", "R", "R", "L", "L", "L", "R", "N", "R", "L", "L",
"L", "L", "L", "L")), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -57L))
如何在每一行之后创建行,留下 57 * 2(114 行),但我新创建的行中的值取决于event_rinkside
列。
- 如果
event_rinkside
equalsR
,那么,我想插入82
intocoords_x
和0
intocoords_y
。 - 如果
event_rinkside
equalsL
,那么,我想插入-82
intocoords_x
和0
intocoords_y
。
我觉得这个SO 问题的解决方案是一个很好的起点,但我不知道如何结合自己的条件:
这是我正在谈论的解决方案:
library(purrr)
df %>%
group_by(id) %>%
map_dfr(rbind, NA) %>%
mutate(id = rep(df$id, each = 2))
解决方案
这是一个解决方案dplyr
:
library(dplyr)
df %>%
mutate(coords_x = 82 * ifelse(event_rinkside == "L", -1, 1),
coords_y = 0) %>%
rbind(df, .) %>%
arrange(event_index)
这个怎么运作:
在第一步中,mutate
用于修改df
. 该列coords_x
的值为 82;如果该值乘以 -1 event_rinkside == "L"
,否则乘以 1。该列coords_y
的值为 0。
在下一步中,未更改的原始数据框df
及其当前未分配和已修改的副本与rbind
. 这里,.
表示上述mutate
步骤的结果。的结果rbind
使原始版本的行高于修改版本的行。
在最后一步中,arrange
用于根据 的值对行进行排序event_index
。这样,每个原始行之后直接跟相应的修改行。
结果:
# A tibble: 114 x 4
event_index coords_x coords_y event_rinkside
<int> <dbl> <dbl> <chr>
1 1 80 -1 R
2 1 82 0 R
3 2 53 14 R
4 2 82 0 R
5 3 31 -30 R
6 3 82 0 R
7 4 -56 17 L
8 4 -82 0 L
9 5 -34 26 L
10 5 -82 0 L
# … with 104 more rows