r - R - Purrr - 使用 map() 切片,或者:如何根据 NA 切片不同长度的小标题列表?
问题描述
我试图弄清楚如何根据非 NA 的首次出现来对不同长度的小标题列表进行切片或子集化。我所有的小标题都具有不同的尺寸和许多 NA,但对所有人来说,共同点是它们在我需要删除的第一行中有一些 NA。
我只对在保留所有后续行的同时摆脱前几行感兴趣。
我创建了一个可以说明我的数据的代表:
tbl <- tibble(
first = c(NA, 1, 2, 3, NA),
second = c(NA, 1, NA, 3, NA),
third = c(NA, 1, 2, NA, NA)
)
lst <- list(
list1 = tbl,
list2 = tbl,
list3 = tbl
)
lst
$list1
# A tibble: 5 x 3
first second third
<dbl> <dbl> <dbl>
1 NA NA NA
2 1 1 1
3 2 NA 2
4 3 3 NA
5 NA NA NA
$list2
# A tibble: 5 x 3
first second third
<dbl> <dbl> <dbl>
1 NA NA NA
2 1 1 1
3 2 NA 2
4 3 3 NA
5 NA NA NA
$list3
# A tibble: 5 x 3
first second third
<dbl> <dbl> <dbl>
1 NA NA NA
2 1 1 1
3 2 NA 2
4 3 3 NA
5 NA NA NA
我已经尝试与和map()
结合使用which.min()
并is.na()
尝试基于非 NA 的第一个实例进行切片,但无法使其工作。
sliced <- map(lst, slice, which.min(is.na):nrow())
我得到的只是以下错误:
Error in which.min(is.na) :
cannot coerce type 'builtin' to vector of type 'double'
有没有办法解决这个问题?
解决方案
is.na
需要一个向量。您可能需要将特定列传递给它。
例如,使用第一列你可以做 -
library(dplyr)
library(purrr)
map(lst, ~.x %>% slice(which.max(!is.na(.[[1]])) : n()))
#$list1
# A tibble: 4 x 3
# first second third
# <dbl> <dbl> <dbl>
#1 1 1 1
#2 2 NA 2
#3 3 3 NA
#4 NA NA NA
#$list2
# A tibble: 4 x 3
# first second third
# <dbl> <dbl> <dbl>
#1 1 1 1
#2 2 NA 2
#3 3 3 NA
#4 NA NA NA
#$list3
# A tibble: 4 x 3
# first second third
# <dbl> <dbl> <dbl>
#1 1 1 1
#2 2 NA 2
#3 3 3 NA
#4 NA NA NA
推荐阅读
- c# - 抛出 TimeoutException 是一个好习惯吗?
- gradle - 为什么 gradle 包装器需要特定设置来启用代码完成?
- r - 获取每行的非零和行的矩阵行索引和列索引
- python-3.x - 错误:builtin_function_or_method' 对象在 python 中不可下标
- python - 有没有一种计算效率更高的方法来使用 Pandas 找到匹配正则表达式的第一个匹配项?
- jquery - 在表查询中查找值
- javascript - 如何访问车把中的 app.locals 变量
- google-bigquery - Big Query 统一费率定价中复制、加载和导出操作的槽利用
- python - ValueError:模型的输出张量必须是 Keras `Layer` 的输出
- c# - 删除基于数据的数据网格视图