首页 > 解决方案 > 如何使用 lapply 按行号范围对列表中的数据框进行子集化?

问题描述

我有一个数据框列表。我想提取每个数据帧的前 248 行,然后将它们绑定到一个数据帧中。

allData是数据框的列表。我尝试使用lapplywithsubset但我不知道如何在其中引用行号。函数的“子集”参数似乎subset只接受逻辑向量。

temp <- lapply(allData, subset, subset = (row.names(allData) <= 248))

这段代码是我的想法,它不起作用,因为row.names(allData)实际上只适用于列表本身,而不适用于数据框。那么如何引用每个数据框的行号呢?

标签: rdata-analysisdata-cleaning

解决方案


使用base R,我们可以做

do.call(rbind, lapply(allData, function(x) x[1:248, ]))

或与purrr

purrr::map_dfr(allData, ~.[1:248, ])

对数据使用可重现的示例mtcars并对前 5 行进行子集化。

allData <- list(mtcars, mtcars)
do.call(rbind, lapply(allData, function(x) x[1:5, ]))

#                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
#Mazda RX4          21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
#Mazda RX4 Wag      21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
#Datsun 710         22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
#Hornet 4 Drive     21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
#Hornet Sportabout  18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
#Mazda RX41         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
#Mazda RX4 Wag1     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
#Datsun 7101        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
#Hornet 4 Drive1    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
#Hornet Sportabout1 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2

推荐阅读