首页 > 解决方案 > 仅在 r 的数据表中对具有数值的列运行函数

问题描述

我想运行以下功能

count_greater_than <- function(x){
  ret <- sum(x > 1);
  return(ret);
}

将 iris 数据集作为数据表。但是,我只想为 iris 中具有数值的所有列(除“物种”之外的所有列)运行该函数。我的方法是

dt <- as.data.table(iris);
gr_1 <- dt[, sapply(.SD,count_greater_than, is.numeric)];
names(gr_1) <- colnames(iris);
gr_1;

这给了我;

Sepal.Length  Sepal.Width Petal.Length  Petal.Width      Species 
         150          150          149           93           NA 

但我想要的是;

Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
150          150          149           93 

有没有办法排除具有非数字值的列?或者至少指定我想要涵盖的列?

标签: rdata.table

解决方案


您可以使用.SDcols指定要应用该函数的列。

library(data.table)
dt[, lapply(.SD, count_greater_than), .SDcols = sapply(dt, is.numeric)]


#   Sepal.Length Sepal.Width Petal.Length Petal.Width
#1:          150         150          149          93

中的等价物dplyr是:

library(dplyr)
dt %>% summarise_if(is.numeric, count_greater_than)

推荐阅读