首页 > 解决方案 > 在 R 中设置 H2O DataFrame

问题描述

我想将许多不同的过滤器应用于 h2o 数据框以创建唯一的数据子集。我还想了解 h2o 使用的内存管理过程,因为我会将其应用于千兆字节的数据。

据我从类似的问题中可以看出,这个话题没有多少明确的答案,而且大多数问题都是几年前的问题。

library(h2o)    
h2o.init()    
h_mtcars <- as.h2o(mtcars)

### Subset of am == 1 and gear == 5 ###
index_am <- h_mtcars[["am"]] == 1
index_gear <- h_mtcars[["gear"]] == 5

index_combined <- index_am * index_gear 

h_mtcars[index_combined, ]

有没有办法用字符串来做到这一点,就像我们可以用 rlang 和数据框一样?

library(rlang)

expressions <- "am == '1' & gear == '5'"

index_local <- expressions %>% rlang::parse_quosure() %>% rlang::eval_tidy(mtcars)

mtcars[index_local, ]

标签: rh2o

解决方案


推荐阅读