r - 在 R 中设置 H2O DataFrame
问题描述
我想将许多不同的过滤器应用于 h2o 数据框以创建唯一的数据子集。我还想了解 h2o 使用的内存管理过程,因为我会将其应用于千兆字节的数据。
据我从类似的问题中可以看出,这个话题没有多少明确的答案,而且大多数问题都是几年前的问题。
library(h2o)
h2o.init()
h_mtcars <- as.h2o(mtcars)
### Subset of am == 1 and gear == 5 ###
index_am <- h_mtcars[["am"]] == 1
index_gear <- h_mtcars[["gear"]] == 5
index_combined <- index_am * index_gear
h_mtcars[index_combined, ]
有没有办法用字符串来做到这一点,就像我们可以用 rlang 和数据框一样?
library(rlang)
expressions <- "am == '1' & gear == '5'"
index_local <- expressions %>% rlang::parse_quosure() %>% rlang::eval_tidy(mtcars)
mtcars[index_local, ]
解决方案
推荐阅读
- python - 单独列出目录中的文件python
- react-native - 如何使用 Zendesk Upload API 上传图片
- python - 使用 Python Selenium 查找元素
- xml - 标签后如何获取和转换属性
输出日期:
<products> <group> <product id="73" symbol="LEC-PY1010C" ean="5901436709251" price_pln="29.05" price_eur="6.56" tax="23.0000" stock="1215"> <
- javascript - 如何在 v-for 循环中更改数组对象中的状态?
- python - 在不同的行上循环打印
- javascript - 需要访问订阅功能里面的元素淘汰js
- python - 如何通过从另一行获取来填充数据框中的 Na 值
- html - 为什么它进入一个新的生产线而不是继续统一?
- android - 如何制作一个实心圆形进度条?(不使用外部库)