r - R 中的并行计算,无需重复输入数据帧
问题描述
我在 R 中对 randomForest 方法使用并行计算。不幸的是,RAM 是我的瓶颈。似乎 R 正在复制输入数据帧 my_data。我可以停止复制并使 my_data 成为共享对象吗?
cl <- makeCluster(11)
registerDoParallel(cl)
rf_res <- foreach(ntree = rep(90, 11), .combine=randomForest::combine, .multicombine=TRUE, .packages = "randomForest") %dopar%
randomForest(F_BIN~., data=my_data, ntree=ntree, keep.forest=FALSE, importance=TRUE)
rf_im <- importance(rf_res)
stopCluster(cl)
解决方案
推荐阅读
- .net - 执行 createdtabase() 方法时未创建函数 Linq Vb.net
- ios - 如何在 iOS 上使用调度队列问题?
- reactjs - 未定义变量时如何等待
- scala - scala如何使用继承和模板类的模式匹配
- sql - Hive 仅选择前两位小数
- java - Android 动画中断问题
- gulp - 如何通知 browserify 转换模块中的额外依赖项?
- node.js - ExpressJS 接收到无效的 JSON 格式
- apache-kafka - Cuba Platform - Spring Kafka Integration
- bash - Dart PATH 即使在 .bash_profile 中更改后也不会更改