首页 > 解决方案 > R 中的并行计算,无需重复输入数据帧

问题描述

我在 R 中对 randomForest 方法使用并行计算。不幸的是,RAM 是我的瓶颈。似乎 R 正在复制输入数据帧 my_data。我可以停止复制并使 my_data 成为共享对象吗?

cl <- makeCluster(11)
registerDoParallel(cl)

rf_res <- foreach(ntree = rep(90, 11), .combine=randomForest::combine, .multicombine=TRUE, .packages = "randomForest") %dopar% 
    randomForest(F_BIN~., data=my_data, ntree=ntree, keep.forest=FALSE, importance=TRUE)

rf_im <- importance(rf_res)

stopCluster(cl)

标签: rparallel-processing

解决方案


推荐阅读