首页 > 解决方案 > R 仅在本地范围内加载库

问题描述

是否有可能library()只影响本地范围?

例如,我的脚本有一个lapply循环,其他脚本中的 source() 代码;这些脚本加载自己的库,但我希望在执行这些脚本中的代码后清理命名空间,以便脚本 1 调用的包 A 中的函数不会屏蔽脚本 2 调用的包 B 中的函数。

我知道有像modulesandimport包这样的完整解决方案,但我希望首先有一个更简单的基本 R 解决方案,以便仅在需要时进行扩展。

标签: rscopepackager-future

解决方案


使用loadNamespace("pkg")将加载“pkg”包的命名空间。使用library("pkg")还会“pkg”包附加到 R 的搜索路径。您可以查看使用 加载哪些命名空间loadedNamespaces()以及使用 附加哪些包search()。这些属性对于 R 来说是全局的。换句话说,实际上不可能使它们成为局部的。

如果您希望library()在函数/map-reduce 调用中使用而不library()导致将包附加到当前 R 会话中,那么,正如其他人建议的那样,您可以在外部 R 进程中评估您的调用。

(免责声明:我是作者)我建议为此使用期货(未来),您可以通过future.callr在外部评估它们- callr的未来包装器。 未来的框架将负责将所需的对象导出到外部 R 进程。 这是一个例子:

library(future)
plan(future.callr::callr, workers = 1)
y <- lapply((1:3)/4, FUN = function(x) value(future({
  library(gtools)
  logit(x)
})))

请注意如何创建未来并立即检索其值,即value(future(...)). 为了澄清这一事实,您可以使用:

eval_via_future <- function(expr, substitute = TRUE, envir = parent.frame()) {
  if (substitute) expr <- substitute(expr)
  f <- future::future(expr, substitute = FALSE, envir = envir)
  future::value(f)
}
library(future)
plan(future.callr::callr, workers = 1)
y <- lapply((1:3)/4, FUN = function(x) eval_via_future({
  library(gtools)
  logit(x)
})))

如果您想避免让用户指定plan(),您可以:

eval_via_callr <- function(expr, substitute = TRUE, envir = parent.frame()) {
  oplan <- future::plan()
  on.exit(future::plan(oplan))
  future::plan(future.callr::callr, workers = 1)
  if (substitute) expr <- substitute(expr)
  f <- future::future(expr, substitute = FALSE, envir = envir)
  future::value(f)
}

所以你可以这样做:

y <- lapply((1:3)/4, FUN = function(x) eval_via_callr({
  library(gtools)
  logit(x)
}))

无需加载或附加gtools(它显然会加载futurecallr所需的其他包);

> loadedNamespaces()
 [1] "codetools"    "grDevices"    "listenv"      "future"       "ps"          
 [6] "memuse"       "clisymbols"   "prompt"       "digest"       "crayon"      
[11] "rappdirs"     "R6"           "future.callr" "datasets"     "utils"       
[16] "callr"        "graphics"     "base"         "tools"        "parallel"    
[21] "compiler"     "processx"     "stats"        "globals"      "methods"     

> search()
 [1] ".GlobalEnv"        "package:stats"     "package:graphics" 
 [4] "package:grDevices" "package:utils"     "package:datasets" 
 [7] "CBC tools"         "toolbox:default"   "package:methods"  
[10] "Autoloads"         "package:base" 

更新 2020-07-26

以下是如何通过未来在外部 R 进程中获取 R 脚本,同时从主 R 会话中提取全局变量:

future_source <- function(file, envir = parent.frame(), ...) {
  expr <- parse(file = file, keep.source = FALSE)
  expr <- bquote({..(expr)}, splice = TRUE)
  future::future(expr, substitute = FALSE, envir = envir, ...)
}

source_via_callr <- function(file, envir = parent.frame()) {
  oplan <- future::plan()
  on.exit(future::plan(oplan))
  future::plan(future.callr::callr, workers = 1)
  f <- future_source(file, envir = envir)
  future::value(f)
}
## Two R scripts
cat("log(a)\n", file="a.R")
cat("library(gtools)\nlogit(a)\n", file="b.R")

## A global
a <- 0.42

## Source scripts in external process
y <- lapply(c("a.R", "b.R"), FUN = source_via_callr)

推荐阅读