r - 共享驱动器上带有 drake 的文件路径
问题描述
我遇到了一些我无法弄清楚的奇怪的德雷克行为。我正在尝试在.rmd
我的德雷克计划中添加一个。我正在使用远程机器和该机器上的网络驱动器。如果我尝试将 .rmd 文件添加到我的计划中,如下所示:
> library(drake)
> library(rmarkdown)
>
> list.files()
[1] "drake_testing.Rproj" "foo.png" "report.Rmd"
>
> plan <- drake_plan(
+ png("foo.png"),
+ plot(iris$Sepal.Length ~ iris$Sepal.Width),
+ dev.off(),
+ report = render(
+ input = knitr_in("report.Rmd"),
+ output_file = "report.html",
+ quiet = TRUE
+ )
+
+ )
>
> plan
# A tibble: 4 x 2
target command
<chr> <expr>
1 drake_target_1 png("foo.png")
2 drake_target_2 plot(iris$Sepal.Length ~ iris$Sepal.Width)
3 drake_target_3 dev.off()
4 report render(input = knitr_in("report.Rmd"), output_file = "report.html", quiet = TRUE)
>
> ## Turn your plan into a set of instructions
> config <- drake_config(plan)
Error: The specified file is not readable: report.Rmd
>
> traceback()
13: stop(txt, obj, call. = FALSE)
12: .errorhandler("The specified file is not readable: ", object,
mode = errormode)
11: digest::digest(object = file, algo = config$hash_algorithm, file = TRUE,
serialize = FALSE)
10: rehash_file(file, config)
9: rehash_storage(target = target, file = file, config = config)
8: FUN(X[[i]], ...)
7: lapply(X = X, FUN = FUN, ...)
6: weak_mclapply(X = keys, FUN = FUN, mc.cores = jobs, ...)
5: lightly_parallelize_atomic(X = X, FUN = FUN, jobs = jobs, ...)
4: lightly_parallelize(X = knitr_files, FUN = storage_hash, jobs = config$jobs,
config = config)
3: cdl_get_knitr_hash(config)
2: create_drake_layout(plan = plan, envir = envir, verbose = verbose,
jobs = jobs_preprocess, console_log_file = console_log_file,
trigger = trigger, cache = cache)
1: drake_config(plan)
我尝试了以下排列来完成这项工作:
- 将 移动
.rmd
到本地驱动器并使用完整路径调用它 - 添加
file.path
内部和外部knitr_in
以完成完整路径。 - 尝试使用
file_in
上述每个场景。
我也尝试过调试,但是当德雷克将文件名转换为哈希然后将其转换回文件的基本名称时,我有点迷失了(即report.Rmd
)。错误最终在digest::digest
被调用时发生。
有没有人有尝试弄清楚这样的事情的经验?
解决方案
digest("report.Rmd", file = TRUE)
我认为答案取决于您在外部调用时是否遇到相同的错误drake_config(plan)
。如果它出错(我打赌它确实出错了),你的文件系统可能会与 R 发生冲突。如果是这种情况,那么不幸的是drake
无能为力。
我还建议对您的计划进行一些更改:
plan <- drake_plan(
plot_step = {
png(file_out("foo.png")),
plot(iris$Sepal.Length ~ iris$Sepal.Width),
dev.off()
},
report = render(
input = knitr_in("report.Rmd"),
output_file = "report.html",
quiet = TRUE
)
)
或者更好的是,将您的工作划分为可重用的函数:
plot_foo = function(filename) {
png(filename),
plot(iris$Sepal.Length ~ iris$Sepal.Width),
dev.off()
}
plan <- drake_plan(
foo = plot_foo(file_out("foo.png")),
report = render(
input = knitr_in("report.Rmd"),
output_file = "report.html",
quiet = TRUE
)
)
目标是具有有意义的返回值和/或输出文件的可跳过工作流步骤。png()
并且dev.off()
是绘图步骤的一部分,并file_out()
告诉drake
注意foo.png
变化。此外,命名目标也是一个好习惯。通常,目标的返回值是有意义的,就像 R 中的变量一样。
推荐阅读
- webrtc - ICE 候选人仅从一个网络接口收集
- php - 使用 PHP、SQL SERVER 和 AJAX 的动态相关选择框
- arrays - 为什么加号和一元加号在数组语法中表现奇怪?
- scala - 从 CSV Gatling 馈送器获取值以创建 POST 请求正文
- python - 为什么(或为什么不)将 Anaconda 添加到路径?
- json - 如何将 ion-card 动态链接到外部 url
- javascript - 在angularjs中保留滚动位置
- java - 带有注入构造函数参数的@Autowire Spring Bean?
- python - 毫无例外地理解切片索引
- c# - 如何修复此空闲汽车游戏脚本