r - 在 azure-ml 中调试 R 脚本:在哪里可以找到 stdout 和 stderr 日志?(或者为什么它们是空的?)
问题描述
我正在使用 Microsoft Azure 机器学习中的“工作室(预览版)”来创建一个管道,该管道将机器学习应用于连接到我们数据仓库的 blob 存储中的数据集。
在“设计器”中,可以将“执行 R 脚本”动作添加到管道中。我正在使用这个功能来执行我自己的一些机器学习算法。
我有这个脚本的“hello world”版本(包括使用“脚本包”在我自己的 R 文件中加载函数)。它应用了一个非常简单的操作(计算日期与日期列中的日期和“今天”的天数差异),并将输出存储为一个新文件。鉴于导出的文件具有正确的信息,我知道 R 脚本运行良好。
脚本如下所示:
# R version: 3.5.1
# The script MUST contain a function named azureml_main
# which is the entry point for this module.
# The entry point function can contain up to two input arguments:
# Param<medals>: a R DataFrame
# Param<matches>: a R DataFrame
azureml_main <- function(dataframe1, dataframe2){
message("STARTING R script run.")
# If a zip file is connected to the third input port, it is
# unzipped under "./Script Bundle". This directory is added
# to sys.path.
message('Adding functions as source...')
if (FALSE) {
# This works...
source("./Script Bundle/first_function_for_script_bundle.R")
} else {
# And this works as well!
message('Sourcing all available functions...')
functions_folder = './Script Bundle'
list.files(path = functions_folder)
list_of_R_functions <- list.files(path = functions_folder, pattern = "^.*[Rr]$", include.dirs = FALSE, full.names = TRUE)
for (fun in list_of_R_functions) {
message(sprintf('Sourcing <%s>...', fun))
source(fun)
}
}
message('Executing R pipeline...')
dataframe1 = calculate_days_difference(dataframe = dataframe1)
# Return datasets as a Named List
return(list(dataset1=dataframe1, dataset2=dataframe2))
}
尽管我确实在 R 脚本中打印了一些消息,但我找不到应该包含这些打印消息的“stdoutlogs”或“stderrlogs”。
我需要打印的消息 1) 有关分析的信息以及 - 最重要的是 - 2) 在代码失败的情况下进行调试。
现在,我(在多个位置)找到了文件“stdoutlogs.txt”和“stderrlogs.txt”。当我在“Designer”中单击“Exectue R Script”时,可以在“Logs”下找到这些。当我点击完成的“运行”,然后在“输出”选项卡和“日志”选项卡下,我还可以在“实验”下找到“stdoutlogs.txt”和“stderrlogs.txt”文件。但是...所有这些文件都是空的。
谁能告诉我如何从我的 R 脚本打印消息并帮助我找到可以找到打印信息的位置?
解决方案
推荐阅读
- jquery - 我需要将 html 表单中的对象作为 json 字符串发送,但我有一个字符串
- flutter - 如何使用 GestureDetector 的单个实例检测多个手势?
- sparql - 如何在 SPARQL python (sparql-client) 中加入两个查询
- django - 如何将表单的请求值存储到另一个表单 django
- c# - 并行执行多对并发任务
- apache - 如何忽略 URL 末尾的 URL
- python - 我的开发服务器运行后报这个错误
- node.js - socketio 客户端没有收到 NodeJS 发出的消息
- python - Python,Django:从文件中获取完整路径
- linux - 保存设置失败。请重启 IntelliJ IDEA 2020.1 linux pc