pyspark - 在 zeppelin 中完成一个进程后,有什么方法可以运行单独的笔记本?
问题描述
假设以下是示例流程
Notebook1
df.count()
df.show()
Notebook2
df2.count()
df2.show()
Notebook1 完成后,我想在 zeppelin 上调用 Notebook2。
解决方案
有两种方法
在notebook1最后一段的末尾,可以调用z.run("", "paragraphid of notebook2");
zeppelin 中有一个休息电话(https://zeppelin.apache.org/docs/0.8.1/usage/rest_api/notebook.html#get-the-status-of-a-single-paragraph ),您可以通过它检查段落的状态,例如运行状态或完成。一旦你得到 notebook1 的最后一段的完成状态,你就可以调用 notebook2 的段落。
推荐阅读
- html - 徽标不响应在某些断点处显示空白
- fonts - 复制粘贴生成器
- javascript - 从js中字符串的结尾提取非负数
- scala - AWS Kinesis 抛出 CloudWatchException
- c# - 在 C# 中给定一个 Int 数转换为特定格式
- apache-kafka - NiFi:ConsumeKafkaRecord_2_0 和 ConsumeKafka_2_0 的性能不佳
- javascript - 在另一个 useState 中设置 useState
- task - 在 VSCode 任务中定义 ProblemMatcher - 架构与文档不一致?
- rust - 如何使用 ndarray 在 Rust 中做点积?
- ssl - KEYCLOAK 测试连接不起作用“错误!发送电子邮件失败”