首页 > 解决方案 > 如何在 Java 的数据流作业中指定将在每个数据流 VM 工作者上执行的启动脚本

问题描述

我需要修改 ~/.ssh/authorized_keys 以添加用于登录的自定义公钥。我发现这篇文章是针对 python 工作的。 https://beam.apache.org/documentation/sdks/python-pipeline-dependencies/

我们如何为 Java 数据流工作做同样的事情。

标签: google-cloud-platformgoogle-cloud-dataflowapache-beam

解决方案


您可以创建一个自定义容器,可能带有自定义入口点。

请参阅: https ://cloud.google.com/dataflow/docs/guides/using-custom-containers

还有https://github.com/apache/beam/blob/master/sdks/java/core/src/main/java/org/apache/beam/sdk/harness/JvmInitializer.java,这可能在这里有帮助,但它是为不同的目的而编写的。


推荐阅读