apache-spark - 带有列表作为单个键值的 oozie 属性文件
问题描述
我有一个 spark 应用程序,我使用命令运行
/usr/hdp/spark2-client/bin/spark-submit \
--name 'App' \
--class 'someFolder.SomeApp \
--master "yarn" \
--deploy-mode "cluster" \
--num-executors 4 \
--executor-cores 3 \
--executor-memory 4g \
--conf spark.sql.shuffle.partitions=10 \
--conf spark.default.parallelism=10 \
--files 'hdfs:///file1','hdfs:///file2' \
'assembly-0.25.0-3-ge05360d.jar' \
'param1' 'param2'
但现在我想在 oozie 中运行它。我的问题是-如何在文件中表示诸如--files
文件列表之类的参数job.properties
?
解决方案
如果你通过 oozie action shell 运行,那么:
<file>hdfs:///file1#file1</file>
<file>hdfs:///file2#file2</file>
推荐阅读
- python - 在 Python 这样的编程语言和 Tensorflow 这样的平台中,“API”是什么意思?
- flutter - Flutter: chopper_generator >=3.0.4 与 moor_generator ^4.1.0 不兼容,如何解决?
- python - 写入同一视频后,视频的 NumPy 数组从原始数组发生变化
- android - 无法更改 Lifetime(time_to_live) firebase 推送通知
- python - slurm 集群上的 TensorFlow 2 仅检测到 1 个 CPU
- sprite-kit - SpriteKit 顶点着色器崩溃
- vb.net - 可以在函数中更改公共变量,还是这是不好的做法?
- firebase - Flutter Firebase 延迟功能
- asp.net - 如何在 ASP.NET Core 5.0 中忽略对 favicon.ico 的请求?
- python - 调用属性装饰器的类比?