hadoop - 如何防止 hadoop 在每个运行的作业上上传相同的 jar 到暂存缓存
问题描述
我只是在 hadoop 中使用相同的 jar 依赖项环境运行不同的作业。在每个作业开始之前,yarn 将作业自己的 jar 文件上传到其暂存目录,女巫具有不同的作业 ID。由于属于每个作业的所有 jar 文件都是相同的,我可以告诉 hadoop 在一个公共目录下找到它们而不是再次上传它们吗?
Jar 文件上传目标目录如下:/tmp/hadoop-yarn/staging/root/.staging/job_1540620373764_0001/libjars/hadoop-common-2.8.4.jar
解决方案
推荐阅读
- angular8 - Liferay - 如何在“serveResource”方法中检索 POST 请求的正文内容
- python - 如何将 UTF-8 中的网络抓取图像链接编码为 ASCII 但仍有功能链接?
- azure - 无法使用静态公共 IP 创建 AKS 负载平衡
- c# - 使用存储在 s3 中的凭据初始化 firebase
- batch-file - 有没有办法让 CMD 运行 24 小时?
- javascript - 使用 jquery 和 cookie 增加/减少字体大小
- python - ValueError:logits 和标签必须具有相同的形状 ((1, 21) vs (21, 1))
- java - 为什么JVM不直接对局部变量数组进行赋值操作?
- java - Spark 3.0.1 是否支持窗口函数上的自定义聚合器?
- c++ - 通过/非默认在类构造函数中传递 std::filesystem::path