hadoop - 为 Hadoop Distcp 作业设置 YARN 应用程序名称
问题描述
注意:我不YARN
想像在 Hadoop 中那样指定 -queue 名称:为 distcp 指定纱线队列
我经常hadoop distcp
用于移动数据,HDFS
并希望为这些作业提供一个描述性的应用程序名称。
目前所有的复制作业都只是"distcp"
在Resource Manager
UI 上显示名称,无法区分不同的作业。
有没有办法改进它?
解决方案
像许多其他MR 工具一样,hadoop distcp
还允许mapred
您使用
-Dmapred.property.name=property-value
所以当我使用
hadoop distcp \
-Dmapred.job.name=billing_db.replicate \
-m 10 \
/user/hive/warehouse/billing_db.db/ \
s3a://my-s3-bucket/billing_db.db/
Resource Manager
它在UI上看起来很好
参考
推荐阅读
- python - 想了解 sklearn 分类器的评分方法
- c++ - 编写一个检测泛型成员的函数
- firebase - Flutter:如何使用 Firestore 快照流制作动画列表
- apache-nifi - 通过控制台创建和延迟 Nifi 进程
- mongoose - Mongoose 在模式中引用 ES6 类 getter
- kotlin - 使用 Kotlin 委托,在创建委托对象时引用父“this”对象
- data-structures - 遍历 HashMaps 是如何在内存中工作的:Rust
- vim - VIM)“你完成我”弹出菜单上的覆盖箭头键仅适用于“向下”
- lambda - 使用带有没有主体的 lambda 的 maplist?
- javascript - 我可以使用 GET 请求从私有 GitHub 存储库获取代码吗?