apache-spark - 从驱动程序中获取 spark 驱动程序 ID
问题描述
我们正在以集群部署模式(即在 Spark 中运行的驱动程序)向独立集群提交作业,并希望能够跟踪作业的进度并对其进行检测。
为了做到这一点,我们需要知道 Spark 分配给驱动程序进程的驱动程序的 ID,但我没有看到任何从正在运行的应用程序中获取该信息的方法,因为它不会以任何方式通过 Spark 公开上下文(只暴露应用ID,不一样)。
我是否遗漏了什么,或者真的没有办法从执行代码中知道 driverId?
解决方案
我不知道如何获得驱动程序 ID。但是,我们可以考虑做一件事。提交后的每个作业都由 Yarn 资源管理器中的应用程序 ID 标识。因此,只要您浏览与 Application Master/Yarn/Resource manager/Application id 相关的日志,就可以跟踪在 Application Master 中运行的驱动程序(由于集群模式)。
推荐阅读
- react-native - 有没有办法在不添加视图的情况下通过桥进行通信?
- javascript - OpenLayers 添加交互选择和翻译
- android - Android YUV_420_888输出灰色U和V通道(应该是彩色)
- templates - 如何获得由循环创建的类似资源的连接名称和真实名称的最终资源列表?
- java - 如何在 ojdbc7 jar 文件 (JAVA) 中定位数据库路径
- xamarin - Firebase 推送通知在 Xamarin 中不起作用
- excel - 如何在excel中列出包含给定值的表的列索引
- db2 - 测量 DB2 视图的性能
- eclipse-rcp - 评估 RCP e4 应用程序的 @CanExecute
- azure-logic-apps - 嵌套逻辑应用重试 - 父级抛出 504