amazon-web-services - AWS Spark 作业监控工具
问题描述
我有一个带有 12 个节点、每个 8 个核心和主节点的 AWS 集群。正如我在浏览器中看到的,在 HUE->jobs 中运行了 4 个 spark 作业,3 个 Zeppelin 笔记本,一个是我从命令行运行的 python 脚本(pyspark)。脚本抱怨此消息:“WARN YarnScheduler:初始作业未接受任何资源;检查您的集群 UI 以确保工作人员已注册并有足够的资源”最后一小时。所以我的问题是:有没有办法查看哪些正在运行的作业消耗了哪些资源(内核、RAM)?我可以为此目的使用哪些工具?我在主节点上运行 linux“htop”命令,这当然显示了许多可用的内核和许多未使用的 RAM,但我需要一个工具来查看节点上的负载。我从 Zeppelin notebook 中找到了一个指向 SparkUI 的链接,它只显示了 Zeppelin 相关的工作,但不是全部(命令行作业不存在,Jupyter notebook 也不存在,等等)。HUE 显示所有正在运行的作业的列表,但无法查看每个作业创建的资源负载。有没有显示这些信息的工具?
解决方案
推荐阅读
- javascript - 使用 AJAX 的 jQuery AutoComplete - 我错过了什么?
- javascript - 如何使用 useReducer 实现反应控制输入?
- javascript - 无法使用 OpenCV.js 创建 Mat
- android - 发布请求改造 java.lang.IllegalStateException:预期 BEGIN_OBJECT 但在第 2 行第 1 列路径 $
- android - 从 Facebook 下载的文件在我的小米红米 Note 8T 上保存为“downloadfile-x.bin”?
- python - 如何在转换中使用超时来退出状态并停止进一步执行 on_enter_state 函数
- ios - 在 Xcode (Swift) 上编译错误 GSTreamer
- java - 保存和取消保存功能
- react-native - React Native 错误:命令失败:gradlew.bat app:installDebug -PreactNativeDevServerPort=8081
- c# - 如何将 Microsoft.Extensions.DependencyInjection.IServiceScope 注入 .NET Core 中的类