hadoop - 确定已完成作业使用的 Hadoop 集群资源
问题描述
如何确定已完成作业使用的 Hadoop 集群资源?
我们的集群资源管理器是yarn
. 可以通过 HTTP 访问某些 yarn API 端点;例如:
curl -L http://my.hadoop.instance:8088/ws/v1/cluster/apps/application_1547448533998_502644
会返回:
{
"app": {
"allocatedMB": -1,
"allocatedVCores": -1,
"amContainerLogs": "http://someNode.hadoop.instance:8042/node/containerlogs/container_e149_1547448533998_502644_01_000001/someUser",
"amHostHttpAddress": "someNode.hadoop.instance:8042",
"amNodeLabelExpression": "",
"applicationTags": "",
"applicationType": "SPARK",
"clusterId": 1547448533998,
"clusterUsagePercentage": 0.0,
"diagnostics": "",
"elapsedTime": 583889,
"finalStatus": "SUCCEEDED",
"finishedTime": 1550621490747,
"id": "application_1547448533998_502644",
"logAggregationStatus": "TIME_OUT",
"memorySeconds": 15821179,
"name": "ProjectCantor",
"numAMContainerPreempted": 0,
"numNonAMContainerPreempted": 0,
"preemptedResourceMB": 0,
"preemptedResourceVCores": 0,
"priority": 0,
"progress": 100.0,
"queue": "dsg",
"queueUsagePercentage": 0.0,
"runningContainers": -1,
"startedTime": 1550620906858,
"state": "FINISHED",
"trackingUI": "History",
"trackingUrl": "http://my.hadoop.instance:8088/proxy/application_1547448533998_502644/",
"unmanagedApplication": false,
"user": "someUser",
"vcoreSeconds": 14713
}
}
但是,有几个属性,例如allocatedMB
并allocatedVCores
设置为-1
而不是任何有意义的值。
提前致谢。
解决方案
推荐阅读
- python - Python - 使用 Pandas 在 Data Frame 中从 itunes 设置 JSON 数据
- apache-spark - spark 构建 1-1、1-M 关系?
- css - 使用 flexbox(行和列)构建网格系统的数学原理是什么?
- fox-toolkit - Fox-Toolkit 配置颜色
- python - 如何在不收到错误消息的情况下导入 tensorflow?
- powerbi - Power BI - 从同一行中减去值
- python - 'tee' 不是内部或外部命令、可运行程序或批处理文件
- java - Java 将图像附加到 JTextArea
- angular - Angular 9 单元测试业力
- python - 如何使用 matplotlib 让图例显示在图表中