首页 > 解决方案 > yarn.resourcemanager.am.max-attempts 的真正含义是什么?

问题描述

我在 yarn-site.xml 中有一个配置条目,如下所示:

<property>
  <name>yarn.resourcemanager.am.max-attempts</name>
  <value>4</value>
</property>

考虑到以下两种情况,我会问它的真正含义:

  1. 说,我有一个 ApplicationMaster,它有一个错误。当我向 YARN 提交应用程序时,它会尝试启动 Application Master 5 次然后应用程序失败(我假设该错误导致 AM 无法启动)

  2. 说,我启动了一个yarn应用,手动kill掉ApplicationMaster进程,会不会自动重启applicationMaster?如果是这样,我再做kill the application - application restarted4次,AM不会再重新启动吗?

标签: hadoophadoop-yarn

解决方案


假设 AM 有故障并且死了。或者它有内存泄漏,导致它超过它的容器大小并被杀死。如果它死了 4 次,那么应用程序的状态是FAILED.

因此,要回答您的问题,假设您的意思是 4 而不是 5,那么 1 是正确的,并且 2 是正确的。如果您想进一步了解这一点,请查看TestAMRestart.java


推荐阅读