首页 > 解决方案 > OOZIE 卡在 RUNING 状态

问题描述

我使用 OOZIE 来运行工作流。但是一个简单的官方示例shell-wf(echo hello oozie)卡在 RUNNING 状态并且永远不会结束。可以提交工作流,但卡在 RUNNING 状态。OOZIE UI 中的作业日志没有任何错误。

提交带有spark-submitinside 的 shell 时,该作业将永远不会提交,并且在 Spark UI 中看不到。我怀疑外壳根本没有运行。

可能的问题是什么?

标签: oozieoozie-workflow

解决方案


快速清单

对于那些有同样问题的人,有一个清单可以检查您的系统。希望能帮助到你!

  1. 检查jobTracker您的 Oozie 配置。注意:如果一个作业已经成功运行,它可能不是jobTracker. 相关讨论可以在这里找到
  2. 检查您的磁盘使用情况。如果## Heading ##disk 使用率大于 90%,请删除一些文件以确保磁盘使用率小于 90%。(这就是我的情况!)
  3. 检查Console URL卡住的动作。它可以在Job - Job Info tab - Actions - Action - Action Info tab. 这里的工作状态可以帮助您找到问题。
  4. 检查 Oozie 日志。它通常在/usr/local/oozie/logs. 检查oozie.log*是否有异常。

细节

磁盘使用情况

如果你的动作状态是

YarnApplicationState: ACCEPTED: 等待 AM 容器被分配、启动并注册到 RM。

那可能是磁盘问题。相关讨论参见MapReduce 作业挂起,等待 AM 容器分配。解决方法可以参考为什么 Hadoop 会报告“Unhealthy Node local-dirs and log-dirs are bad”?.


推荐阅读