oozie - OOZIE 卡在 RUNING 状态
问题描述
我使用 OOZIE 来运行工作流。但是一个简单的官方示例shell-wf
(echo hello oozie
)卡在 RUNNING 状态并且永远不会结束。可以提交工作流,但卡在 RUNNING 状态。OOZIE UI 中的作业日志没有任何错误。
提交带有spark-submit
inside 的 shell 时,该作业将永远不会提交,并且在 Spark UI 中看不到。我怀疑外壳根本没有运行。
可能的问题是什么?
解决方案
快速清单
对于那些有同样问题的人,有一个清单可以检查您的系统。希望能帮助到你!
- 检查
jobTracker
您的 Oozie 配置。注意:如果一个作业已经成功运行,它可能不是jobTracker
. 相关讨论可以在这里找到 - 检查您的磁盘使用情况。如果## Heading ##disk 使用率大于 90%,请删除一些文件以确保磁盘使用率小于 90%。(这就是我的情况!)
- 检查
Console URL
卡住的动作。它可以在Job - Job Info tab - Actions - Action - Action Info tab
. 这里的工作状态可以帮助您找到问题。 - 检查 Oozie 日志。它通常在
/usr/local/oozie/logs
. 检查oozie.log*
是否有异常。
细节
磁盘使用情况
如果你的动作状态是
YarnApplicationState: ACCEPTED: 等待 AM 容器被分配、启动并注册到 RM。
那可能是磁盘问题。相关讨论参见MapReduce 作业挂起,等待 AM 容器分配。解决方法可以参考为什么 Hadoop 会报告“Unhealthy Node local-dirs and log-dirs are bad”?.
推荐阅读
- python-3.x - Python Selenium 在同一个测试用例中多次使用 ActionChains 执行 double_click()
- youtube - 通过 YouTube Analytics API v2 创建直接 HTTP 请求,以查看嵌入在外部网站上的频道视频
- python-3.x - 了解python的多重继承
- react-native - react-native facebook 帐户工具包
- git - git update 分支到当前状态(起源中的奇怪命名分支)
- ios - 我可以使用 Accounts 框架进行自定义登录吗?
- reactjs - 'react-scripts start' 命令到底是什么?
- sql - 具有帐户 NT Service\MSSQLSERVER 的 SQL Server 无法访问 nas
- scala - `Scala` 2.12 的`ScriptEngine` 是线程安全的吗?
- r - 从 Google Trends Interest by City 中获取州名