hadoop - Cloudera NODE_MANAGER_UNEXPECTED_EXITS 每小时
问题描述
我有一个在 Azure 中运行的 cloudera 5.x 集群。一切运行良好,然后几天前我开始每小时通过电子邮件收到“NODE_MANAGER_UNEXPECTED_EXITS”健康通知。
这似乎发生在每小时的 43 分钟。
我遇到的大多数表单都提示了 outOfMemory 错误——尽管我在日志文件中没有看到任何这些错误。为了更好地衡量,我尝试增加 NodeManager 的 java 头空间内存分配,但这并没有解决问题。
我已经停止了集群上的所有作业——它基本上处于空闲状态,但我每小时都会收到这些警报。
电子邮件中的健康警报示例:
NODE_MANAGER_UNEXPECTED_EXITS Role health test bad Critical The health test result for NODE_MANAGER_UNEXPECTED_EXITS has become bad: This role encountered 1 unexpected exit(s) in the previous 5 minute(s). Critical threshold: any.
任何帮助是极大的赞赏
解决方案
推荐阅读
- c++ - std::set 与字符串键和潜在的效率损失
- python - 每 22 个字符向字符串添加一个输入,等到一个空格
- python - Discord.py - 使用命令更改前缀
- r - 如何在每行第一次出现匹配时停止匹配?
- tfs - 一旦设置了值,如何使 TFS 中的字段只读?
- c# - 当前线程调度程序创建在新 STA 线程上失败
- sql-server - 如何将 mod_authn_dbd 与 SQL Server (ODBC) 一起使用
- parsing - Flutter:通过 BottomNavigationBar 中的页面解析数据。错误:在初始化程序中只能访问静态成员
- node.js - 如何在 Botium 中将 INTENT_CONFIDENCE 断言器作为全局变量
- reactjs - 在 ReactJS 中将 Redux 存储状态传递给子组件的正确方法