首页 > 解决方案 > AWS EMR Presto 集群突然终止错误:作业流中的所有从属服务器都因 Spot 而终止

问题描述

我在使用 AWS EMR PrestoDB 时遇到问题。我启动了一个集群,主节点作为协调器,核心节点作为工作节点。核心节点是现场实例。但是,主节点是按需的。集群启动 5 周后,我收到此错误消息

Terminated with errorsAll slaves in the job flow were terminated due to Spot

是不是所有的slave都被终止了,集群本身也会终止?我看到了现货定价历史,它没有达到我设定的最高价格。

我已经做了什么?我检查了转储到 s3 的日志。我没有找到任何关于终止原因的信息。它只是说

Failed to visit ... <many directories>

标签: amazon-emrpresto

解决方案


我正在回答我自己的问题。根据 presto 社区,AWS EMR Presto 集群中必须至少有一个主节点启动并运行。但是由于它被终止了,整个集群也被终止了。


推荐阅读