首页 > 解决方案 > 用户 dr.who 的 Amazon EMR 垃圾邮件应用程序?

问题描述

我正在使用 python (pyspark) 处理 spark 进程。我创建了一个亚马逊 EMR 集群来运行我的 spark 脚本,但是当刚刚创建集群时,很多进程会自行启动(¿?),当我检查集群 UI 时:

集群 UI 截图

因此,当我尝试编写自己的脚本时,它们会进入一个无休止的队列,有时是 ACCEPTED 但从未进入 RUNNING 状态。

即使在亚马逊论坛中我也找不到有关此问题的任何信息,所以我很乐意提供任何建议。

提前致谢。

标签: hadoophadoop-yarnamazon-emr

解决方案


您需要检查主节点的安全组,检查入站流量,也许您有任何地方的规则,请删除该规则或尝试删除并检查是否正常工作这是一个漏洞。


推荐阅读