hadoop - 用户 dr.who 的 Amazon EMR 垃圾邮件应用程序?
问题描述
我正在使用 python (pyspark) 处理 spark 进程。我创建了一个亚马逊 EMR 集群来运行我的 spark 脚本,但是当刚刚创建集群时,很多进程会自行启动(¿?),当我检查集群 UI 时:
因此,当我尝试编写自己的脚本时,它们会进入一个无休止的队列,有时是 ACCEPTED 但从未进入 RUNNING 状态。
即使在亚马逊论坛中我也找不到有关此问题的任何信息,所以我很乐意提供任何建议。
提前致谢。
解决方案
您需要检查主节点的安全组,检查入站流量,也许您有任何地方的规则,请删除该规则或尝试删除并检查是否正常工作这是一个漏洞。
推荐阅读
- prisma - Prisma 模式 - 从多个可能的外键(或关系)创建关系字段
- python-3.x - 如何使用 cv2.VideoWriter 输出 x265 压缩视频
- r - R - 根据不断变化的列条件,通过对变量进行分组来增加变量
- osgi - 为什么 bnd 工作区模型中的存储库不支持传递依赖?
- c++ - 如果输入在c ++中无效,则重新提示
- java - JTable 将整数排序为字符串
- java - 处理 - 构造函数 ArrayList
(类)不存在 - r - XBRL R 包读取添加另一个链接到输入链接。导致无法打开的链接
- spring-boot - 使用 Consul 和 Spring Cloud Consul 的多集群 Kubernetes 服务发现
- node.js - Node.js:fs unlink vs. fs-extra remove 删除文件。什么时候选择哪一个,为什么?