apache-spark - 初始作业未接受 AWS EMR 中的任何资源
问题描述
我在 AWS 中有一个 EMR 集群。
我正在构建一个 RStudio 服务器来使用该集群。
我能够spark.sql("show tables").show
从运行 RStudio 的服务器获取 spark-shell 并执行并查看 HDFS 中的表。
但是,如果我执行 spark.sql("select * from ny_taxi_hdfs limit 10").show
它会失败并出现错误。初始作业未接受任何资源。
如果我从主人那里做同样的事情,它工作正常。
它看起来确实在使用纱线“(master = yarn,app id = application_1568817071939_0034)”
甚至不知道在哪里看。
解决方案
防火墙/安全组。一旦我打开它,一切正常。我讨厌当我问一个问题并在一天后回答它时。
推荐阅读
- php - 如何让 jQuery 在返回之前等待 Ajax 调用完成
- c++ - 是 reinterpret_cast
(myTypePtr) 假设指向一个数组? - c++ - 如何将零填充的多维数组传递给 C++ 中的函数?
- javascript - React Router DOM 仅在需要时加载组件
- python - 用于合并特定行的 Pandas Dataframe 操作
- c# - 如何从 Business Central 获取数据?
- c# - Excel/VSTO:错误 0x80028018 仅在直接绑定到 interop.-provided 属性时
- python - 获取与语句匹配的数组中的任何元素
- python - 如何打印表格
- javascript - 如何将 Chrome 开发人员工具的响应打印到我的 UI 上?