amazon-emr - 当我使用 zeppelin 时,Amazon EMR 集群可能停止响应
问题描述
我将 EMR 6.2.0 与 Spark 和 Zeppelin 与 1 个 m4.large 主实例和 2 个 m4.large 核心实例一起使用,我可以毫无问题地提交 spark 作业,但是每次我尝试使用 Zeppelin 时,我的集群都会在一段时间后停止响应时间,即使集群状态仍然是“正在运行”。
起初,我认为那是因为我正在访问 master 并为其安装了一些 PySpark 依赖项,但在我最后的测试中,我尝试使用 scala 读取 delta 表,而没有直接在 master 上安装任何东西,只需在解释器中添加 delta 依赖项配置。
这是我用来读取表格的代码:spark.readStream.format("delta").load(table_path)
当我看到 AWS EMR 控制台时,监控指标停止刷新,我无法访问任何服务,SSH 连接也不起作用,唯一的解决方案是终止集群并创建一个新的。
我不知道要搜索或调查什么,或者我的问题可能是什么。有人可以告诉我从哪里开始吗?
谢谢!
解决方案
推荐阅读
- grails - 如何从 Grails 中的 GSP 页面生成 PDF?
- ubuntu - 在不同的工作区打开多个窗口时 Firefox 滞后
- reactjs - 如何使用反应路由器为路由创建单独的组件?
- mysql - 聚合多个字段的数据(不是记录)
- mysql - 将数据从一个表插入另一个表时可以将 id 更改为 custom_id 吗?
- javascript - 为什么 html 集合的长度为零?
- session - Magento 2目录''不在存储根路径下
- python - Stellargraph 和 Node2Vec 嵌入
- c++ - 转发声明和包含头文件之间的区别
- python - 如何检查字符串Python中的数学表达式