apache-spark - 如何使用纱线配置 24/7 运行 Spark 流
问题描述
我有火花流应用程序,目前我们用 oozie 运行它。我有一个问题,如果驱动程序崩溃,oozie 无法处理这种情况,并且我的应用程序在手动事件之前不会运行。
我在 oozie 中阅读了有关重新运行选项的信息,并且想知道如何管理不需要调度的 spark 流应用程序 - 始终执行并且能够在失败时自动重新运行(内存\节点崩溃等)。
解决方案
推荐阅读
- node.js - 如何在将数据传递到前端时在 expressjs 中重定向?
- python - RecursionError:使用 tkinter 按钮调用 Python 对象时超出最大递归深度
- node.js - 填充参考对象,它也是参考对象猫鼬
- architecture - 基于无状态编排的 Saga 模式
- python - 如何测试嵌入器的人脸识别
- html - 如何使用媒体查询调整图像大小?
- python - 你如何找到这个函数的大 O 时间复杂度?
- python - Seaborn 散点图设置空心标记而不是填充标记
- php - 在 PHP 中制作请求表单 SOAP Web 服务
- css - 将所有项目居中对齐