apache-spark - Spark operator vs spark submit - 如何选择使用哪一个?
问题描述
在 Kubernetes 上运行 Spark 应用程序有两种方法。
- 使用带有
k8s://
主 URL 的 spark-submit。 - 使用spark-on-k8s-operator。借助 spark 运算符中 CRD 的优势,我们可以使用配置文件 (YAML) 对 spark pod 进行声明式管理。
在 Kubernetes 上运行 1000 多个 spark 工作负载的生产环境中,我该如何选择它们?
使用 spark 运算符有什么优缺点?
解决方案
推荐阅读
- java - JPA 不使用 @Transactional 注释保存选择的结果
- emacs - org-mode 根据子任务 todo 状态更改父 todo 状态
- javascript - Javascript中特定日期的时区名称偏移量
- ios - 如何将泛型(关联类型要求)协议作为委托给任何控制器?
- mongodb - $gt、$lt、$gte、$lte 的索引字段方向是什么?
- c# - UWP - c# 使用ListView通过拖放将json对象(节点)移动到另一个对象?
- javascript - 向下滚动时加载更多数据
- sql - Postgres - 有没有更好的方法来防止在这种情况下在两次运行时提取间隔?
- c++ - set_new_handler 是否将 new_handler 存储在线程本地存储中?
- ruby-on-rails - 使用 route_translator gem 翻译我的路线而不影响原件