apache-flink - 为什么用户必须明确设置并行度
问题描述
我启动了一个带有n
TaskManagers 和s
每个 TaskManager 插槽的 flink 应用程序,这样,我的应用程序将有 n*s 个插槽。
这意味着,flink 最多可以同时运行n*s
子任务。但是为什么 flink 不尝试使用大部分资源来运行尽可能多的子任务,并打扰最终用户明确设置并行度呢?
对于不知道并行度设置(默认为1)的flink初学者,即使给了更多资源,它也总是只运行一个子任务!
我想知道这里的设计注意事项,谢谢!
解决方案
一个 Flink 集群也可以被多个用户使用,或者一个用户可以在一个集群上运行多个作业。此类集群的大小不适合运行单个作业,而是运行多个作业。在这样的环境中,如果作业默认获取所有可用资源,这是不可取的。
推荐阅读
- python - 空的形式参数
- java - 如何使用 Spring Boot 更新 MongoDB 集合中的子对象?
- sql - 如果找到值,请选择行和标志列
- git - Git 克隆问题 - 生成不可丢弃的更改
- elasticsearch - 是否可以使用 X-Pack 来限制 Kibana 登录尝试?
- firebase - Quasar Firebase 初始化问题
- python - 使用 concurrent.futures.ThreadPoolExecutor() 时的 PyQt5 小部件 Qthread 问题
- data-binding - 如何在 DataTemplate 中绑定两个不同的类属性
- ios - 自定义字体在 App Store 版本中消失,但在开发构建期间可以 100% 工作。精灵包
- python - 我尝试运行以下使用 python 3.9.0 的程序,出现错误:'module' object has no attribute 'div' 谁能帮帮我