首页 > 解决方案 > 火花驱动器如何决定使用哪些火花执行器?

问题描述

火花驱动程序如何决定哪些执行程序将用于特定工作?

是数据本地化驱动吗?
是否根据该数据节点上数据的可用性来选择执行者?
如果是,如果所有数据都存在于单个数据节点上并且数据节点有足够的资源来运行 2 个执行程序,但在 spark-submit 命令中我们使用了 --num-executors 4会发生什么。哪个应该运行 4 个执行程序?

火花驱动程序是否会将该数据节点中的一些数据复制到其他数据节点并产生另外 2 个执行程序(在 4 个必需的执行程序中)?

标签: apache-spark

解决方案


推荐阅读