apache-spark - 在 Apache Spark 中,同一 Stage 中的任务是否同时工作?
问题描述
同一阶段的任务是否同时工作?如果是这样,一个阶段中分区之间的线指的是什么?DAG 示例
解决方案
这是一个很好的阅读链接。详细解释了 DAG 以及其他一些可能感兴趣的事情。DAG 上的 databricks 博客
我可以试着解释一下。在创建每个阶段时,它都有一组被划分的任务。当遇到动作时。驱动程序将任务发送给执行程序。根据您的数据的分区方式,对分布式集群中的数据调用 N 个任务。所以你看到的箭头是执行计划。因为它不能在读取文件之前执行映射功能。每个拥有一些数据的节点将按照 DAG 提供的顺序执行这些任务。
推荐阅读
- button - 如何使用 Kivy 在加载动画上放置一个按钮?
- c++ - 创建字符串数组/向量并找出其中所有字符串长度的有效方法
- docker - Gitlab Runner 中的 Docker Swarm 连接错误 - 半裸 - 半容器
- asp.net-mvc - 如何在单视图asp.net core 2.2 mvc中使用多个模型?
- angularjs - 如何以表格形式显示来自api的json数据?
- python - Python - 如何索引字典中的元素?
- c++ - 给定大量数字时,基数排序无法正确排序
- java - 在我的测试中,红黑树比常规二叉搜索慢
- multithreading - 为什么一个线程池会创建很多独特的线程?
- reactjs - 如何使用 Material UI React 创建带有右侧文本字段的标签?