google-cloud-dataflow - 数据流:动态工作再平衡与融合
问题描述
动态工作再平衡将优化分配工作给工人,其中融合将折叠执行图,以便图更小,意味着更少的工人参与。动态工作再平衡如何帮助融合,即使存在融合,工作分配也能以最佳方式发生?例如,如果 fused 工人因为地图步骤中发生的扇出而苦苦挣扎。从逻辑上讲,应该涉及更多的工人,但图表是融合的。在这种情况下,动态工作再平衡还能发挥作用吗?
解决方案
即使图形被融合,动态再平衡也应该起作用。动态再平衡意味着 master 要求 worker 拆分他们的工作并将这些工作分配给空闲的 worker。
Fusion 在逻辑上是对流水线图的优化,而动态再平衡是在运行时的优化。你可以认为融合试图减少计算步骤,而动态再平衡试图加速每个步骤的执行,无论该步骤是否足够或可以与其他步骤合并。
推荐阅读
- php - 从 DateTime PHP 中选择月份?
- sql - 如何在不删除oracle中的序列的情况下更改序列顺序
- c# - 如何对 EF Core 2.1 中的继承列排序?
- python - 在 qtable 中打开 csv 文件时程序关闭
- hyperledger-fabric - 具有多个订购者的超级账本结构设置
- c++ - 通过 n-api 在 nodejs 中使用多个 cpp 文件
- qt - 如何在 QML 文件中导入 QML 组件资源
- c# - 只需要使用 EPPlus 从 Excel 返回不同的值
- angular - 从 Angular 5 升级到 6 后过滤不起作用
- swift3 - CocoaAsyncSocket didRead 没有被调用