python-2.7 - dask 如何在多个系统上实现?
问题描述
我是 Dask 库的新手。我想知道我们是否在两个系统上使用 dask 实现并行计算,那么我们应用计算的数据框是否存储在两个系统上?并行计算实际上是如何发生的,从文档中不清楚。
解决方案
Dask 数据帧是分块的,所以通常你有一个由分布在集群中的较小数据帧组成的大数据帧。计算单独应用于每个块,并在需要时对结果进行混洗(例如 groupby、sum 和其他聚合任务)。
推荐阅读
- python - 有没有办法保持索引嵌套字典,直到找到一个字符串值?
- c# - IQueryable 作为列表
- swagger - 标签 $ref 不显示内容 openapi3.0
- python - AssertionError: False 不正确,测试每次都失败是因为那个原因?
- java - Netbeans:缺少 JavaFX 组件
- c# - 如何将集合导航属性添加到没有鉴别器的派生实体上?
- karate - 条件响应检查使空手道测试卡住
- typescript - 输入 gapi.savetoandroidpay
- asp.net-core - 在 ASP.NET Core 中防止拒绝服务 (DoS) 攻击的最佳实践
- python - 为什么我得到这些不同的输出?