broadcast - Dask scatter 广播列表
问题描述
使用Dask分发的散播列表的适当方法是什么?
案例 1 - 包装列表:
[future_list] = client.scatter([my_list], broadcast=True)
案例 2 - 不包装列表:
future_list = client.scatter(my_list, broadcast=True)
在 Dask 文档中,我看到了两个示例:1. wrapping (见底部示例)和2. not wrapping。根据我的经验,案例 1 是最好的方法,在案例 2 中构建 Dask 图(在我的用例中很大)需要更长的时间。
什么可以解释图构建时间的差异?这是预期的行为吗?
提前致谢。
托马斯
解决方案
如果您使用 a 调用 scatter,list
则 Dask 将假定该列表的每个元素都应该独立分散。
a, b, c = client.scatter([1, 2, 3], ...)
如果您不希望这样,如果您实际上只是希望将列表作为单个数据移动,那么您应该将其包装在另一个列表中
[future] = client.scatter([[1, 2, 3]], ...)
推荐阅读
- typescript - 尝试以编程方式连接到同一 vpc 中的 AWS DocumentDB,但连接失败
- r - 当数据集包含长达 25 年的信息时,用于绘制 10 年内有多少人患上糖尿病的 Kaplan Meier 图的 R 代码是什么?
- sql - SQL Server:使用同一表中的相同值更新多个不同的行
- html - CSS - 列像具有动态内容的弹性框
- amazon-web-services - AWS 上的数据更新
- python-3.x - 在我的本地机器上运行时出现 Flask 404 错误
- rest - 通过 REST 将 Azure DevOps 服务器管道的构建状态发送到 Bitbucket
- intellij-idea - java: 你没有使用 lombok 支持的编译器,所以 lombok 将无法工作并且已被禁用
- amazon-web-services - 如何在 AWS 中的安全组内和跨安全组自动使用公共 IP 地址替换分配的入站规则?
- javascript - Bootstrap 选择可编辑组合框黑客