首页 > 解决方案 > 在 Dask 期货中映射 ndarray 的正确方法

问题描述

我有一个大数组,我希望条目是索引的一些函数

def long_func([row, column]):
    ...
    return value

在 dask 中执行此操作的最佳方法是什么,以便操作尽可能并行和快速,以便我可以控制不同的块?我尝试了类似的东西

from dask.distributed import Client
import dask.array as da
c = Client()
n=10 # In reality will be a much larger number
indices = da.array(da.meshgrid(range(n), range(n))).T
indx_flat = indices.reshape(-1,2)
future_list = c.map(long_func, indx_flat)

这给了我一个期货列表,我可以使用这些期货并手动获取大量数据,但这似乎非常错误。我认为必须有一种更智能的使用da.from_delayed或使用方式,map_blocks但我不确定。谁能告诉我做事的最佳方式?谢谢!

编辑:这可能是答案

标签: pythondask

解决方案


推荐阅读