python - 在 Dask 期货中映射 ndarray 的正确方法
问题描述
我有一个大数组,我希望条目是索引的一些函数
def long_func([row, column]):
...
return value
在 dask 中执行此操作的最佳方法是什么,以便操作尽可能并行和快速,以便我可以控制不同的块?我尝试了类似的东西
from dask.distributed import Client
import dask.array as da
c = Client()
n=10 # In reality will be a much larger number
indices = da.array(da.meshgrid(range(n), range(n))).T
indx_flat = indices.reshape(-1,2)
future_list = c.map(long_func, indx_flat)
这给了我一个期货列表,我可以使用这些期货并手动获取大量数据,但这似乎非常错误。我认为必须有一种更智能的使用da.from_delayed
或使用方式,map_blocks
但我不确定。谁能告诉我做事的最佳方式?谢谢!
编辑:这可能是答案
解决方案
推荐阅读
- java - 将数据从文本文件存储到哈希图而不是列表
- api - Elasticsearch 中的 mapper_parsing_exception(原因:没有为字段 [X] 指定类型)
- python - Python将文本文件解析为字典
- python - 编写一个程序,计算并打印文本文件中数字的平均值
- html - 如何在选项菜单中添加输入文本和按钮
- database - 我正在尝试将图像上传到我在 laravel 中的目录(通过数据库访问它们)
- azure - 如何将动态内容添加到 Azure 数据工厂数据集中的“第一行作为标题”条件?
- vuejs2 - Quasar框架q-select在v-model中设置一个对象比id
- angular - 未能实现 Angular 自定义过滤器管道
- xml - 使用 XSLT 从 XML 中删除标签