dask - 使用 map_blocks 根据每个块的内容计算一个堆
问题描述
我在笔记本电脑上创建了一个 Dask 集群,并使用 xarray.open_dataset('some_data.nc',chunks={'lat':'auto', 'lon':'auto', ' 在其上加载了一个 NetCDF 数据集时间':-1})
我已将其转换为时间序列的分布式数组,ts,每个(纬度,经度)对一个。对于这个数组,ts.chunks 是:((1555200, 1555200, 1555200, 1555200, 1555200, 1555200), (12,))
现在我想做的是为每个块创建一个 heapq,每个块的每行计算一个条目。我希望我可以为此使用 map_blocks,但我不知道如何。另外,我想根据这些堆做一些减少。
有没有一种简单的方法可以做到这一点?谢谢。
解决方案
实现此目的的一种简单方法是切换到 Dask 延迟。请参阅https://docs.dask.org/en/latest/delayed-collections.html
推荐阅读
- javascript - 如何处理未定义的参数?
- c# - 切换到正确的 iframe?
- django - 来自 3 层嵌套的 Django ORM 总和价格
- javascript - 为什么 KeyDown 事件会落后一个字符?
- flutter - 如何在 Text Widget Flutter 中使用换行符
- vespa - Vespa 查询超时时的部分结果
- php - 替换字符串数组中的所有字符串不起作用
- angular - 如何从字符串应用 Angular 组件
- android - 对于不同的应用程序模块,我可以在库模块中有不同的类(使用风味)吗?
- php - 为什么 php stream_socket_client 没有连接到端口 80 以外的端口?