python - 连接大型 xarray 列表的最佳方法
问题描述
我有一个很大的 xarray 列表(名为 results_list 大约有 620000 个 xarray(每个 xarray 具有以下配置:shape=(73, 41, 1)
,dtype=np.float32
)。我可以在 72 个内核的集群上工作(每个内核 30Go RAM)。
要将 xarrays 连接到仅一个 dask 数组中,我尝试了以下步骤:
import dask.array as da
rho = [da.from_array(result[0].data.squeeze()) for result in results_list]
它没有我想象的那么快(CPU 时间 = 1 分钟 39 秒),但它不是瓶颈。
然后:
da_rho = da.concatenate(rho, axis=0)
这个计算需要太多时间(CPU 时间 = 14 分钟 5 秒),因为我必须做几十次这种操作,但我的时间有限。
是否可以使用 dask 显着减少时间计算?
解决方案
推荐阅读
- wso2 - API 节流是如何实现的?
- java - 是否有用于在 Java 中编码本地时间的类?
- python - 如何在阅读多列时使用 np.where
- java - Optaplanner 不使用其他 BinAvailabilty 来获取分配给事件
- python - 有什么方法可以读取从 Python 网站发送到 Chrome 的 Web 推送通知?
- powershell - 从映射的网络驱动器检索文件时出错
- ruby - 远程服务器不接受密码,ruby 脚本 'net/ssh'
- android - 在片段内单击按钮更改片段
- java - Java 正则表达式匹配\n
- python - python 在子图中绘制不同的轴标题(边际)