dask - 有没有直接的方法将 Dask 数据帧转换为 Xarray 数据集?
问题描述
Xarray 和 Dask 文档解释了如何使用 Dask 支持将大型 NetCDF 数据集加载到 Xarray 中。但是如果我有一个非常大的CSV 文件(> 1GB)怎么办?是否可以通过 Dask 将其加载到Xarray 数据集中?是以参与 Dask 后端的方式将其加载到 Xarray 中,还是将其加载为 Dask 数据帧并将该数据帧转换为 Xarray 数据集?
我想将此数据集与 Xarray 一起使用,因为它由实验结果组成,并且我想根据自变量的不同设置(我将用作维度)对实验结果进行索引。
Xarray 的from_dataframe()
(http://xarray.pydata.org/en/stable/generated/xarray.Dataset.from_dataframe.html?highlight=from_dataframe)只提到支持 Pandas DataFrames,没有提到 dask。
Dask 文档 ( https://examples.dask.org/xarray.html ) 仅描述了从保存的 Xarray 数据集加载。
解决方案
推荐阅读
- sql-server - 多个重复的 IF 语句与存储过程中带有循环的单个 IF
- graph - 接口上的 SNMP/mrtg/流量报告不正确
- f# - 在 F# 生成器中获取空值
- javascript - 在 React useEffect 挂钩中引用过时的状态
- ruby-on-rails-4 - 为什么设计会生成这种格式的确认 URL?
- c# - 如何让用户控件适合窗口的网格?
- gcc - CMake:C 编译器无法编译简单的测试程序
- java - 如何在 apache 骆驼路由中将数据发送到 netty4 套接字
- azure-active-directory - Powerbi 嵌入式身份验证选项有哪些?
- kotlin - Dagger 2.空测试组件未解决