首页 > 解决方案 > Missing_value 属性丢失从 netCDF 文件中读取数据?

问题描述

我正在从 NCEP/NCAR Reanalysis 1 的 netCDF 文件中读取风分量(u 和 v)数据,以进行一些计算。我正在使用 xarray 来读取文件。

在其中一个计算中,我想屏蔽掉低于某个阈值的所有数据,使它们等于 missing_value 属性。我不想使用 NaN。

但是,当使用 xarray 读取数据时,netCDF 文件的变量中存在的 missing_value 属性不会复制到包含数据的 xarray.DataArray。

我找不到使用 xarray 从 netCDF 文件变量中复制此属性的方法。

这是我正在尝试做的一个例子:

import xarray as xr
import numpy as np

DS1 = xr.open_dataset( "u_250_850_2009012600-2900.nc" )
DS2 = xr.open_dataset( "v_250_850_2009012600-2900.nc" )

u850 = DS1.uwnd.sel( time='2009-01-28 00:00', level=850, lat=slice(10,-60), lon=slice(260,340) )
v850 = DS2.vwnd.sel( time='2009-01-28 00:00', level=850, lat=slice(10,-60), lon=slice(260,340) )

vvel850 = np.sqrt( u850*u850 + v850*v850 )

jet850 = vvel850.where( vvel850 >= 12 )
#jet850 = vvel850.where( vvel850 >= 12, vvel850, vvel850.missing_value )

最后一个注释行是我想要做的:使用 missing_value 属性来填充 vvel850 < 12 的位置。最后一个未注释的行给了我 NaN,这是我试图避免的。

从 netCDF 读取数据时,它是 xarray 的默认行为吗?无论是与否,我如何从文件变量中获取此属性?

附加信息:我正在使用 PyNGL(http://www.pyngl.ucar.edu/)制作等高线图,但它不适用于 NaN。

谢谢。

马特乌斯

标签: pythonmissing-datanetcdfpython-xarray

解决方案


“missing_value”属性保存在encoding字典中。其他属性如“units”或“standard_name”保存在attrs字典中。例如:

v850.encoding['missing_value']

您可能还对其他一些可能对您的用例有所帮助的 xarray 功能感兴趣:

  1. xr.open_dataset有一个mask_and_scale关键字参数。这将关闭将缺失/填充值转换为 nans。
  2. DataArray.to_masked_array将 a DataArray(用 NaN 填充)转换为 anumpy.MaskedArray用于绘图程序,如 Matplotlib 或 PyNGL。

推荐阅读