首页 > 解决方案 > 从 Timedelta 和 NaN 数组中获取浮点数

问题描述

我有一个给我带来很多麻烦的简单问题:我有一个大的 2D 数组,它是datetime.Timedelta对象 和的混合体np.nan,简化后看起来像这样:

tdarray = np.array([dt.timedelta(days=5), np.nan]) 

现在我想从 timedelta 对象中获取天数和浮点数/整数,同时保持np.nan原样,即结果应该是np.array([ 5., nan]).

从 timedelta 对象中获取日期很容易.days,并应用数组应该使用的函数,例如,np.fromiter然后重新整形。但是,我如何捕捉尝试从 NaN 获取日期时发生的错误?我尝试了屏蔽,但这也失败了 AttributeErrorMaskedArray没有属性days。有没有简单的解决方案?

标签: pythonnumpydatetimemissing-data

解决方案


np.nan利用唯一不等于自身的对象这一事实。请注意,如果您的数组包含其他对象,则应定义相等运算符,否则将引发错误。

tdarray = np.asarray([dt.timedelta(days=5), np.nan])
mask = tdarray == tdarray  # This gives array([True, False])
tdarray[mask] = [x.days for x in tdarray[mask]]
# Optionally cast to float
tdarray = tdarray.astype(np.float64)

或者您可以简单地重建阵列

tdarray = np.asarray([x.days if x == x else x for x in tdarray],
                     dtype=np.float64)

如果tdarray是 ND 数组 (N > 1) 那么

shape = tdarray.shape
tdarray = np.asarray([x.days if x == x else x 
                      for x in tdarray.ravel()],
                      dtype=np.float64).reshape(shape)

推荐阅读