首页 > 解决方案 > 如何在不使用 Pandas 的情况下创建等效于 numpy.nan 的日期时间对象?

问题描述

给定一个 numpy 数值数据数组,可以检索与特定条件匹配的数组索引。通过接受np.nanas type <float>,仍然可以满足这些条件。我想使用使用日期时间对象而不是数字数据的类似方法。

例如,考虑以下情况:

import numpy as np
import datetime

# sample data
x = np.linspace(-5, 5, 11).astype(int)
y = x**2
z = y.copy().astype(float)
z[0] = np.nan

# check that nan condition is correctly satisfied
print("\nZ:\n{}\n".format(z))
print("\nZ > 0:\n{}\n".format(z > 0))
print("\nZ < 0:\n{}\n".format(z < 0))
print("\nZ = 0:\n{}\n".format(z == 0))

# get number of elapsed hours between two datetime objects
dt0 = datetime.datetime(2018, 1, 11, 23, 59, 59)
dt1 = datetime.datetime(2018, 1, 12, 23, 59, 59)
hr_delta = (dt1 - dt0).total_seconds() // 3600
print("\n{} - {} = {} hours".format(dt1, dt0, hr_delta))

因为np.nan - 5 = np.nan,我用这个想法来创建一个无效的日期时间对象会很方便。但是, datetime 对象需要 type 的输入<int>,而np.nanis type <float>。下面的示例重新创建了我的问题的根源:

# attempt to instantiate invalid datetime object
dt2 = datetime.datetime(np.nan, 1, 11, 23, 59, 59)

抛出TypeError: integer argument expected, got float. 有没有办法在不使用熊猫的情况下做到这一点,正如这篇备用帖子中所建议的那样?澄清一下,我的目标是创建一个无效的 datetime 对象,以便它与有效的 datetime 对象相减或相加会返回一个类似 nan 的值。

标签: python-3.xnumpydatetimenan

解决方案


pandas 所做的任何事情通常都是 Numpy 所做的。

在这种情况下,您需要存储正确的类型,不是datetime,而是np.datetime64。一旦你有了这个类型,你就可以用它来填充NaT值,np.datetime64("NaT")然后用它np.isnat来测试一个值是否是时间。

datetime本身不提供“不是时间”的概念,您必须使用提供的类型。您应该能够以np.datetime64紧密的方式使用datetime.


推荐阅读