首页 > 解决方案 > Pandas to_dict() 将日期时间转换为时间戳

问题描述

在我的 pandas DataFrame 中,我使用datetime模块将一些日期值从时间戳转换为日期时间。打印出 DataFrame 看起来不错,但是当我使用 将 DataFrame 转换为字典to_dict()时,日期时间值似乎是 pandasTimestamp类型。

我的问题类似于这个问题,但我一开始没有熊猫Timestamp对象,我想保留datetime我最初创建的对象。建议的解决方案对我也不起作用,因为输出仍然是 pandas Timestamp,但属于 dtype object

输入:

import pandas as pd
from datetime import datetime

list_in = [
    {"name": "a", "created": 1574947970000}, 
    {"name": "b", "created": 1581322065000}, 
    {"name": "c", "created": 1578929177000}
]

然后我创建一个 DataFrame 并将每个时间戳转换为一种datetime格式。(除以 1000 是必要的,因为时间戳是以毫秒为单位的,应该是秒)

df = pd.DataFrame(list_in)
df["created"] = [datetime.fromtimestamp(x / 1000) for x in df["created"]]
print(df)

输出:

  name             created
0    a 2019-11-28 14:32:50
1    b 2020-02-10 09:07:45
2    c 2020-01-13 16:26:17
name               object
created    datetime64[ns]
dtype: object

此输出将正确的日期值显示为日期时间对象。在我的项目中,我在 DataFrame 上做了一些与本主题无关的其他魔法。但最后我想将 DataFrame 转换回这样的字典列表:

list_out = df.to_dict(orient="records")

最终输出:

[{'name': 'a', 'created': Timestamp('2019-11-28 14:32:50')}, 
{'name': 'b', 'created': Timestamp('2020-02-10 09:07:45')}, 
{'name': 'c', 'created': Timestamp('2020-01-13 16:26:17')}]

最终期望的输出:

[{'name': 'a', 'created': datetime.datetime(2019, 11, 28, 14, 32, 50)}, 
{'name': 'b', 'created': datetime.datetime(2020, 2, 10, 9, 7, 45)}, 
{'name': 'c', 'created': datetime.datetime(2020, 1, 13, 16, 26, 17)}]

所以我的问题实际上是,为什么to_dict()datetime值作为 pandasTimestamp对象返回?我怎样才能防止这种情况发生?

标签: pythonpandasdataframedatetimetimestamp

解决方案


为什么可以在这里找到。

我不知道如何防止它发生,但您可以将 Timestamps 转换为 datetime64 之后:

for rec in list_out:
    rec['created'] = rec['created'].to_datetime64()

推荐阅读