首页 > 解决方案 > 将 CSV 读入 Pandas 时推断日期的最有效方法是什么?

问题描述

目标:将 csv 文件读入 Pandas 数据框,而不必在日期列处手动调用

这是我目前使用的代码,它在我的日期列上提供了一个 'O' 的 dtype:

df = pd.read_csv(r"D:\time_stamp_ex.csv",
                parse_dates=False, 
                infer_datetime_format=True,
                date_parser=pd.to_datetime)
df

由于您没有该文件,因此这不是很有帮助,因此这是一个数据框片段,它完全生成了我的 csv 文件中的内容:

d = {'time_stamp': ['9/22/2017','9/15/2018','8/7/2017'],
     'category': ['A1','A2','B1'],
     'number':[12345678,12345678,12345678]}
df = pd.DataFrame(data=d)
df

阅读Pandas 文档,我没有发现我遗漏了什么,但我愿意接受这是一个简单的答案。

标签: pythonpandasdatetimeio

解决方案


Pandas 只会尝试infer_datetime_format你在parse_dates. 您目前将此设置为False。您需要告诉它 csv 文件中的哪些列包含日期。

我不确定这是否回答了您的问题,因为我不确定“不必在日期列手动调用”是什么意思。您的意思是您不想将日期列与读取文件分开转换,或者您不想告诉read_csv哪些列包含日期?


推荐阅读