首页 > 解决方案 > 如何将多格式日期列转换为熊猫列中的单一通用日期格式?

问题描述

我的 CSV 有一列具有以下日期格式。

5/2/2010
12/2/2010
19-02-2010
26-02-2010
5/3/2010
12/3/2010
19-03-2010
26-03-2010
2/4/2010
9/4/2010

当我读取 csv 文件并打印数据框时,我得到的结果如下所示。

file_path = r'Store_sales.csv'
date_series_data = pd.read_csv(file_path)
date_series_data.head()

输出

05-02-2010      
12-02-2010      
19-02-2010  
26-02-2010  
05-03-2010

当我打印数据类型时,它显示对象数据类型。所以我无法设置为索引。所以我使用 pd.to_datetime(date_series_data)了将对象转换为 datetime64[ns]。但是前两个元素的日期格式改变如下

2010-05-02  
2010-12-02  
2010-02-19  
2010-02-26      
2010-03-05

因此,我的各种计算出错了。有没有有效的方法来转换和获得类似的格式?

标签: pythonpandasdataframedatetime

解决方案


尝试:

import pandas as pd

# Read excel file
date_series_data = pd.read_csv(filepath)

# 'Date' is the column name which has date entries
# I have set time format as YDM. You can change it to other using dt.strftime
date_type_one = pd.to_datetime(date_series_data['Date'], errors='coerce', format='%Y-%d-%m %H:%M:%S').dt.strftime('%Y-%d-%m')
date_type_two = pd.to_datetime(date_series_data['Date'], errors='coerce', format='%d-%m-%Y').dt.strftime('%Y-%d-%m')
date_series_data['Date'] = date_type_one.fillna(date_type_two)

date_series_data.head()

参考: 在 pandas 中使用混合日期时间格式


推荐阅读