首页 > 解决方案 > Python pandas:统一来自 CSV 输入的日期时间列格式

问题描述

我在来自 pd.read_csv() 的数据框中有一个混合格式列。有很多关于日期时间处理的信息,但我没有找到任何关于这个特定问题的信息:

2 种数据时间类型:

  1. 自定义 dd/mm/yyyy hh:mm 在 excel 中显示如下:10/03/2018 07:18

  2. 一般在 Excel 中显示如下:2018 年 8 月 13 日下午 2:28:34

我用了 :

df.Last_Updated = pd.to_datetime(df['Last_Updated'])
df = df.sort_values('Last_Updated').drop_duplicates(['Name'], keep='last')

但是我得到了一个混合的一堆,其中自定义格式作为另一种数据时间类型返回:

  1. yyyy-mm-dd hh:mm:ss 并在我的 Excel 导出中显示为 2017-11-22 19:54:35

检查后将 dd/mm/yyyy hh:mm (02/09/2018 17:55:44) 格式更改为 yyyy-mm-dd hh:mm:ss (2018-02-09 17:55:44) 和因为我必须排除“早于”的类型,所以会导致错误;在这种特殊情况下,最后一次连接是在 9 月份的计算机返回为在 2 月份拥有它。

有谁知道统一日期时间格式的方法?

日期格式:

从记事本:

    X = "10/2/2018 10:07:31 PM"
    Y = "8/13/2018 2:28:34 PM"

从 CSV(并通过 Excel 打开 .txt):

X = 10/02/2018 22:07 PM
Y = 8/13/2018 2:28:34 PM

在代码中应用日期时间之后:

X = 02/10/2018  22:07:31
Y = 13/08/2018  14:28:34

标签: python-3.xpandasdatetime

解决方案


推荐阅读