首页 > 解决方案 > dateutil 和闰年

问题描述

如果我有以下字符串列表:

a = ['Loc_RaffertytoLong_2004_02_21',
 'Loc_RaffertytoLong_2004_02_22',
 'Loc_RaffertytoLong_2004_02_23',
 'Loc_RaffertytoLong_2004_02_24',
 'Loc_RaffertytoLong_2004_02_26',
 'Loc_RaffertytoLong_2004_02_27',
 'Loc_RaffertytoLong_2004_02_28',
 'Loc_RaffertytoLong_2004_02_29']

我尝试使用以下方法解析日期dateutil

from dateutil import parse as dparse
for i in a:
    print(dparse.parse(i,fuzzy=True))

我得到打印输出:

2019-02-21 00:00:00
2019-02-22 00:00:00
2019-02-23 00:00:00
2019-02-24 00:00:00
2019-02-26 00:00:00
2019-02-27 00:00:00
2019-02-28 00:00:00

和错误:

ValueError: ('Unknown string format:', 'Loc_RaffertytoLong_2004_02_29')

我不知道为什么自 2004 年以来是闰年。

标签: pythonpython-dateutil

解决方案


如果您查看输出,则将您dateutil的日期解释为 2019 年(不是闰年)的日期。

通过更改行,我能够使您的代码成功:

print(dparse.parse(i,fuzzy=True))

至:

print(dparse.parse('-'.join(i.split('_')[2:])))

当我运行整个块时,我得到输出:

2004-02-21 00:00:00
2004-02-22 00:00:00
2004-02-23 00:00:00
2004-02-24 00:00:00
2004-02-26 00:00:00
2004-02-27 00:00:00
2004-02-28 00:00:00
2004-02-29 00:00:00

有趣的是,如果我们像这样加入下划线:

print(dparse.parse('_'.join(i.split('_')[2:])))

它还将日期解释为 2019 年。这让我认为问题在于如何dateutil处理下划线。


您也可以简单地将下划线替换为破折号:

from dateutil import parser
for i in a:
    print(parser.parse(i.replace('_','-'), fuzzy=True))

打印与上面相同的输出。


推荐阅读