首页 > 解决方案 > 如何从充满这些字符串的数据框中获取日期?

问题描述

我需要获取这些并将每个日期转换为日期时间对象。我有 500 列,但需要提取日期。

''' 0 12 月 30 日在美国审核,...

1 于 2019 年 8 月 28 日在美国审核

2 于 2020 年 2 月 6 日在美国审核

3 于 2019 年 11 月 6 日在美国审核

4 于 2020 年 3 月 6 日在美国审核 '''

标签: pythonpandasdatedatetime

解决方案


如果您隔离表示日期的行的部分,则可以将 datetime.datetime.strptime() 与格式字符串一起使用。在您的示例中,日期字符串只是最后三个单词:

from datetime import datetime

raw_line = '1 Reviewed in the United States on August 28, 2019'
date_str = " ".join(raw_line.split()[-3:])
parsed_date = datetime.strptime(date_str, '%B %d, %Y')

如果每行看起来有更多变化,您可以导入 re 模块并编写正则表达式来隔离日期字符串。


推荐阅读