python - 如何从充满这些字符串的数据框中获取日期?
问题描述
我需要获取这些并将每个日期转换为日期时间对象。我有 500 列,但需要提取日期。
''' 0 12 月 30 日在美国审核,...
1 于 2019 年 8 月 28 日在美国审核
2 于 2020 年 2 月 6 日在美国审核
3 于 2019 年 11 月 6 日在美国审核
4 于 2020 年 3 月 6 日在美国审核 '''
解决方案
如果您隔离表示日期的行的部分,则可以将 datetime.datetime.strptime() 与格式字符串一起使用。在您的示例中,日期字符串只是最后三个单词:
from datetime import datetime
raw_line = '1 Reviewed in the United States on August 28, 2019'
date_str = " ".join(raw_line.split()[-3:])
parsed_date = datetime.strptime(date_str, '%B %d, %Y')
如果每行看起来有更多变化,您可以导入 re 模块并编写正则表达式来隔离日期字符串。
推荐阅读
- c - 打印节标题的精灵名称
- css - chrome 上的 CSS 背景过滤器比 safari 上的 -webkit-backdrop-filter 慢得多
- python - 如何使用python从postgresql中选择没有[(100),]的100这样的数据?
- validation - 如何解决不允许谓词(封闭形状)验证错误
- uipath - UiPath - 问题在字符串周围嵌入双引号
- reactjs - 如何动态显示反应组件
- c# - 带参数调用类时的C#反射性能比较
- r - 分别从每列中删除异常值 (3*IQR)
- r - R 中 imputeTS 的 na_kalman() 问题
- python - 我的 anaconda 导航器中没有 altair 包