python - 熊猫数据框自定义格式字符串到时间
问题描述
我有一个看起来像这样的数据框
DEP_TIME
0 1851
1 1146
2 2016
3 1350
4 916
...
607341 554
607342 633
607343 657
607344 705
607345 628
我需要获取此列DEP_TIME
中的每个值以具有格式hh:mm
。所有单元格都是类型string
,并且可以保持该类型。
一些单元格仅缺少冒号(第 0 到 3 行),其他单元格也缺少前导 0(第 4+ 行)。有些单元格是空的,理想情况下应该有字符串值 0。
因为我有几百万条记录,所以我需要以一种有效的方式来做这件事。我该怎么做?
解决方案
to_datetime
与 一起使用Series.dt.strftime
:
df['DEP_TIME'] = (pd.to_datetime(df['DEP_TIME'], format='%H%M', errors='coerce')
.dt.strftime('%H:%M')
.fillna('00:00'))
print (df)
DEP_TIME
0 18:51
1 11:46
2 20:16
3 13:50
4 09:16
607341 05:54
607342 06:33
607343 06:57
607344 07:05
607345 06:28
推荐阅读
- c - 以太网缓冲区可以填满并且不允许另一个进程接收()以太网数据包吗?
- javascript - Javascript - 无论深度如何,都更新嵌套字典中的值
- postgresql - 尝试通过 Flutter Android 应用程序中的 URI 从 postgress 数据库获取数据时,不支持的方案“postgres”
- javascript - 推送到 GitHub 的不需要的子模块
- networking - 当服务停止侦听该 TCP 端口时,已建立的连接会发生什么情况?
- python - 我不明白机器学习python中的空数据集是什么意思
- java - 为什么我对字节的 Java 位检查不稳定?
- netlogo - 如何在 NetLogo 6.2 中选择补丁变量的第二高值?
- function - 有谁知道如何在 Visual Studio Code 中自动获取参数名称?
- oracle - 根据不同字段查询分组依据