python - 熊猫日期时间格式
问题描述
目前,我正在处理 220 万条记录。其中两列由membership_id
和组成txn_time
。数据框看起来像 -
membership_id txn_time
1 2019-02-17 00:00:00.0
2 2018-04-23 00:00:00.0
3 2018-12-17 00:00:00.0
4 2019-02-17 00:00:00.0
5 2018-04-02 00:00:00.0
6 2018-09-10 06:20:58.0
7 2019-01-16 08:11:42.0
我希望数据框看起来像 -
membership_id txn_time
1 2019-02-17
2 2018-04-23
3 2018-12-17
4 2019-02-17
5 2018-04-02
6 2018-09-10
7 2019-01-16
到目前为止我所做的 -
df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'], errors='coerce')
但是,它不起作用,记录数量高达 220 万。
提前致谢。
解决方案
为了提高性能使用参数format
,然后转换为不带time
s by 的日期dt.floor
时间,如果以后需要通过 datetimelike 函数处理数据更好:
df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'],
errors='coerce',
format='%Y-%m-%d %H:%M:%S.%f').dt.floor('d')
或通过python date
s dt.date
,但得到object
:
df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'],
errors='coerce',
format='%Y-%m-%d %H:%M:%S.%f').dt.date
推荐阅读
- android - 我如何在另一个类中调用 recyclerview 适配器?
- android - 程序化 UI 设计
- android - SQLite 无法解析该行
- arrays - 如何在 VB 中请求多个 Picturebox-Clickevents
- python - Python 字节串子串切片返回不同的表示
- javascript - 我无法从数据库中获取更新的数据,尽管它们在数据库中
- haskell - 如何从数据中获取键值
- jquery - Materialize DatePicker 覆盖 jQuery DatePicker
- python - 在没有 PyPi 的情况下安装 GitHub 包
- python-3.x - 在多个表中查询相似的文本字符串