首页 > 解决方案 > Pandas DataFrame 清理

问题描述

我有一个生日日期像'10.10.1990'的数据框。由于任何方法都不适用于此列,因此我想将其转换为datetime. 它适用于第一个日期列,但不适用于相同的第二列。

我认为问题出在此列中的垃圾日期,但我不知道如何清除它。

所以,我正在使用

data[4] = pd.to_datetime(data[4], infer_datetime_format=True)
data[4].hist()

而且,一切都好。但是,当我在第二列像第一列一样做同样的事情时,我得到了一个错误:

ValueError:给定的日期字符串不太可能是日期时间。

我正在尝试使用以下方法查看此专栏:

isna().sum()
Firs one: 6
Second one: 13

str.isnumeric().value_counts()
give a True: 2.

我想知道如何在使用它之前清除列。

标签: pandas

解决方案


你可以通过errors

data[4] = pd.to_datetime(data[4], errors='coerce',format='%m.%d%.%Y')

推荐阅读