首页 > 解决方案 > 如何在自定义数据上运行 Pandas read_csv 的解析逻辑?

问题描述

read_csv包含大量解析逻辑,用于检测 CSV 字符串并将其转换为数字和日期时间 Pythong 值。我的问题是,有没有办法在包含带有字符串数据的列的 DataFrame 上调用相同的转换,但 DataFrame 没有存储在 CSV 文件中,而是来自不同的(未解析的)源?所以只有一个内存 DataFrame 对象可用。

因此,将此类 DataFrame 保存到 CSV 文件并将其读回会进行此类转换,但这对我来说看起来非常低效。

标签: pythonpandas

解决方案


如果您有例如字符串类型的列,但实际上包含日期(例如yyyy-mm-dd),则可以使用pd.to_datetime()将其转换为Timestamp

假设列名是SomeDate,您可以调用:

df.SomeDate = pd.to_datetime(df.SomeDate)

另一种选择是任何自己的转换函数应用于任何列(在 Web 上搜索apply的描述)。

你没有提供任何细节,所以我只能给出非常笼统的建议。


推荐阅读