python - 如何在自定义数据上运行 Pandas read_csv 的解析逻辑?
问题描述
read_csv包含大量解析逻辑,用于检测 CSV 字符串并将其转换为数字和日期时间 Pythong 值。我的问题是,有没有办法在包含带有字符串数据的列的 DataFrame 上调用相同的转换,但 DataFrame 没有存储在 CSV 文件中,而是来自不同的(未解析的)源?所以只有一个内存 DataFrame 对象可用。
因此,将此类 DataFrame 保存到 CSV 文件并将其读回会进行此类转换,但这对我来说看起来非常低效。
解决方案
如果您有例如字符串类型的列,但实际上包含日期(例如yyyy-mm-dd),则可以使用pd.to_datetime()
将其转换为Timestamp。
假设列名是SomeDate,您可以调用:
df.SomeDate = pd.to_datetime(df.SomeDate)
另一种选择是将任何自己的转换函数应用于任何列(在 Web 上搜索apply的描述)。
你没有提供任何细节,所以我只能给出非常笼统的建议。
推荐阅读
- r - 如何根据值是否超过Rstudio中特定列中的给定数字来删除数据集中的行
- unix - 如何在 Unix 上列出每个子目录的文件数量
- python-3.x - Jupyter笔记本:Pyhon3
- google-cloud-platform - 我可以创建一个钩子或以其他方式对 CloudSQL 只读副本进行响应吗?
- docker - 如何启用来自 docker-compose “bridge” 网络的容器以访问运行在 Docker 主机上的服务?
- python - 从 Json 中提取数据:错误 JSONDecodeError: Expecting value
- azure - Azure Search Lucene(完整查询类型)单字符
- php - PHP随机字符串
- mobx - Mobx 状态树 - 计算属性取决于子数组属性
- node.js - 如何解决“干净退出”nodemon 问题?