python - Pandas:要保存以包含 dtypes 的文件类型
问题描述
我正在研究一些datasets
包含许多DateTime
变量的内容。我总是.csv
在数据清理后保存一个文件。但是,当我下次将文件加载到pandas时,我必须dtypes
再次转换,并且需要很长时间。因此,我想知道是否有一种我可以用 Pandas 保存的文件来避免这种情况。
解决方案
您可以使用pickle
. 谢天谢地pandas
,它有一个原生函数来序列化和导出你的 DataFrame。只需使用导出
df.to_pickle('your_file.pkl')
来自文档:https ://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_pickle.html
然后,您可以使用再次加载 DataFrame
df = pandas.read_pickle('your_file.pkl')
推荐阅读
- angular - 如何将数据从 Angular 表单发送到 Spring Boot 微服务
- html - 添加文本时如何阻止网格中的容器扩展?
- c# - EF Core .NET 打包所有层 cqrs 错误
- javascript - 在网页上通过 JavaScript 模拟鼠标滚轮旋转
- php - 如何从主题中删除 woocommerce.css 文件?
- android - 如何在 intelliJ (maven) 中调试/启动 Android 应用程序
- bash - 无法将命令存储到bash中的变量
- neo4j - Neo4j - 大于 11 的可变长度永远运行并且查询永远不会返回
- r - 如何计算 Rstudio 中一组特定行的平均值
- r - 如何在R中隐藏滑块?