首页 > 解决方案 > Pandas:要保存以包含 dtypes 的文件类型

问题描述

我正在研究一些datasets包含许多DateTime变量的内容。我总是.csv在数据清理后保存一个文件。但是,当我下次将文件加载到pandas时,我必须dtypes再次转换,并且需要很长时间。因此,我想知道是否有一种我可以用 Pandas 保存的文件来避免这种情况。

标签: pythonpandasfile

解决方案


您可以使用pickle. 谢天谢地pandas,它有一个原生函数来序列化和导出你的 DataFrame。只需使用导出

df.to_pickle('your_file.pkl')

来自文档:https ://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_pickle.html

然后,您可以使用再次加载 DataFrame

df = pandas.read_pickle('your_file.pkl')

推荐阅读