首页 > 解决方案 > 熊猫到可逆字符串?

问题描述

我一直遇到这种情况,在生产或开发中,我在搞乱数据框,修复一些东西,然后必须为它编写一个单元测试。很多时候,尝试开发一些相关的测试数据很糟糕,将生产数据转储到我可以“ctrl-c”的字符串中,粘贴到我的测试中并加载到那里的df中会更快。有没有办法做到这一点?

问题pd.to_string是对象信息丢失了,没有简单的方法来反序列化数据,即使有,它也会通过类型推断得到,这会一直破坏 pandas 中的数据一致性。

如果我们可以使用类似的东西丝网印刷泡菜pd.to_pickle,我认为这将是理想的。有没有人对此有更有效的解决方案?

例如:

s_1 = pd.to_pickle()
print(s_1)

#copy and paste the out put into s_2

s_2 = 'paste printed binary output of s_1 in here.'
df = pd.read_picke(s_2)

标签: pythonpandas

解决方案


您可以使用pickle将数据帧存储到带有df_bytes = pickle.dumps(df). 然后,您可以复制/粘贴/打印/保存/无论该字节串并稍后使用df2 = pickle.loads(df_bytes).


推荐阅读