python - 熊猫到可逆字符串?
问题描述
我一直遇到这种情况,在生产或开发中,我在搞乱数据框,修复一些东西,然后必须为它编写一个单元测试。很多时候,尝试开发一些相关的测试数据很糟糕,将生产数据转储到我可以“ctrl-c”的字符串中,粘贴到我的测试中并加载到那里的df中会更快。有没有办法做到这一点?
问题pd.to_string
是对象信息丢失了,没有简单的方法来反序列化数据,即使有,它也会通过类型推断得到,这会一直破坏 pandas 中的数据一致性。
如果我们可以使用类似的东西丝网印刷泡菜pd.to_pickle
,我认为这将是理想的。有没有人对此有更有效的解决方案?
例如:
s_1 = pd.to_pickle()
print(s_1)
#copy and paste the out put into s_2
s_2 = 'paste printed binary output of s_1 in here.'
df = pd.read_picke(s_2)
解决方案
您可以使用pickle
将数据帧存储到带有df_bytes = pickle.dumps(df)
. 然后,您可以复制/粘贴/打印/保存/无论该字节串并稍后使用df2 = pickle.loads(df_bytes)
.
推荐阅读
- function - 使用函数获取组合
- javascript - 选择一个列表以生成另一个列表
- sql - 记录数正确显示,但当日期是相当旧的日期时,“新计算开始日期”列显示所有“######”格式,例如:01-DEC-1184
- excel - 如何用另一个工作表中关于另一个单元格值的另一个单元格信息有条件地替换excel中的单元格信息
- php - 通过字符串操作从另一个创建新变量
- python - 我正在学习 python,所以写了这个小代码来添加 2 个具有 ROI 的图像,但它显示错误
- mesos - OpenEBS 是否支持或有任何适用于 DCOS 或 MESOS 的插件?
- javascript - javascript映射折线,如果条件不匹配,则将不透明度设置为零
- java - 在哪里以及如何存储使用 Jar 执行的 python 脚本?
- c - 生产者/消费者:1 个生产者,多个消费者 - 1 个信号量,1 个互斥体,1 个条件变量