python - 熊猫版本更新后 to_csv() 变慢了吗?
问题描述
我们将 pandas 从 0.21.1 版本升级到 0.24.1
在 0.21.1-to_csv() 中,在大约 1.5 小时内将 200 列的 6400 万条记录写入 .csv 文件
df.to_csv(filename, index=False)
我进行了软件更新,并且永远写出同一行代码。
有没有更好的方法可以让我回退到更快的方法?
解决方案
在版本0.21.x
中,定义是
DataFrame.to_csv(
path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
header=True, index=True, index_label=None, mode='w', encoding=None,
compression=None, quoting=None, quotechar='"', line_terminator='\n',
chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
escapechar=None, decimal='.')
在0.24.x
定义中是
DataFrame.to_csv(
path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
header=True, index=True, index_label=None, mode='w', encoding=None,
compression='infer', quoting=None, quotechar='"', line_terminator=None, # Check these options
chunksize=None, tupleize_cols=None, date_format=None,
doublequote=True, escapechar=None, decimal='.')
只有一些参数发生了变化。您可能想查看它们并检查函数的行为是否与以前相同。
另外尝试to_hdf
用于写入大文件
df.to_hdf('file.h5', key='some_key', mode='w')
推荐阅读
- android - 如何解决“无效的属性名称”错误以使用 kivy 制作文件选择器?
- c# - 如何防止将相同的数据添加到列表中,并在 MVC 5 中删除/编辑数据后重用它?
- powershell - 使用 Azure Power Shell 或 Azure CLI 创建 Log Analytics 警报
- javascript - postsActions.js:20 POST http://localhost:5000/api/posts 422(无法处理的实体)
- apache - 具有著名的 !-f 和 !-d 条件的 RewriteCond 不起作用
- mobile - XAMPP - 在移动热点上将我的 PC 本地主机共享到任何设备
- c++ - 类静态变量初始化顺序
- java - 为 Websphere 中的 jar 文件提供属性文件
- angular - 如何在 Angular dart 中的兄弟组件之间共享数据
- html - 扩展不受 div 布局影响的线性渐变背景