首页 > 解决方案 > 熊猫默认参数

问题描述

作为我日常工作的一部分,我需要每天至少 10 次读取 csv 文件、写入 csv 文件、合并数据帧和重命名列。

总是必须将这些的默认 pandas 参数更改为以下内容:

这是我一直想避免的事情之一,但它足够小,不会花费大量时间来修复。

我做了一些挖掘并得出了一个可能的解决方案:

from functools import partial

pd.read_csv = partial(pd.read_csv, dtype='str')

我可以将它放在我正在编写的任何代码的顶部,而不再需要指定 dtype。

这样做的问题是:

  1. 它仅适用于 pd,不适用于 pd.DataFrame 函数。
  2. 我需要在每个新的 python 会话中运行这个命令,我会经常打开一个 python 会话来做一些临时数据处理。

有没有办法在环境级别更改默认参数?

我确实意识到这不是最佳实践,但它可以让我免于 RSI,我总是希望这些成为默认参数

标签: pythonpandasdataframe

解决方案


推荐阅读