首页 > 解决方案 > 有没有更快的方法来删除熊猫中数据框的所有空白/标签?

问题描述

从熊猫数据框中删除所有空格的最佳方法是什么?在 SO 我发现了一些建议:

df = df.replace({'\s': ''}, regex=True)

或者

df.replace({'\n': '<br>'}, regex=True)

但由于我的数据太大,计算时间太长。我的数据集的一小部分需要 2 分钟。我的完整数据集是(1Tb)

有什么办法可以改善这一点吗?并行化?更好的功能?或者只是使用另一种语言?

标签: pythonpandas

解决方案


推荐阅读