首页 > 解决方案 > 使用 pandas 中的列子集

问题描述

假设我有一个包含 50 列和 100,000,000 行的数据框。在一次处理较小的数据块时,我将一系列函数(包括行删除)应用于数据帧相同三列的子集。

数据框的其他 47 列会减慢速度吗?如果是这样,我正在考虑在开始时仅使用这三列制作数据框的副本,应用这些函数,然后将它们与其他 47 列连接起来。不过,我不确定 Python 是否会处理每个函数中的 50 列中的每一列,所以我不知道这是否有必要。

谢谢!

标签: pythonpandasdataframe

解决方案


推荐阅读