首页 > 解决方案 > 过滤具有大量列的 Pandas 数据框

问题描述

我见过很多关于过滤具有数百万行的 pandas 数据框的问题。但是,我有一个特定的要求,即用 60000 列过滤我的数据框。

数据框

如下图所示,形状为 25000 行 x 57827 列。我想根据只有值 1 和 0 的“标签”列过滤数据框。

通常,当我执行以下操作时,它应该可以工作:

negative_review= Train_clean[Train_clean['label'] == "0"]
positive_review = Train_clean[Train_clean['label'] == "1"]

但是,我的内存用完了,内核死了。我能得出的唯一结论是由于存在大量列。

我在 SO 中只发现一个与我相似的问题,但它不能解决我的问题:link to question

请给我一些指导

标签: pythonpython-3.xpandasdataframejupyter-notebook

解决方案


推荐阅读