python - 过滤具有大量列的 Pandas 数据框
问题描述
我见过很多关于过滤具有数百万行的 pandas 数据框的问题。但是,我有一个特定的要求,即用 60000 列过滤我的数据框。
如下图所示,形状为 25000 行 x 57827 列。我想根据只有值 1 和 0 的“标签”列过滤数据框。
通常,当我执行以下操作时,它应该可以工作:
negative_review= Train_clean[Train_clean['label'] == "0"]
positive_review = Train_clean[Train_clean['label'] == "1"]
但是,我的内存用完了,内核死了。我能得出的唯一结论是由于存在大量列。
我在 SO 中只发现一个与我相似的问题,但它不能解决我的问题:link to question
请给我一些指导
解决方案
推荐阅读
- apache-spark - 我可以从 azure databricks notebook 对 cosmos-db(图形)运行 gremlin 查询吗?
- javascript - JS reducer:返回组合的对象数组
- api - 如何使用一个 API 的 cookie 到另一个 API 并使用 REST 保证库在 Java 中运行 API 调用链
- google-apps-script - 谷歌表格在表格之间匹配买家和卖家
- angularjs - Angular ng-repeat 不显示来自 http.get 的数据
- javascript - 页面重新加载后无法从 redux 存储中获取数据
- import - Gitlab Wiki - 导入存储库时如何导入 wiki
- c# - 信号量如何从另一个线程释放?
- asynchronous - 异步数据流上的 Apache Flink 规则
- java - 是 JavaCE 中的 RESTful Web 服务器