python - 使用 pandas 中的列子集
问题描述
假设我有一个包含 50 列和 100,000,000 行的数据框。在一次处理较小的数据块时,我将一系列函数(包括行删除)应用于数据帧相同三列的子集。
数据框的其他 47 列会减慢速度吗?如果是这样,我正在考虑在开始时仅使用这三列制作数据框的副本,应用这些函数,然后将它们与其他 47 列连接起来。不过,我不确定 Python 是否会处理每个函数中的 50 列中的每一列,所以我不知道这是否有必要。
谢谢!
解决方案
推荐阅读
- hp-uft - 当我的屏幕处于完全展开模式时,不再识别对象
- python - 打开文件时编码的含义?
- c# - IIS 中 ASP.NET Core 中的 CORS
- python - 通过比较最新的已知值和 NaN 行之前的第一个已知值来填充行 NaN 值
- macos - PKG 安装程序似乎签名正确,但仍然在 Catalina 上显示“身份不明的开发人员”
- android - 安卓 | 原生崩溃 | 信号 7 (SIGBUS),代码 1 (BUS_ADRALN)
- visual-studio-code - VS Code 和 Metals:运行“构建导入”以启用代码导航
- python - 是否有将两个标题行连接为一个的功能?
- google-apps-script - Google 表格脚本:如何仅在名称包含特定文本的表格上运行脚本?
- javascript - Vuejs / NuxtJs 包含来自动态设置目录的组件