首页 > 解决方案 > 从数据框中删除多列

问题描述

我有以下代码片段

{数据集:https ://www.internationalgenome.org/data-portal/sample }

genome_data = pd.read_csv('../genome')
genome_data_columns = genome_data.columns

genPredict = genome_data[genome_data_columns[genome_data_columns != 'Geuvadis']]

这会删除 Geuvadis 列,有没有办法可以包含多个列?

标签: pythonpandasdataframe

解决方案


你可以不读它们吗?

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

read_csv 中的 'usecols' 选项可让您指定要包含在 DataFrame 中的数据列。

Venkatesh-PrasadRanganath 是如何删除多列的正确答案。

但是,如果您想避免将不打算使用的数据读入内存,则基因组数据 = pd.read_csv('../genome', usecols=["only", "required", "columns"] 是语法使用。


推荐阅读