python - 从数据框中删除多列
问题描述
我有以下代码片段
{数据集:https ://www.internationalgenome.org/data-portal/sample }
genome_data = pd.read_csv('../genome')
genome_data_columns = genome_data.columns
genPredict = genome_data[genome_data_columns[genome_data_columns != 'Geuvadis']]
这会删除 Geuvadis 列,有没有办法可以包含多个列?
解决方案
你可以不读它们吗?
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
read_csv 中的 'usecols' 选项可让您指定要包含在 DataFrame 中的数据列。
Venkatesh-PrasadRanganath 是如何删除多列的正确答案。
但是,如果您想避免将不打算使用的数据读入内存,则基因组数据 = pd.read_csv('../genome', usecols=["only", "required", "columns"] 是语法使用。
推荐阅读
- ruby-on-rails - 使用 docker for rails 运行 db 迁移时出错
- javascript - 如何从更新处理程序 javascript 代码中查询
- outlook - VSTO Outlook mailItem Application_ItemSend 以从 Active Directory 的收件人中捕获一个contactItem
- android - UI 阻塞循环行为不同(Oreo vs Mashmallow)
- pandas - 使用 pandas 过滤 .csv 格式的文件
- python - 我收到一个错误,发生内存错误,(例如分段错误、超出内存限制、堆栈溢出等)
- ios - Swift 4 中的外部 IP 地址
- php - Laravel - 文件输入数组更新
- linux - cv2 imdecode 使用 base64 字符串返回 none
- xcode - 在 Xcode 中,构建运行成功,但应用安装失败