首页 > 解决方案 > 熊猫读错列

问题描述

我有一个包含句子、长度、类别和 18 列的 csv 文件。我正在尝试过滤掉特定的列。

假设我有 x,y,a,b,c,d,e,f,g,h 作为最后 10 列。我正在尝试过滤掉长度、类别和最后八列。

当我单独为最后 8 列执行此操作时,

col_req = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
data = pd.read_csv('data.csv', names=col_req)

它运行良好。但当我尝试时,

col_req = ['length','category','a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
data = pd.read_csv('data.csv', names=col_req) 

输出是,

('g','h','x','y','a','b','c','d','e','f')

我不知道我哪里错了。

标签: pythonpython-3.xpandascsv

解决方案


你需要使用参数use_cols来做到这一点

 col_req = ['length','category','a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
 data = pd.read_csv('data.csv', use_cols=col_req) 

推荐阅读