首页 > 解决方案 > 列没有被删除

问题描述

为什么列 A 没有在训练、有效、测试数据帧中丢失?

import pandas as pd 

train = pd.DataFrame({'A': [0, 1, 2, 3, 4],'B': [5, 6, 7, 8, 9],'C': ['a', 'b', 'c', 'd', 'e']})
test  = pd.DataFrame({'A': [0, 1, 2, 3, 4],'B': [5, 6, 7, 8, 9],'C': ['a', 'b', 'c', 'd', 'e']})
valid = pd.DataFrame({'A': [0, 1, 2, 3, 4],'B': [5, 6, 7, 8, 9],'C': ['a', 'b', 'c', 'd', 'e']})

for df in [train,valid,test]:
    df = df.drop(['A'],axis=1)

print('A' in train.columns)
print('A' in test.columns)
print('A' in valid.columns)
#True
#True
#True

标签: pythonpandas

解决方案


您可以使用inplace=True参数,因为DataFrame.drop函数也可以inplace

for df in [train,valid,test]:
    df.drop(['A'],axis=1, inplace=True)

print('A' in train.columns)
False
print('A' in test.columns)
False
print('A' in valid.columns)
False

未删除列的原因df是未分配回,因此 DataFrames 未更改。


另一个想法是创建 DataFrame 列表并将每个更改的 DataFrame 分配回去:

L = [train,valid,test]
for i in range(len(L)):
    L[i] = L[i].drop(['A'],axis=1)

print (L)
[   B  C
0  5  a
1  6  b
2  7  c
3  8  d
4  9  e,    B  C
0  5  a
1  6  b
2  7  c
3  8  d
4  9  e,    B  C
0  5  a
1  6  b
2  7  c
3  8  d
4  9  e]

推荐阅读