首页 > 解决方案 > 我可以在没有 for 循环的情况下将函数应用于 Pandas 数据框中的多个列吗?

问题描述

有没有办法在没有循环的情况下将函数应用于 Pandas 数据框中的多个列?例如,给出这个数据框:

df = pd.DataFrame({'id': [1,2,3,4,5,6,7,8,9,10],
                   'val1': [2,2,np.nan,np.nan,4,1,np.nan,np.nan,np.nan,2],
                   'val2': [7,0.2,5,8,np.nan,1,0,np.nan,1,1],
                  })
display(df)

在此处输入图像描述

如果我想同时对val1val2列进行操作,我可以执行以下操作。是否有一个单行来替换 for 循环?

f = lambda x: 'ERR' if x < 5 else x
cols = ['val1', 'val2']
for c in cols:
    df[c] = df[c].apply(f) 
display(df)

在此处输入图像描述

标签: pythonpandaslambdaapply

解决方案


applymap

df.assign(**df[cols].applymap(f))

   id val1 val2
0   1  ERR  7.0
1   2  ERR  ERR
2   3  NaN  5.0
3   4  NaN  8.0
4   5  ERR  NaN
5   6  ERR  ERR
6   7  NaN  ERR
7   8  NaN  NaN
8   9  NaN  ERR
9  10  ERR  ERR

mask

df.assign(**df[cols].mask(df[cols] < 5, 'ERR'))

   id val1 val2
0   1  ERR  7.0
1   2  ERR  ERR
2   3  NaN  5.0
3   4  NaN  8.0
4   5  ERR  NaN
5   6  ERR  ERR
6   7  NaN  ERR
7   8  NaN  NaN
8   9  NaN  ERR
9  10  ERR  ERR

推荐阅读