首页 > 解决方案 > 根据其他列值估算值

问题描述

有以下格式的数据框(df):

Name,   Col-1,  Col-2, Col-3, Col-4
abc,    0,      1,      0,      0
cba,    1,      0,      0,      0
bns     1,      0,      0,      0
abd     0       0,      0,      1

现在我正在尝试向此数据框添加新列,如下所示:

Name,   Col-1,  Col-2, Col-3, Col-4,    Type
abc,    0,      1,      0,      0,      Col-2
cba,    1,      0,      0,      0,      Col-1
bns     1,      0,      0,      0,      Col-1
abd     0       0,      0,      1,      Col-4

请建议如何完成它,我在下面尝试但抛出错误。

df['Type'] = [lambda x: x if x == 1 for x in df.columns]

标签: pandas

解决方案


您可以使用idxmax

In [11]: df
Out[11]:
  Name  Col-1  Col-2  Col-3  Col-4
0  abc      0      1      0      0
1  cba      1      0      0      0
2  bns      1      0      0      0
3  abd      0      0      0      1

In [12]: df.iloc[:, 1:]
Out[12]:
   Col-1  Col-2  Col-3  Col-4
0      0      1      0      0
1      1      0      0      0
2      1      0      0      0
3      0      0      0      1

In [13]: df.iloc[:, 1:].idxmax(axis=1)
Out[13]:
0    Col-2
1    Col-1
2    Col-1
3    Col-4
dtype: object

In [14]: df["Type"] = df.iloc[:, 1:].idxmax(axis=1)

In [15]: df
Out[15]:
  Name  Col-1  Col-2  Col-3  Col-4   Type
0  abc      0      1      0      0  Col-2
1  cba      1      0      0      0  Col-1
2  bns      1      0      0      0  Col-1
3  abd      0      0      0      1  Col-4

推荐阅读