首页 > 解决方案 > 为 Pandas 广播操作指定索引

问题描述

我有一个 Pandas 数据框,我想对其应用条件,并在另一个数据框上使用生成的索引。举个简单的例子:

a = pd.DataFrame(np.array([[1, 1, 2], [1, 2, 2], [2, 2, 1]]), columns=['a', 'b', 'c'])

   a  b  c
0  1  1  2
1  1  2  2
2  2  2  1

b = pd.Series([111, 222, 333], index=['a', 'b', 'c'])

a    111
b    222
c    333

在此示例中,我想创建第三个数组,其尺寸与“a”相同,值为 1(或 True),其中 a == 2:

     a    b    c
0    0    0  333
1    0  222  333
2  111  222    0

我的问题是,我怎样才能执行这样的操作并指定一个轴?我怀疑解决方案是以某种方式使用 pd.where,尽管我不想保留任何原始值。

标签: pythonpandasbroadcasting

解决方案


IIUC

a.eq(2).mul(b,axis=1)
Out[803]: 
     a    b    c
0    0    0  333
1    0  222  333
2  111  222    0

正如你提到的pd.where

a.mask(a==1,0).mask(a==2,b,axis=1)
Out[834]: 
     a    b    c
0    0    0  333
1    0  222  333
2  111  222    0

推荐阅读