首页 > 解决方案 > 循环熊猫数据框的每一行

问题描述

我有一个大数据框,如果满足某个条件,我想将同一行的值除以彼此,并为每个条件创建一个新列。

我尝试了各种循环,但我得到的错误是一个系列的真值是模棱两可的。我认为我接近解决方案,但我无法弄清楚最快的方法。

df = pd.DataFrame({'colA': np.random.randn(20), 'colB': np.random.randn(20), 'colC': np.random.randn(20)})
print(df)
x = 0
y = 0.5
for ix, r in df.iterrows():
    if (r['colA'] > x) & (r['colA'] < y):    
        df.loc[ix,str(y)] = df.loc[ix,'colA']/df.loc[ix,'colB']
        x += 0.5
        y += 0.5

这就是我现在的进展。有问题的是,在满足条件的每一行之后,x 和 y 都会增加。但是我需要对满足条件的所有行进行除法,然后增加 x 和 y。

标签: pythonpandasdataframe

解决方案


如果要将除法应用于满足条件的所有行,则不应使用 iterrows。这是您的初始代码的固定版本:

while x <= df['colA'].max():
    sub = df.loc[(df['colA'] > x)&(df['colA'] < y)]  # filter the dataframe on both conditions
    df.loc[sub.index, str(y)] = df['colA']/df['colB']
    x += .5
    y += .5

推荐阅读