首页 > 解决方案 > 合并熊猫df中的特定值

问题描述

我目前正在合并第一个和最后string一个row. 当它们strings位于特定值的右侧时,它们将被合并。我希望将其更改为低于特定值。

import pandas as pd

d = ({
    'A' : ['X','Foo','','X','Big'],           
    'B' : ['No','','','No',''],
    'C' : ['Merge','Bar','','Merge','Cat'],
    })

df = pd.DataFrame(data = d)

m = df.A == 'X'

def f(x):
    s = x[x!= '']
    x[s.index[1]] = x[s.index[1]] + ' ' + x[s.index[-1]]
    x[s.index[-1]] = ''
    return x

df = df.astype(str).mask(m, df[m].apply(f, axis=1))

string此代码在后跟时合并第一个和最后一个X

输出:

     A         B    C
0    X  No Merge     
1  Foo            Bar
2                    
3    X  No Merge     
4  Big            Cat

我希望将其更改为rows低于该值X

预期输出:

         A   B      C
0        X  No  Merge
1  Foo Bar           
2                    
3        X  No  Merge
4  Big Cat

标签: pythonpandasmerge

解决方案


解决方案非常相似,只有布尔掩码被移动,第一个 NaN 被替换为False,并且索引 from[1]也被更改[0]为 seelct 第一个值(列A):

m = (df.A == 'X').shift().fillna(False)

def f(x):
    s = x[x!= '']
    x[s.index[0]] = x[s.index[0]] + ' ' + x[s.index[-1]]
    x[s.index[-1]] = ''
    return x

df = df.astype(str).mask(m, df[m].apply(f, axis=1))
print (df)
         A   B      C
0        X  No  Merge
1  Foo Bar           
2                    
3        X  No  Merge
4  Big Cat        

推荐阅读