首页 > 解决方案 > 在熊猫的外连接上删除重叠行

问题描述

我想合并两个数据框并丢弃索引(id)上的重叠行

dfA

id     group       size
001     B           S
002     C           S
003     A           XL

dfB
id     group       size
004     A           M
001     B           S

我的尝试:

outer_join = pd.merge(dfA, dfB, on='id', how='outer')
outer_join.loc[~dfA.id.isin(outer_join.id)]

我的预期输出:

id     group       size
001     B           S
002     C           S
003     A           XL
004     A           M

标签: pythonpandas

解决方案


尝试

newdf = pd.concat([dfA, dfB]).groupby('id').head(1)

推荐阅读