首页 > 解决方案 > 结合两个熊猫数据框而不包含重复项?

问题描述

我有两个数据框,我想在不创建重复行的情况下合并它们,两个数据框的列标签保持不变,并date设置为两者的索引。

df1

date                 A   B        C
2020-02-21 16:00:00  10  32.0000  23   
2020-02-21 15:59:00  23  11.2100  10   
2020-02-21 15:58:00  82  38.2350  18   

df2

date                 A   B        C
2020-02-21 15:59:00  23  11.2100  10   
2020-02-21 15:58:00  82  38.2350  18   
2020-02-21 15:57:00  32  22.2900  76 

这是期望的结果:

date                 A   B        C
2020-02-21 16:00:00  10  32.0000  23   
2020-02-21 15:59:00  23  11.2100  10   
2020-02-21 15:58:00  82  38.2350  18   
2020-02-21 15:57:00  32  22.2900  76 

我应该怎么做(用熊猫)?

标签: pythonpandasdataframe

解决方案


我不确定是否有更优雅的解决方案,但您可以先将数据帧与重复项连接起来,然后再删除它们。

output = pd.concat([df1, df2]).drop_duplicates()

pd.concat:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html

drop_duplicates:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html


推荐阅读