首页 > 解决方案 > 如何在 Python 中加入两个数据框时避免重复条目?

问题描述

我有两个数据框wi,

Site_ID Town
1235    Fitzroy
2344    Glen Iris

另一个带有 site_id 和公司名称的。

Site_ID Business Name
1235    BAC
2344    RFG

我只想在像这样加入两个 df 时匹配记录。执行以下合并功能后,

merge_df_rf1 = pd.merge(df1.drop_duplicates(), df2, on='site_id' ,how='inner')

我得到这个输出。

Site_ID Business Name   Town
1235    BAC            Fitzroy
1235    BAC            Fitzroy
2354    RFG            Glen Iris
2354    RFG            Glen Iris

不知道我的加入声明哪里出错了。

对此的任何帮助将不胜感激。

预先感谢您的支持!

标签: python-3.xpandasdataframemerge

解决方案


只需尝试on仅指定:

>>> df1.merge(df2, on='Site_ID').drop_duplicates()
   Site_ID       Town Business Name
0     1235    Fitzroy           BAC
1     2344  Glen Iris           RFG
>>> 

推荐阅读