首页 > 解决方案 > 如何在略有不同的键上合并两个熊猫数据框

问题描述

institution我想根据两个数据帧中不同写入的键合并两个数据集。数据框如下所示:

df1 = pd.DataFrame({'institution':['Havard University', 'Oxford University', 'University of Kent', 'Harvard University']})
df2 = pd.DataFrame({'institution':['Havard University', 'University of Oxford', 'Kent University'], 'ranking': ['very good', 'very good', 'good']})

我怎样才能做到这一点?

标签: pythonpandasmerge

解决方案


你可以使用模糊合并。

您可以在下面的链接中检查不同类型的方法。 模糊熊猫不同类型的字符串相似度算法

import fuzzy_pandas as fpd
merged_df=fpd.fuzzy_merge(df1, df2, left_on=['name'],right_on=['name'],method='jaro', ignore_case=True,threshold=0.9)


推荐阅读