python - 如何在略有不同的键上合并两个熊猫数据框
问题描述
institution
我想根据两个数据帧中不同写入的键合并两个数据集。数据框如下所示:
df1 = pd.DataFrame({'institution':['Havard University', 'Oxford University', 'University of Kent', 'Harvard University']})
df2 = pd.DataFrame({'institution':['Havard University', 'University of Oxford', 'Kent University'], 'ranking': ['very good', 'very good', 'good']})
我怎样才能做到这一点?
解决方案
你可以使用模糊合并。
您可以在下面的链接中检查不同类型的方法。 模糊熊猫, 不同类型的字符串相似度算法
import fuzzy_pandas as fpd
merged_df=fpd.fuzzy_merge(df1, df2, left_on=['name'],right_on=['name'],method='jaro', ignore_case=True,threshold=0.9)
推荐阅读
- c++ - 桥接 vulkan 结构
- algorithm - 递归算法的辅助空间和空间复杂度是否相同?
- java - 如何在一个 Jaxb2Marshaller 中处理更多 WSDL?
- php - 是否值得缓存 WordPress 特定的查询?
- c# - 当我调用 Async 方法时,我应该使用什么返回类型来指示成功?
- javascript - antdesign 滑块第二个标签未显示
- laravel - 在 Laravel 5.6 中重置密码链接
- javascript - 拖放上传 - 从输入中删除对象
- c# - 找到 BarcodeScanner 但无法连接 Windows.Devices.PointOfService
- android - 来自 Activity 的命令 ViewPager 按钮 OnClick