fuzzywuzzy - 如何在模糊匹配熊猫重复数据删除单个数据帧中获取行索引
问题描述
考虑到我有以下数据集df
指数 | 姓名 | 出生日期 |
---|---|---|
0 | 丹尼斯·摩尔 | 2017-11-18 |
1 | 罗伯特·奈特 | 2008-04-24 |
2 | 艾丽卡·马丁内斯 | 1940-10-28 |
3 | 加里·吉尔 | 1993-05-05 |
4 | 马修冈萨雷斯 | 2016-07-16 |
5 | 丹尼斯·摩尔 | 2017-11-18 |
6 | 罗伯特·克梅特 | 2008-04-24 |
我正在使用该pandas_dedupe
包通过执行以下命令来检查模糊匹配:
dup=pandas_dedupe.dedupe_dataframe(df,['Name','BirthDate'])
我希望得到以下输出:
指数 | 姓名 | 出生日期 | 匹配索引 | 匹配名称 | match_BirthDate |
---|---|---|---|---|---|
0 | 丹尼斯·摩尔 | 2017-11-18 | 5 | 丹尼斯·摩尔 | 2017-11-18 |
1 | 罗伯特·奈特 | 2008-04-24 | 6 | 罗伯特·克梅特 | 2008-04-24 |
2 | 艾丽卡·马丁内斯 | 1940-10-28 | 2 | 艾丽卡·马丁内斯 | 1940-10-28 |
3 | 加里·吉尔 | 1993-05-05 | 3 | 加里·吉尔 | 1993-05-05 |
4 | 马修冈萨雷斯 | 2016-07-16 | 4 | 马修冈萨雷斯 | 2016-07-16 |
5 | 丹尼斯·摩尔 | 2017-11-18 | 0 | 丹尼斯·摩尔 | 2017-11-18 |
6 | 罗伯特·克梅特 | 2008-04-24 | 1 | 罗伯特·奈特 | 2008-04-24 |
我怎样才能做到这一点?
解决方案
推荐阅读
- php - 如何使用 htaccess 将 url 重定向到动态子域?
- reactjs - 如何从当前组件重定向到另一个组件,并将道具传递给 React 中的重定向组件
- javascript - 如何将 JavaScript 数组添加到 localStorage 以进行临时数据存储?
- python - 查找行组和列组 pandas 的平均值
- postgresql - 表“图像”上的更新或删除违反了外键约束
- android - 仅在切换方向水平垂直时才调用 onRestoreInstanceState - 还有其他情况吗?
- ios - 在ios上启动应用程序时如何请求权限?
- graphviz - GraphViz 保持图形位置一致
- excel - VBA 打印活动工作表增量
- python - 使用请求下载时不显示 tqdm 进度条