python - 如何为 2 个 excel 数据框创建 SequenceMatcher 循环
问题描述
Hej 我目前有来自 2 个不同 excel 文件的 2 个数据帧
- a=df_Web_Customer
- b=df_Batchlog
例子
dfa = pd.DataFrame([[Casper May 16 2020], [Kasper Apr 1 2014], [Jonas Jan 15 2016]], columns=['Name'])
dfb = pd.DataFrame([[Casper May 16 2020], [Jonas Apr 1 2014], [Jona Jan 5 2016]], columns=['Name'])
我有一个可以相互比较 2 个输入的函数:SequenceMatcher
我如何一次从 Dataframe a 中取出一个单元格并将其与 Dataframe b 中的每个单元格匹配?
我的最终目标是开发一个 if 语句对最大匹配进行排序,但我无法在堆栈上找到任何类似的案例,所以我希望可以提供任何帮助:)
编码:
from difflib import SequenceMatcher
import pandas as pd
#import zip
#Load Web customer to Data frame
data_web_customer = pd.read_excel (r'NewWeb_customer.xlsx')
df_Web_Customer = pd.DataFrame(data_web_customer, columns= ['Name'])
#Load Batchlog to Data frame
data_Batchlog = pd.read_excel (r'BatchlogTestName.xlsx')
df_Batchlog = pd.DataFrame(data_Batchlog, columns= ['Name'])
a=df_Web_Customer
b=df_Batchlog
#LOOP the SIMILAR FUNCTION through each cell??
def similar(a, b):
return SequenceMatcher(None, a, b).ratio()
解决方案
推荐阅读
- awk - FS 中的插入符号 (^) (gawk)
- python - 将两个项目中的公共文件提取到第三个项目中,保留目录结构
- r - 在闪亮的服务器功能中应用自己的 R 功能
- c# - Firefox 上缺少 ASP.NET 身份 cookie
- html - 注销按钮不清除本地存储
- java - 一个具有多个客户端(应用程序)的 Websocket 服务器
- database - 插入日期时出错(因为数据值不符合完整性约束_NM0002_。)
- c# - 尝试连接到 mySql 时“尝试以禁止的方式访问套接字”
- javascript - 是否可以在 Typescript 中迭代类型值并基于它们生成新类型?
- ssl - CN1 模拟器上的 SSL 握手问题