python - 为python中的字符串比较选择最大Jaro-Winkler相似度
问题描述
我对使用 python 有点陌生。这是EmploymentName
我想与 dataframe 中的数据进行比较的字符串TData
。
import textdistance
import pandas as PD
EmployerName="MIDWEST UNDERGROUND SUPPLY"
TData[['EmployerName','EmploymentStatus']]
EmployerName EmploymentStatus
0 ups No Longer Employed
1 midwest underground supply llc Inactive
2 us department of veterans affairs-office of fi... Inactive
3 us department of homeland security Inactive
4 towne park, ltd. Separated
我想使用textdistance.jaro_winkler
比较字符串 EmployerName 和 EmployerNameTData
并选择最高分和就业状态。
textdistance.jaro_winkler(EmployerName,TData['EmployerName'][0])
0.41452991452991456
我觉得我应该做一个循环,但我不知道怎么做。
谢谢,