首页 > 解决方案 > 为python中的字符串比较选择最大Jaro-Winkler相似度

问题描述

我对使用 python 有点陌生。这是EmploymentName我想与 dataframe 中的数据进行比较的字符串TData

import  textdistance
import  pandas as PD

EmployerName="MIDWEST UNDERGROUND SUPPLY"
TData[['EmployerName','EmploymentStatus']]

    EmployerName                                        EmploymentStatus
0   ups                                                 No Longer Employed
1   midwest underground supply llc                      Inactive
2   us department of veterans affairs-office of fi...   Inactive
3   us department of homeland security                  Inactive
4   towne park, ltd.                                    Separated

我想使用textdistance.jaro_winkler比较字符串 EmployerName 和 EmployerNameTData并选择最高分和就业状态。

 textdistance.jaro_winkler(EmployerName,TData['EmployerName'][0])
0.41452991452991456

我觉得我应该做一个循环,但我不知道怎么做。

谢谢,

标签: pythonstring

解决方案


推荐阅读