首页 > 解决方案 > 没有“主表”的模糊匹配

问题描述

是否可以在没有所需结果表的情况下执行某种类型的模糊匹配?

例如,标准化这些行:

Lord Philip Harris
Lord Harris of Peckham
Lord Philip C. Harris
Philip Lord C Harris
Lord Phillip Harris of Peckham

进入第一个值,最后一个值或类似'Philip Harris'的东西 - 哪个并不重要。

我已经使用 R 中的 stringdist 包将一列附加到包含与测试的最小距离的值的数据框中,但要做到这一点,我有一个“正确”数据列表。

谢谢

标签: rfuzzy-logicstringdist

解决方案


推荐阅读