r - 没有“主表”的模糊匹配
问题描述
是否可以在没有所需结果表的情况下执行某种类型的模糊匹配?
例如,标准化这些行:
Lord Philip Harris
Lord Harris of Peckham
Lord Philip C. Harris
Philip Lord C Harris
Lord Phillip Harris of Peckham
进入第一个值,最后一个值或类似'Philip Harris'的东西 - 哪个并不重要。
我已经使用 R 中的 stringdist 包将一列附加到包含与测试的最小距离的值的数据框中,但要做到这一点,我有一个“正确”数据列表。
谢谢
解决方案
推荐阅读
- mysql - 如何创建具有两个连接到同一个查找表的查询
- django - TypeError: 无法获取,我得到的错误,我使用 reactjs 作为前端和 django 作为后端
- python - 将清理后的 BS4 数据写入 csv 文件
- firebase - Firebase数据库规则阻止任何写入但只允许删除?
- karate - 我如何添加这个数组的所有值
- c++ - 将最大可能值设置为变量 C++
- php - 如何使用 PHP 连接两个数组?
- javascript - 从另一个端口调用托管在一个端口上的 localhost API 时出现 CORS 问题
- java - 有没有办法以动态方式映射具有相同表名的多个数据库?
- typescript - 所有返回类型与函数列表的交集类型