r - R - 数据框列中的字符串比较
问题描述
我有一个包含以下列的数据框:
描述 |
---|
波音有限公司 |
波音有限公司 |
波音公司 |
空中客车有限公司 |
空客 |
我想将列值相互比较以创建另一列具有如下标准化描述:
描述 | 新描述 |
---|---|
波音有限公司 | 波音公司 |
波音有限公司 | 波音公司 |
波音公司 | 波音公司 |
空中客车有限公司 | 空客 |
空客 | 空客 |
我想知道如何应用RecordLinkage::levenshteinSim
函数,它将每个列值与其他列值进行比较以找到相似度得分,然后使用该相似度得分在新列中创建标准化描述。
请帮助我实现这个逻辑。
解决方案
推荐阅读
- java - 如何在 Java 中使用 BufferedWriter 从 PostgreSQL 导出到 CSV 文件
- python - 在 Pymongo 中查询纠结的数组
- c - 我的程序没有打印我最后一行代码的函数结果
- docker - 如何从 Docker Linux 连接到 localhost 上的 Sql Server
- woocommerce - 用户更新 Wordpress 客户元数据的正确签名是什么
- java - 如何结合 2 个后端(PHP Laravel 和 Spring)
- pyinstaller - 安装后,在树莓派中找不到 pyinstaller 命令。为什么?
- angular - 在 Angular 包中读取 ENV 变量
- angularjs - 从AngularJS中的指令调用keyPress上的控制器范围函数
- ruby - 如何找出我的项目中的哪些源文件正在使用特定的 gem?