首页 > 解决方案 > R - 数据框列中的字符串比较

问题描述

我有一个包含以下列的数据框:

描述
波音有限公司
波音有限公司
波音公司
空中客车有限公司
空客

我想将列值相互比较以创建另一列具有如下标准化描述:

描述 新描述
波音有限公司 波音公司
波音有限公司 波音公司
波音公司 波音公司
空中客车有限公司 空客
空客 空客

我想知道如何应用RecordLinkage::levenshteinSim函数,它将每个列值与其他列值进行比较以找到相似度得分,然后使用该相似度得分在新列中创建标准化描述。

请帮助我实现这个逻辑。

标签: r

解决方案


推荐阅读