首页 > 解决方案 > 是否有一个 R 函数可以使具有细微差异的字符串值统一?

问题描述

请提前原谅我,因为我对使用 R 很陌生。我有一个字符串变量,其中包含许多组织名称,这些名称由许多不同的人手动输入以进行数千次观察。因此,组织名称存在许多拼写错误和变体。例如,一些观察结果如下所示:

机构名称 我希望细胞是什么
芝加哥艾滋病基金会 芝加哥艾滋病基金会
芝加哥艾滋病基金会 芝加哥艾滋病基金会
住房中心 住房和健康中心
住房与健康中心 住房和健康中心
艾滋病基金会 芝加哥艾滋病基金会
住房和健康中心 住房和健康中心
住房与健康中心 (FHP) 住房和健康中心
芝加哥艾滋病基金会 芝加哥艾滋病基金会
芝加哥艾滋病基金会 芝加哥艾滋病基金会

有没有办法可以使用 R 替换第一列,使其看起来像第二列?我会告诉你我尝试了什么,但坦率地说,我不确定从哪里开始。谢谢您的帮助!

标签: rstringdata-cleaning

解决方案


推荐阅读