首页 > 解决方案 > R中可发音的名称或单词

问题描述

我有一个大型数据库,其中包含两个对该问题有用的字段。ben_id(受益人 ID)和 ben_name(受益人姓名)。我的任务是分析这个大型数据库的不一致/异常/其他违规行为。

命中和试验表明数据中存在这些记录(很明显,id 在这里是说明性的)。

ben_id      ben_name
1           asdfg
2           zxcvb
3           ZXCV
4           ZXCVB
5           zzzzz
6           Fffdd

我的问题是找出所有这样的情况,由于给定名称的发音能力低,名称可能性太低。它可能表示存在错误条目、错误等。

R 中是否有任何外部包,我可以将每个 ben_name 的可发音分数放在另一列中。

我知道我的问题有点尴尬,但如果可以,请提供帮助。

标签: rnlppackage

解决方案


推荐阅读