首页 > 解决方案 > 部分匹配时忽略特殊土耳其语字符

问题描述

假设我们有一个“AMID DIMAD YUZBASIOGLU”字符串。我想要做的是使用 grep 函数匹配可能的字符串,例如“AMID YÜZBAŞIOĞLU”、“AMID YÜZBAŞIOĞLU”、“AMID DİMAD YÜZBAŞIOĞLU”和“AMID DIMAD YUZBASIOGLU”。

标签: r

解决方案


我们可以使用iconv(your_string, to='ASCII//TRANSLIT')将特殊字符转换为 'ASCII' 然后使用grep

> x <- "AMID DIMAD YUZBASIOGLU" 
> string <- c("AMİD YÜZBAŞIOĞLU","AMID YÜZBAŞIOĞLU","AMID DİMAD YÜZBAŞIOĞLU")
> y <- iconv(string, to='ASCII//TRANSLIT')
> grep(x, y)
[1] 3

推荐阅读