r - 部分匹配时忽略特殊土耳其语字符
问题描述
假设我们有一个“AMID DIMAD YUZBASIOGLU”字符串。我想要做的是使用 grep 函数匹配可能的字符串,例如“AMID YÜZBAŞIOĞLU”、“AMID YÜZBAŞIOĞLU”、“AMID DİMAD YÜZBAŞIOĞLU”和“AMID DIMAD YUZBASIOGLU”。
解决方案
我们可以使用iconv(your_string, to='ASCII//TRANSLIT')
将特殊字符转换为 'ASCII' 然后使用grep
> x <- "AMID DIMAD YUZBASIOGLU"
> string <- c("AMİD YÜZBAŞIOĞLU","AMID YÜZBAŞIOĞLU","AMID DİMAD YÜZBAŞIOĞLU")
> y <- iconv(string, to='ASCII//TRANSLIT')
> grep(x, y)
[1] 3
推荐阅读
- react-native - 添加新组件时 React Native 组件松散排列
- java - Spring:在 Unittest 中回滚事务
- excel - 将 A 列与 B 列和 B 列与 A 列进行比较,并分别复制整行缺失和添加到新工作表
- python - 如果我的函数有两个嵌套的 for 循环,它会以二次时间运行吗?
- flutter - 颤振检查器 devtools 详细信息选项卡 D 是什么意思?
- c++ - C/C++:注释“/*< */”代表什么?
- python - ModuleNotFoundError:没有名为“psutil”的模块
- c# - 使用实体框架存储库模式克隆动态对象
- android - 较低 android 版本上的 CardView 设计问题
- firebase - 是否可以通过 cloud_firestore 使用偏移量和限制?