r - 从行中删除非英语字符串:R
问题描述
我有几个变量,其数据(行)包含英文字符串,后跟非英文翻译(印地语)。
例如 Carpenter(木匠的印地语)
有没有办法剥离行以仅包含英文部分?印地语导致应用功能出现问题,因此我希望将其删除。
解决方案
这是使用基本 R 的另一个选项iconv()
,它仅删除非拉丁脚本:
s <- 'Carpenter (बढ़ई)'
iconv(s, "latin1", "ASCII", sub="")
# [1] "Carpenter ()"
应用于数据框:
df <- data.frame(rbind('Carpenter (बढ़ई)',
'Cat (बिल्ली)'))
sapply(df,iconv, from="latin1", to="ASCII",sub="")
# [1,] "Carpenter ()"
# [2,] "Cat ()"
推荐阅读
- ios - 使 UIScrollView 适合内容
- javascript - Flutter:在本机(android | IOS)中执行 JavaScript 库,而不是在 webView 中
- batch-file - 批量多选菜单
- mysql - MySQL 表“pivot”而不创建表/视图:唯一列值作为标题
- lua - 尝试将字符串与数字进行比较 - 计算机技术
- javascript - 无法将组件呈现到页面
- c - 数组 - 位数
- javascript - 默认选择第一个单选按钮
- python - 使用`.loc`访问多索引数据框时如何保留列顺序?
- c# - 错误:UrlHelper.Link 不得返回 null