r - 如何清理 R 或 Excel 中的地址数据?
问题描述
我有一个包含不必要信息的地址列表。我想删除第一个,
和第二个之间的字符串,,
包括逗号。例如:527 TEST RD, APT 22, EDINBURG, TX
我想做527 TEST RD, EDINBURG, TX
我怎样才能实现它?
解决方案
在 base R 中,您可以使用sub
来提取两个捕获组中所需的数据。第一个是第一个逗号之前的所有内容,第二个是在第二个逗号之后提取的所有内容。
x <- "527 TEST RD, APT 22, EDINBURG, TX"
sub("(.*?,).*?,(.*)", "\\1\\2", x)
#[1] "527 TEST RD, EDINBURG, TX"
推荐阅读
- mongodb - 如何访问mongodb中的二级数组(带组)
- python - 如何使用 AES 加密字符串并在 Python 中使用 Python 中的服务器和客户端对其进行解密
- c - 为什么在打印数组元素时出现异常行为
- python - 在 PySpark 中为 KeyVal RDD 中的每个键收集前 N 个条目
- html - Visual Studio Code:如何删除 html 标签并同时写入多行?
- php - 视图中未定义的变量
- raspberry-pi - 如何使用 python 3 控制树莓派的音量?
- html - `overflow-wrap: break-word` 和 `word-break: break-word` 的行为是否有所不同?
- javascript - 如何使元素始终位于结束标签上
- google-chrome - Windows Docker 容器中的 Chrome 安装失败:非零代码 3221225781