首页 > 解决方案 > 如何去掉引号之间的文字?

问题描述

这是我的数据:

x <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'

如何删除"bbb""dddd""dddd"

所以我可以得到:

"aaaaa","ccccc","abcd"

谢谢!

标签: rtext

解决方案


我们可以使用gsub匹配双引号 ( ") 后跟一个或多个不是双引号 ( [^"]+) 的字符后跟双引号 ( ") 和,如果存在并替换为空白 ( "")的模式

gsub('"[^"]+",?', "", txt)
[1] "aaaaa,ccccc,abcd"

如果我们需要保持,中间

gsub('"[^"]+"', "", txt)
[1] "aaaaa,,ccccc,,abcd"

数据

txt <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'

推荐阅读