r - 如何去掉引号之间的文字?
问题描述
这是我的数据:
x <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'
如何删除"bbb"
:"dddd"
和"dddd"
所以我可以得到:
"aaaaa","ccccc","abcd"
谢谢!
解决方案
我们可以使用gsub
匹配双引号 ( "
) 后跟一个或多个不是双引号 ( [^"]+
) 的字符后跟双引号 ( "
) 和,
如果存在并替换为空白 ( ""
)的模式
gsub('"[^"]+",?', "", txt)
[1] "aaaaa,ccccc,abcd"
如果我们需要保持,
中间
gsub('"[^"]+"', "", txt)
[1] "aaaaa,,ccccc,,abcd"
数据
txt <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'