首页 > 解决方案 > 删除R中字符和空行之间的单词

问题描述

我有一个数据框,其中有一列充满单元格,如下所示:

"***ORDER LIST***\nCustomer: Lucille\nitem1: apples\nitem2: oranges"
"***ORDER LIST***\nCustomer: Frank and Sally\nitem1: wine\nitem2: milk"
"***ORDER LIST***\n\n\nitem1: wine\nitem2: milk"

我正在尝试清理每个单元格,删除以 Customer 开头的整行,或者如果它不存在,则删除第一个空行。

我想最终得到这样的净化文本数据:

"***ORDER LIST***\nitem1: apples\nitem2: oranges"
"***ORDER LIST***\nitem1: wine\nitem2: milk"
"***ORDER LIST***\nitem1: wine\nitem2: milk"

使用gsub有没有办法摆脱空行和包含客户的整行?

谢谢

标签: rtidyversegsub

解决方案


这对你有用吗?

gsub("(.*\\*).*?(\nitem.*)", "\\1\\2", text)
[1] "***ORDER LIST***\nitem1: apples\nitem2: oranges" "***ORDER LIST***\nitem1: wine\nitem2: milk"     
[3] "***ORDER LIST***\nitem1: wine\nitem2: milk"

推荐阅读