首页 > 解决方案 > 使用R从以表达式结尾的句子中提取所有单词

问题描述

假设我有下一个字符串:

“palavras a serem encontradas fazer-se encontrar-se, enganar-se”

如何提取单词“fazer-se”“encontrar-se”“enganar-se”

我正在尝试使用 stringr 之类的

library(stringr)    
sentence <- "palavras a serem encontradas fazer-se encontrar-se, enganar-se"
str_extract_all(sentence, "se$")

我想要这个输出:

[1] "fazer-se" "encontrar-se" "enganar-se"

标签: rregex

解决方案


我们可以指定单词的边界\\b(所以使用ie 一个或多个非空白字符$se\\S+

library(stringr)
str_extract_all(sentence, "\\S+se\\b")[[1]]
#[1] "fazer-se"     "encontrar-se" "enganar-se"  

推荐阅读