首页 > 解决方案 > 如何对数据字符串中的唯一值进行字符串计数

问题描述

我试图找到具有5 个独特元音的常用词(即:“aeiuo”,没有一个词,也没有重复)

我试过这个:

library(tidyverse)
x<-c("appropriate","associate","available","colleague","experience","encourage","encouragi","associetu")
x[str_count(x,"[aeiuo]")>4]

请注意,单词(“encouragi”“associetu”)用于验证我的预期答案

我生成的结果如下:

[3] "available"   "colleague"  
[5] "experience"  "encourage"  
[7] "encouragi"   "associetu"

虽然我只想得到: "encouragi" "associetu"满足具有 5 个不同元音的标准(即:“aeiuo”)。

有什么函数可以作为string_count_unique吗?如果是,是哪一个?如果没有,您会推荐我使用什么其他功能来满足设定的标准?

预先感谢您的帮助!

标签: rtidyverse

解决方案


一种选择可能是:

x[lengths(lapply(str_extract_all(x, "a|e|i|u|o"), unique)) == 5]

[1] "encouragi" "associetu"

推荐阅读