首页 > 解决方案 > R Count 和 CountDistinct 列表的元素

问题描述

我面临一个小问题:我使用了 Tweeter API,我得到了类似的东西:

id <- c(1:4)
val <- c(100,150,170,200)
tex <- c("[#price", "#quant]","[#good]","[#good] [#price]")
db <- data.frame(id,val,tex)

我想以最简单的方式计算主题标签的总数以及唯一主题标签的数量,因为我需要将所有内容放入反应式数据库中,以便通过 Shiny 创建仪表板。

谢谢你的帮助。

标签: rshinycountdistinctreactive

解决方案


Base-R这将获得所有唯一的主题标签,您可以使用它length( )来获取计数

unique(unlist(regmatches(db$tex, gregexpr("#\\w+", db$tex))))

[1] "#price" "#quant" "#good" 

编辑:如果你喜欢没有#

unique(unlist(regmatches(db$tex, gregexpr("#\\K\\w+", db$tex,perl=T))))
[1] "price" "quant" "good" 

推荐阅读