r - R Count 和 CountDistinct 列表的元素
问题描述
我面临一个小问题:我使用了 Tweeter API,我得到了类似的东西:
id <- c(1:4)
val <- c(100,150,170,200)
tex <- c("[#price", "#quant]","[#good]","[#good] [#price]")
db <- data.frame(id,val,tex)
我想以最简单的方式计算主题标签的总数以及唯一主题标签的数量,因为我需要将所有内容放入反应式数据库中,以便通过 Shiny 创建仪表板。
谢谢你的帮助。
解决方案
在Base-R
这将获得所有唯一的主题标签,您可以使用它length( )
来获取计数
unique(unlist(regmatches(db$tex, gregexpr("#\\w+", db$tex))))
[1] "#price" "#quant" "#good"
编辑:如果你喜欢没有#
unique(unlist(regmatches(db$tex, gregexpr("#\\K\\w+", db$tex,perl=T))))
[1] "price" "quant" "good"
推荐阅读
- node.js - TypeScript:在 req.files 上使用(req as any)我可以使用其他类型吗
- r - 使用 fst 压缩序列化列表是否有任何不利/风险?
- php - 如何在PHP中显示登录用户的删除和编辑按钮
- swiftui - 观察更改 @FocusState 变量未按预期工作
- javascript - 如果其他条件不适用于 JS 中的字符串比较
- c# - C# 如何使用 System.Text.Json 反序列化 Json 数据
- lightningchart - 去除 headmapgrid 系列中的重叠
- java - 我想从 recyclerview 以及我的本地存储设备中删除它
- node.js - 查看器响应函数中的 Lambda@edge 访问请求标头
- javascript - 无法在字符串“namangarg802@gmail.com”上创建属性“_canInitEmulator”