r - 在 dplyr 中使用增量变量名称时出错
问题描述
运行代码时出现以下错误:“错误:列col
未知”。
for (col in names(test)) {
final <- test %>%
group_by(col, "DT") %>%
summarise(n = n())
}
测试数据集如下所示:
col 应该是 transactionId,然后是 Product,每次我用 DT 创建频率表:transactionId DT, Product DT
谢谢
解决方案
通常,最好以长格式获取数据,以避免使用for
循环。我们可以使用count
which 是group_by
+的快捷方式summarise
library(dplyr)
test %>%
mutate_all(as.character) %>%
tidyr::pivot_longer(cols = -DT) %>%
count(DT, value)
推荐阅读
- javascript - 在 IndexedDb 中将数据输入数据库时出错
- .net - 禁用 SSL 验证以在 IronPython 中发布数据
- java - 同步,wait/notifyAll 必须在同一个对象上,但是为什么呢?
- git - 如何为多个 IDE 正确存储 Git 文件?
- arrays - '[String]' 类型的值没有成员 'joinWithSeparator'
- php - 如何修复服务器无法访问 jquery 发送的 $_POST 数据
- php - 如何使用php更改mysqli中字段值的位置?
- r - 将列表列表的元素提取到日期框架中?
- bash - BitBucket Pipelines 不会执行整个 shell 脚本,即使它在直接在服务器上执行时也可以工作
- python - Pipenv install Locking Failed!没有名为 'json' 的模块