r - 汇总可变数量的列
问题描述
我有一个包含三列 id、x 和 y 的 spark 数据框(在 R 和 sparklyr 的上下文中)。如果我想按列总结,我可以用
df <- df %>% group_by(id) %>% summarize(x=sum(x),y=sum(y))
现在假设我现在收到一个列数可变的数据框。除了 id 之外,所有其他列都是双精度的,我需要像以前一样总结它们。当然我可以得到列名,迭代总结每一个并加入结果,但它看起来很难看。有没有简单的方法来做到这一点?
解决方案
你可以试试dplyr::summarise_all
。将summarise_all
在所有列上应用所需的功能,除了已在group_by
.
library(dplyr)
df %>% group_by(id) %>% summarise_all(sum)
推荐阅读
- python - 当字符串中可能没有匹配项时,如何使用正则表达式的“findall()”函数来填充字典?
- javascript - 从观察变量中获取数据
- react-native - 反应原生 Admob 无法正常工作
- c# - View 没有在回发时返回整个模型
- javascript - 视频仅播放音频
- vue.js - 如何使用 caddy 和 vuejs 设置反向代理
- azure - 找不到 Data Lake Store Gen2
- node.js - 如何在 NodeJS 中使用另一个 API 结果发出 API 请求?
- javascript - 单击按钮后清除文件上传字段
- python - 在 pyspark 中写入 parquet 时删除分区列