r - 提取唯一的列组合并在 R 中查找总和和计数
问题描述
我有一个包含 4 列的航班数据库,如下所示。
原来的:
我想要一个输出,它根据 3 列(始发地/目的地/航空公司)的唯一组合给出行,将每个唯一组合的乘客数量相加,并计算每个唯一组合的行数。结果将是这样的。
输出:
我可以使用该group_by
功能完成其中的一部分
df %>% group_by(Origin, destination, carrier) %>% summarise(count = n())
如何包括人口总和?
解决方案
我们可以用dplyr
library(dplyr)
df1 %>%
group_by(Origin, Destination, Airline) %>%
dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups: Origin, Destination [2]
# Origin Destination Airline count TotalPassengers
# <chr> <chr> <chr> <int> <dbl>
#1 ABE ATL 9A 2 3
#2 ABE ATL DL 1 5
#3 NYC SFA AA 3 21
#4 NYC SFA DL 1 5
数据
df1 <- data.frame(Origin = rep(c("ABE", "NYC"), c(3, 4)),
Destination = rep(c("ATL", "SFA"), c(3, 4)),
Airline = c("9A", "9A", "DL", "AA", "AA", "AA", "DL"),
Passengers = c(2, 1, 5, 4, 10, 7, 5))
推荐阅读
- javascript - jQuery删除多个样式
- python - 查找最接近输入的行值
- node.js - 如何使用 Google App Engine node.js 运行时设置 Datadog?
- ubuntu - Vagrant SSH 没有这样的文件或目录
- java - Android 在应用程序中查看 pdf 风景,无需从 url 下载
- javascript - 如何在 es6 中使用箭头函数而不是 bind 方法
- three.js - 从给定的 3d 点数组中绘制管子
- webpack - 在 Webpack 配置规则中使用 require.resolve 的目的是什么?
- google-drive-api - Google 云端硬盘分析 - 谁下载了什么
- ios - 不使用最新的 Xcode 版本开发 ios App 可以吗?