r - 根据不同的变量在 R 中求和
问题描述
我有如下所示的数据集:
match_id batting_team ball over total_runs
1 Team_X 1 1 2
1 Team_X 2 1 0
1 Team_X 3 1 1
1 Team_X 4 1 0
1 Team_X 5 1 2
1 Team_X 6 1 2
1 Team_X 1 2 2
1 Team_X 2 2 0
1 Team_X 3 2 1
1 Team_X 4 2 0
1 Team_X 5 2 2
1 Team_X 6 2 2
然后数据继续显示每支球队在每个球中的跑动。我想添加一个列,显示每场比赛每支球队每轮每轮的得分。目的是继续绘制一个线性回归模型,以显示与比赛中的比赛次数相比,比赛中的跑步次数。有人有建议吗?
解决方案
dplyr
您可以使用包为每支球队的每场比赛在每场比赛中获得所需的运行输出。对于回归,我建议您在经过验证的堆栈中发布消息。
library(dplyr)
df %>% group_by(matchid, bat_team, over) %>% summarise(over_run = sum(runs))
数据
df <- data.frame(matchid = rep(1:2, 20), bat_team = rep(c("A", "B"), each = 20),
ball = rep(1:6, length.out = 40), over = rep(1:4, each = 10), runs = sample(1:6, 40, replace = T))
推荐阅读
- c# - 局部视图中的 Dotnetcore mvc 动态绑定
- html - Tailwind CSS 表格标题不尊重 text-right
- vuetify.js - Vuetify 面包屑文本颜色
- flutter - Dart中的Function first class和void函数有什么区别
- javascript - 如何仅在第一次单击时调用函数?
- google-chrome - Chrome 书签:通过手动将参数添加到浏览器栏来创建 URL
- python - Django:在模型清理方法中处理 FileField,而不是在保存后
- terraform - terraform - 在字符串列表上创建实例
- python-3.x - Pytorch 文本分类中的属性错误
- python - PyTorch Forecasting 中 TimeSeriesDataSet 类的 group_ids 参数具体有什么作用?