r - 计算一列的重复观察值但另一列的值不同的平均值
问题描述
我有这个包含大约 35'000 个观察值的数据框。问题是大约有 5'000 次出现(如图像的前两行和最后两行所示),因此我有两个与相同 COD_DOM 相关但具有不同 RENDIMENTO 值的观察结果。我想要的是计算出现两次的所有 COD_DOM 的平均 RENDIMENTO,因此只保留一个带有平均值的观察值。
解决方案
如果您的 data.frame 只是这两列,您应该可以使用:
library(dplyr)
new_df <- data.frame %>%
group_by(COD_DOM) %>%
summarize(RENDIMENTO=mean(RENDIMENTO))
推荐阅读
- javascript - 如何在Javascript中的其他函数中使用参数返回一个函数
- python - 从 .py 文件生成 .exe 后,从 dist 文件夹运行 .exe 文件时发生以下错误
- python - 在 python 中使用 Clibs 随机分配内存
- c# - 用于 if 语句的 Visual Studio C# 延迟函数
- bash - 打印 IFS 字符
- redis - 谷歌云运行 redis 客户端失去与实例的连接
- vue.js - 切换语言时 Nuxt i18n 无法正确翻译
- angular - 在 Angular 编辑器中使用时,HTML 代码在 kolkov/angular-editor 中不起作用
- windows-10 - 无法安装作曲家。任何建议将不胜感激
- python - Unexpected line in the seaborn bar plot