r - 在R中按行获取重复连续值的摘要
问题描述
我试图在 R 中按行获取重复值的一些统计信息(最小值、最大值、平均值)。
我的数据框看起来类似于:
b <- as.data.frame(matrix(ncol=7, nrow=3,
c(3,NA,NA,4,5,NA,7,6,NA,7,NA,8,9,NA,NA,4,6,NA,NA,7,NA), byrow = TRUE))
对于每一行,我想添加一列,其中包含最小值、最大值和平均值。包含连续 NA 的列,它应该是这样的
V1 V2 V3 V4 V5 V6 V7 max min mean
1 3 NA NA 4 5 NA 7 2 1 1.5
2 6 NA 7 NA 8 9 NA 1 1 1.0
3 NA 4 6 NA NA 7 NA 2 1 1.33
这只是我的数据集的一个小例子,它有 2000 行和 48 列。
有人有这方面的代码吗?
解决方案
您可以apply
遍历行并获取非 NA 列的“运行”。一旦你有了它,你可以简单地获取这些的摘要统计信息:
b[,c("mean", "max", "min")] <- do.call(rbind, apply(b, 1, function(x){
res <- rle(!is.na(x))
res2 <- res[["lengths"]][res[["values"]]]
data.frame(mean = mean(res2), max = max(res2), min = min(res2))
}
))
b
# V1 V2 V3 V4 V5 V6 V7 mean max min
#1 3 NA NA 4 5 NA 7 1.333333 2 1
#2 6 NA 7 NA 8 9 NA 1.333333 2 1
#3 NA 4 6 NA NA 7 NA 1.500000 2 1
推荐阅读
- electron - 有托盘时可以最小化窗口吗?
- azure-iot-central - 如何在 IoT Central Application V3 中更新/编辑 IoT Central 云属性?
- reactjs - 为什么这段代码不调用 componentDidUpdate() ?
- java - 在 Jooq 中,如何让“delete”语句返回被删除的记录?
- python - 将列转换为多索引
- javascript - 按顺序异步推送到数组
- javascript - 自动格式化输入字段中输入的 10 位电话号码
- javascript - 如何在我的 react-leaflet 组件中设置状态
- c++ - 使用 C++ 的 UVA Judge Online 的运行时错误(问题 10050)
- c# - C# 温度转换器显示不正确的摄氏温度结果