首页 > 解决方案 > 在R中按行计算2个值之间的NA数

问题描述

我的数据看起来像这样:

db <- as.data.frame(matrix(ncol=10, nrow=3, 
                           c(3,NA,NA,4,5,NA,7,NA,NA,NA,NA,NA,7,NA,8,9,NA,NA,4,6,NA,NA,7,8,11,5,10,NA,NA,NA), byrow = TRUE))

db
  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1  3 NA NA  4  5 NA  7 NA NA  NA
2 NA NA  7 NA  8  9 NA NA  4   6
3 NA NA  7  8 11  5 10 NA NA  NA

对于每一行,我试图按 row 计算出现在第一个和最后一个非 NA 元素(我有数字和字符)之间的 NA数量

输出应该是这样的:

db$na.tot <- c(3, 3, 0)
db
  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 na.tot
1  3 NA NA  4  5 NA  7 NA NA  NA      3
2 NA NA  7 NA  8  9 NA NA  4   6      3
3 NA NA  7  8 11  5 10 NA NA  NA      0

其中na.tot表示按行观察到的第一个和最后一个非 NA 元素之间的 NA 数量(分别在第 1、2 和 3 行中的 3 和 7、7 和 6 以及 7 和 10 之间)。

有没有人有一个简单的解决方案?

谢谢!

标签: rcountrowna

解决方案


试试这个:

require(data.table)
z<-as.data.table(which(!is.na(db),arr.ind=TRUE))
setkey(z,row,col)
z[,list(NAs=last(col)-first(col)-.N+1),by=row]
#   row NAs
#1:   1   3
#2:   2   3
#3:   3   0

推荐阅读