r - 在R中按行计算2个值之间的NA数
问题描述
我的数据看起来像这样:
db <- as.data.frame(matrix(ncol=10, nrow=3,
c(3,NA,NA,4,5,NA,7,NA,NA,NA,NA,NA,7,NA,8,9,NA,NA,4,6,NA,NA,7,8,11,5,10,NA,NA,NA), byrow = TRUE))
db
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1 3 NA NA 4 5 NA 7 NA NA NA
2 NA NA 7 NA 8 9 NA NA 4 6
3 NA NA 7 8 11 5 10 NA NA NA
对于每一行,我试图按 row 计算出现在第一个和最后一个非 NA 元素(我有数字和字符)之间的 NA数量。
输出应该是这样的:
db$na.tot <- c(3, 3, 0)
db
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 na.tot
1 3 NA NA 4 5 NA 7 NA NA NA 3
2 NA NA 7 NA 8 9 NA NA 4 6 3
3 NA NA 7 8 11 5 10 NA NA NA 0
其中na.tot
表示按行观察到的第一个和最后一个非 NA 元素之间的 NA 数量(分别在第 1、2 和 3 行中的 3 和 7、7 和 6 以及 7 和 10 之间)。
有没有人有一个简单的解决方案?
谢谢!
解决方案
试试这个:
require(data.table)
z<-as.data.table(which(!is.na(db),arr.ind=TRUE))
setkey(z,row,col)
z[,list(NAs=last(col)-first(col)-.N+1),by=row]
# row NAs
#1: 1 3
#2: 2 3
#3: 3 0
推荐阅读
- mysql - AUTO_INCREMENT 不受控制的增加
- python - 考虑到数据库的灵活结构和查询,如何在 Django 中使用 mongodb?
- android - 下载模块时出现拆分错误安装
- java - 为什么我在三元运算符中得到 NullPointerException?
- fortran - 之后的意外垃圾?
- angular6 - Popin 在 IE11 中没有关闭
- batch-file - 使用双重延迟扩展在批处理文件中设置变量
- c# - 如何为 ASP NET BOILERPLATE Core 2.2 创建具有自己实体的模块
- xml - 如何将 .xml 文件转换为具有相同 XML 文件结构的 .trg 文件
- android - 生成签名 APK 时的 NullPointer