首页 > 解决方案 > R-Missing Data Analysis-extracat::visna 绘制的情节解读

问题描述

我只是在extracat包中使用了visna()函数来可视化丢失的数据,但我不知道蓝色单元格是什么意思?以及如何解读右侧的条形图?

df <- data.frame(replicate(25,sample(0:1,1000,rep=TRUE)))
df2 <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))
# visualise the number of missings in cases using visna from extracat
extracat::visna(df2)

缺失数据图

标签: rmissing-data

解决方案


蓝色单元格代表缺失值。

对于您的数据框,这意味着:变量 x1 在您的 data.frame 末尾具有所有缺失值。对于变量 X25,缺失值分布在整个数据帧中

下面的红色条是此变量的缺失值数量。我认为右侧的条形字符是相应数据箱的完整行数。

对于漂亮的缺失数据可视化,还可以查看 naniar 包。(https://cran.r-project.org/web/packages/naniar/vignettes/getting-started-w-naniar.html


推荐阅读