首页 > 解决方案 > 删除 r 中的特定缺失值

问题描述

我的数据集缺少标记为“XXX”的值

我试过 na.omit(mydata)

df <- data.frame(X=factor(c(0.2, "XXX", 0.4, 0.1)), Y=factor(c(0.8, 1, 0.9, "XXX")))

这里 X 和 Y 是因子。通过检查因子的水平,我发现丢失的数据被编码为“XXX”。

我想删除“2”行和“4”行。有人可以帮忙吗,我已经尝试了一段时间了。

标签: r

解决方案


您还可以过滤完整的案例,如下所示:

library(dplyr)
library(magrittr)
df %>% replace(.=="XXX", NA_character_) %>% filter(complete.cases(.))

输出是:

> df %>% replace(.=="XXX", NA_character_) %>% filter(complete.cases(.))
    X   Y
1 0.2 0.8  
2 0.4 0.9

推荐阅读