r - R检查多个变量中的异常值
问题描述
我需要检查异常值的数据,并且我有 67 个不同的变量。所以我不想手动做。这是我手动检查的代码(我要检查三个因素 - voiceID、性别和 VP)。但我不知道我应该如何将其更改为遍历列的循环。
features %>%
group_by(voiceID, gender, VP) %>%
identify_outliers(meanF0)
这些值都是数字。输出应该告诉我哪些因素的哪些行是异常值。感谢帮助
解决方案
的输出identify_outliers
是tibble
具有多列的,一次可以采用一个变量。变量名可以加引号或不加引号。在这种情况下,我们可以group_split
通过分组变量获取数据,然后遍历感兴趣的列,并应用identify_outliers
library(dplyr)
library(purrr)
library(rstatix)
nm1 <- c("score", "score2")
demo.data %>%
group_split(gender) %>%
map(~ map(nm1, function(x) .x %>%
identify_outliers(x)))
如果我们想计算异常值,
features %>%
group_by(voiceID, gender, VP) %>%
summarise(across(everything(), ~ length(boxplot(., plot = FALSE)$out)))
推荐阅读
- javascript - 日期格式在 redux devtools 中表现得很奇怪
- prometheus - 在普罗米修斯上如何根据特定标签提取指标
- sql - 如果 id 与数组不匹配,则 SQL 删除
- python - Quadpy中具有非常数限制的双积分?
- apache-kafka - 最佳实践中的 ksqlDB 查询
- windows - Window 10 Home 上的 Docker Desktop 3.2.2 崩溃并出现错误“连接期间出现错误:此错误可能表明 docker 守护程序未运行”
- java - 在具有 void 返回类型的目标方法上围绕 Spring AOP 跳过代码执行
- c# - providerName="MSSQL" 发布时更改为 providerName="SQLite"
- python - 如何找出我在运行时需要哪些包/依赖项,以及我只能在 Docker 多阶段的构建阶段使用哪些包/依赖项
- c++ - 右值引用和用户定义的转换