首页 > 解决方案 > 使用 Tukey 的栅栏函数将行标记为异常值

问题描述

我有一个数据框,其列 G 指示组和连续变量 C。如何将每一行标记为异常值,例如,使用此处的函数定义的 Tukey 围栏函数:

isnt_out_tukey <- function(x, k = 1.5, na.rm = TRUE) {
  quar <- quantile(x, probs = c(0.25, 0.75), na.rm = na.rm)
  iqr <- diff(quar)

  (quar[1] - k * iqr <= x) & (x <= quar[2] + k * iqr)
}

最终,我想以 O 列结束,其中包含异常值的“是”和每个组的无异常值的“否”。

标签: r

解决方案


推荐阅读