首页 > 解决方案 > 如何通过仅从数据框中选择某些行来创建多个箱线图

问题描述

我想做的是仅从我的原始数据框的某些值创建几个箱线图(全部显示在一个箱线图中)。

我的数据框如下所示: 在此处输入图像描述

所以现在我想让 R 可视化参数 ~ Station(参数都是绿色的变量,Station 是“站 id”)有没有办法告诉 R 我想要我的 x 轴上的所有参数用于BB0028,例如,这意味着我只在箱线图中考虑mean_areamean_area_exc、esd、feret、min 和 max的前 6 个值?看起来像这样: 在此处输入图像描述

我尝试以非常复杂的方式逐个添加单个箱线图,但我相信一定有更简单的方法。这是我尝试过的:

bb28 <- df[c(1:6),]

bb28area <- boxplot(bb28$mean_area ~ bb28$BBnr)
bb28area_exc <- boxplot(bb28$mean_area_exc ~ bb28$BBnr)
bb28esd <- boxplot(bb28$mean_esd ~ bb28$BBnr)
bb28feret <- boxplot(bb28$mean_feret ~ bb28$BBnr)
bb28min <- boxplot(bb28$mean_min ~ bb28$BBnr)
bb28max <- boxplot(bb28$mean_max ~ bb28$BBnr)

boxplot(bb28$mean_area ~ bb28$BBnr)
boxplot(bb28$mean_area_exc ~ bb28$BBnr, add=TRUE, at = 1:1+0.45)

它看起来也不是很好,因为在图中,x 轴没有调整到新的箱线图,然后被切断: 在此处输入图像描述

我希望你能用简单的正确代码帮助我得到我的情节。

谢谢!干杯,梅尔

标签: rboxplot

解决方案


也许multi.boxplot下面的功能是您正在寻找的。它仅使用基础 R。

数据。 首先,制作一个数据集,因为您没有向我们提供一个复制和粘贴友好格式的数据集。

set.seed(1234)

n <- 50
BBnr <- sort(sprintf("BB%04d", sample(28:30, n, TRUE)))
bb28 <- data.frame(col1 = 1:n, col2 = n:1, BBnr = BBnr)
tmp <- matrix(runif(3*n), ncol = 3)
colnames(tmp) <- paste("mean", c("this", "that", "other"), sep = "_")
bb28 <- cbind(bb28, tmp)
rm(BBnr, tmp)

代码。

multi.boxplot <- function(x, by, col=0, ...){
  x <- as.data.frame(x)
  uniq.by <- unique(by)
  len <- length(uniq.by) - 1
  n <- ncol(x)
  n1 <- n + 1
  col <- rep(col, n)[seq_len(n)]
  boxplot(x[[ 1 ]] ~ by, at = 0:len*n1 + 1,
          xlim = c(0, (len + 1)*n1), ylim = range(unlist(x)), xaxt = "n", col=col[1], ...)
  for(i in seq_len(n)[-1])
    boxplot(x[[i]] ~ by, at = 0:len*n1 + i, xaxt = "n", add = TRUE, col=col[i], ...)
  axis(1, at = 0:len*n1 + n1/2, labels = uniq.by, tick = TRUE)
}

inx <- grep("mean", names(bb28))
multi.boxplot(bb28[inx], by = bb28$BBnr, col = rainbow(length(inx)))

在此处输入图像描述


推荐阅读