首页 > 解决方案 > 基于四分位数的计算(任何百分位数)

问题描述

例如

summary(mtcars$mpg)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  10.40   15.43   19.20   20.09   22.80   33.90 

我需要根据变量“mpg”计算每个四分位数的“disp”变量的平均值和标准差。

标签: rdplyrplyr

解决方案


breaksquantile'mpg' 中指定,将其用作'disp'的和的cut分组变量summarisemeansd

library(dplyr)
mtcars %>%
     group_by(mpg_grp = cut(mpg, breaks = c(-Inf, quantile(mpg), Inf))) %>% 
     summarise(disp_mean = mean(disp), disp_sd = sd(disp))

推荐阅读