首页 > 解决方案 > 将均值和 sd 的数据帧组合成一个数据帧,其中 sd 在均值后的括号中

问题描述

我想创建一个数据框,其中包含几个不同的列,其中包含均值,之后 sd 显示在括号中。举个例子:

df <- iris

mean <- aggregate(df[,1:4], list(iris$Species), mean)
sd <- aggregate(df[,1:4], list(iris$Species), sd)

view(mean)
     Group.1 Sepal.Length Sepal.Width Petal.Length Petal.Width
1     setosa        5.006       3.428        1.462       0.246
2 versicolor        5.936       2.770        4.260       1.326
3  virginica        6.588       2.974        5.552       2.026

view(sd)
     Group.1 Sepal.Length Sepal.Width Petal.Length Petal.Width
1     setosa    0.3524897   0.3790644    0.1736640   0.1053856
2 versicolor    0.5161711   0.3137983    0.4699110   0.1977527
3  virginica    0.6358796   0.3224966    0.5518947   0.2746501

现在我想要这样的东西:

    Group.1 Sepal.Length Sepal.Width Petal.Length Petal.Width
1     setosa    5.0 (0.35)   3.4 (0.38)   1.5 (0.17)  0.2 (0.11)
2 versicolor    5.9 (0.52)   2.8 (0.31)   4.3 (0.47)  1.3 (0.20)
3  virginica    6.6 (0.64)   3.0 (0.32)   5.6 (0.55)  2.0 (0.27)

我认为应该有一种使用该paste功能的方法,但我不知道如何。

标签: rmeanpastestandard-deviation

解决方案


我们可以将数据转换为直接matrix应用paste

 dfN <- mean
 dfN[-1] <- paste0(round(as.matrix(mean[-1]), 1), " (", 
              round(as.matrix(sd[-1]), 2), ")")

此外,这可以一步完成,而不是创建多个数据集

 library(dplyr)
 library(stringr)
 df %>%
   group_by(Species) %>% 
   summarise_all(list(~ str_c(round(mean(.), 2), " (", round(sd(.), 2), ")")))
# A tibble: 3 x 5
#  Species    Sepal.Length Sepal.Width Petal.Length Petal.Width
#  <fct>      <chr>        <chr>       <chr>        <chr>      
#1 setosa     5.01 (0.35)  3.43 (0.38) 1.46 (0.17)  0.25 (0.11)
#2 versicolor 5.94 (0.52)  2.77 (0.31) 4.26 (0.47)  1.33 (0.2) 
#3 virginica  6.59 (0.64)  2.97 (0.32) 5.55 (0.55)  2.03 (0.27)

推荐阅读