首页 > 解决方案 > 在嵌套 tibbles 的 tibble 中(在 list-columns 内),如何更新 tibbles 以重命名具有通用名称的列?

问题描述

使用purrr,我将iris数据汇总到一个新的变异列表列中:

library(tidyverse)

my_tibble <-
  iris %>%
  nest(data = everything()) %>%
  mutate(summary_tbl = map(.x = data,
                           ~ .x %>%
                             group_by(Species) %>%
                             summarise(mean_by_cat = mean(Sepal.Length))))

my_tibble
#> # A tibble: 1 x 2
#>   data               summary_tbl     
#>   <list>             <list>          
#> 1 <tibble [150 x 5]> <tibble [3 x 2]>

reprex 包于 2021-03-16 创建(v0.3.0)

如果我们取消嵌套data或者summary_tbl我们可以看到两者都包含一个 tibble,并且有一些重叠的列名(在这种情况下Species):

my_tibble %>%
  pull(data)

## [[1]]
## # A tibble: 150 x 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ... with 140 more rows

my_tibble %>%
  pull(summary_tbl)

## [[1]]
## # A tibble: 3 x 2
##   Species    mean_by_cat
## * <fct>            <dbl>
## 1 setosa            5.01
## 2 versicolor        5.94
## 3 virginica         6.59

有没有一种有效的方法来重命名出现在任何列表列中的列名my_tibble?例如,如果我们定义:

var_to_rename <- "Species"
new_name <- "my_grouping_var"

然后提供my_tibble,var_to_renamenew_name, 我们如何以编程方式获得以下内容?

my_tibble %>%
  pull(data)

## [[1]]
## # A tibble: 150 x 5
##    Sepal.Length Sepal.Width Petal.Length Petal.Width my_grouping_var
##           <dbl>       <dbl>        <dbl>       <dbl> <fct>  
##  1          5.1         3.5          1.4         0.2 setosa 
##  2          4.9         3            1.4         0.2 setosa 
##  3          4.7         3.2          1.3         0.2 setosa 
##  4          4.6         3.1          1.5         0.2 setosa 
##  5          5           3.6          1.4         0.2 setosa 
##  6          5.4         3.9          1.7         0.4 setosa 
##  7          4.6         3.4          1.4         0.3 setosa 
##  8          5           3.4          1.5         0.2 setosa 
##  9          4.4         2.9          1.4         0.2 setosa 
## 10          4.9         3.1          1.5         0.1 setosa 
## # ... with 140 more rows

my_tibble %>%
  pull(summary_tbl)

## [[1]]
## # A tibble: 3 x 2
##   my_grouping_var  mean_by_cat
## * <fct>            <dbl>
## 1 setosa            5.01
## 2 versicolor        5.94
## 3 virginica         6.59

显然,我可以在该部分之前重命名Species为,但我的问题旨在事后重命名现有的小标题。my_grouping_varmutate

标签: rdplyrrenamepurrr

解决方案


如果你想使用一个函数,你可以使用rename()花括号运算符 ( {{}}) 和冒号等号运算符 ( :=):

foo = function(var_to_rename, new_name){
  my_tibble %>% 
    mutate(summary_tbl = map(summary_tbl, ~{
      rename(.x, {{new_name}}:={{var_to_rename}})
    }))
}
my_tibble2=foo("Species", "my_grouping_var")

my_tibble2 %>%
  pull(summary_tbl)
#> [[1]]
#> # A tibble: 3 x 2
#>   my_grouping_var mean_by_cat
#>   <fct>                 <dbl>
#> 1 setosa                 5.01
#> 2 versicolor             5.94
#> 3 virginica              6.59

reprex 包(v1.0.0)于 2021-03-16 创建

有关如何在https://dplyr.tidyverse.org/articles/programming.htmldplyr上的函数中使用 tidy-evaluation 的更多信息。


推荐阅读