首页 > 解决方案 > dplyr: summarise(first(...)) 返回列名

问题描述

我正在尝试使用汇总来获取每个组的第一个结果,但它会返回列标题:

get_table是从 Postgres 数据库获取数据表的自定义函数)

require(dplyr)
require(RPostgres)

tbl <- get_table(my_server, my_table) %>%
  select(column_a, column_b) %>%
  group_by(column_a) %>%
  summarize(first_b = first(column_b))

结果看起来像

a first_b
1 "column_b"
2 "column_b"
3 "column_b"

如果我在获得所需结果dplyr::collect()之前使用,summarize()但这确实会降低性能。有什么想法可以summarizecollect先使用吗?

标签: rdplyr

解决方案


推荐阅读