首页 > 解决方案 > 使用 dbplyr 设置种子

问题描述

为了从数据库表中采样,我经常使用该模式

library(dplyr)

tbl(con, 'tableName') %>%
  mutate(z = random()) %>%
  compute() %>%
  arrange(z) %>%
  filter(row_number() < numSamples) %>%
  collect()

有没有办法设置种子以便可以复制样本?

标签: rdplyrdbplyr

解决方案


推荐阅读