首页 > 解决方案 > 获取单列变量 Rstudio 的随机替代项

问题描述

我有一个 Excel 文件,其中 1 列包含 500 个单词。我想创建 100 组,每组 5 个随机单词存在于该列中,没有任何重复。所以每个单词都应该只出现一次。在 Rstudio 中,我设法获得了一个样本 (sample_n(df, 5)) 但这只会产生一个输出。

我怎样才能使这项工作适用于 100 个组?

x <- as.data.frame(c("Apple", "Banana", "Pear", "Orange", "Melon", "Mango"))
sample_n(x, 2)

输出只给了我 1 组 2 种水果,但我想要 3 组不同的 2 种水果。

亲切的问候

标签: rgroupingsample

解决方案


通过创建数据框,这是一种可能的方法。每组为一排。

library(tidyverse)

x <- data.frame(var = c("Apple", "Banana", "Pear", "Orange", "Melon", "Mango")) %>%
  pull(var) %>%
  sample() %>% 
  matrix(ncol = 2) %>%
  data.frame()


#     X1     X2
#1  Pear  Mango
#2 Apple Orange
#3 Melon Banana

对于您的项目,您可以将ncol参数设置为 5。


推荐阅读