首页 > 解决方案 > R's `statsr rep_sample_n` - “有替换的样本”......但是“替换”什么时候发生?

问题描述

R包statsr提供的功能rep_sample_n描述为:

rep_sample_n(tbl, size, replace = FALSE, reps = 1)

值:tbl_df聚合所有创建的样本的 A,并添加了一个也按其分组的replicatetbl_df

所以你可以写像

> trial <- rep_sample_n(cars, size = 5, reps = 15, replace = TRUE) 
> show(trial)

# A tibble: 75 x 3
# Groups:   replicate [15]
   replicate speed  dist
 *     <int> <dbl> <dbl>
 1         1    20    56
 2         1    11    17
 3         1    19    36
 4         1    15    20
 5         1    12    20
 6         2    24   120
 7         2    14    36
 8         2    20    48
 9         2    23    54
10         2    16    40
# … with 65 more rows

但如何replace工作?

replace: 有或没有更换的样品?

什么时候rep_sample_n将要采样的观察“替换”回采样袋?随机抽取观察后立即,还是仅在抽取size观察后?

标签: r

解决方案


这很容易根据经验进行测试:

library(statsr)

df <- data.frame(ID = letters[1:3], Value = 1:3)

rep_sample_n(df, size = 4, reps = 3, replace = TRUE) 
#> # A tibble: 12 x 3
#> # Groups:   replicate [3]
#>    replicate ID    Value
#>  *     <int> <fct> <int>
#>  1         1 a         1
#>  2         1 b         2
#>  3         1 a         1
#>  4         1 c         3
#>  5         2 a         1
#>  6         2 a         1
#>  7         2 a         1
#>  8         2 c         3
#>  9         3 a         1
#> 10         3 a         1
#> 11         3 b         2
#> 12         3 a         1

您可以看到您的问题的答案是“立即替换”。

reprex 包(v0.3.0)于 2020-02-21 创建


推荐阅读