r - 如何根据 R 中的条件对数据进行部分切片?
问题描述
我有一个数据集,我想删除 60% 对应于特定类的数据。所以,我可以做这样的事情:
dataset %>% filter(Outcome=="diabetes") %>% slice(-seq(0.4 * n()))
但是,这第一个过滤器仅针对我要从中删除条目的数据集部分,然后对其进行切片。不过,我希望我的最终结果是原始数据集,除了 60% 的删除数据匹配Outcome=="diabetes"
. 我怎样才能在 R 中实现这一点?
解决方案
您可以sample_frac
这样做:每组获得 60%:
mtcars %>%
filter(cyl == 4) %>%
sample_frac(0.6)
mpg cyl disp hp drat wt qsec vs am gear carb
1 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
2 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
3 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
4 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
5 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
6 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
7 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
你为什么接受它?我认为这不是你想要的?我留下了我原来的答案,但我认为你想要这个:
result <- mtcars %>%
group_by(cyl) %>%
sample_frac(ifelse(cyl == 4, 0.6, 1))
# A tibble: 15 x 11
# Groups: cyl [3]
mpg cyl disp hp drat wt qsec vs am gear carb
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 32.4 4 78.7 66 4.08 2.2 19.5 1 1 4 1
2 27.3 4 79 66 4.08 1.94 18.9 1 1 4 1
3 21.5 4 120. 97 3.7 2.46 20.0 1 0 3 1
4 22.8 4 108 93 3.85 2.32 18.6 1 1 4 1
5 24.4 4 147. 62 3.69 3.19 20 1 0 4 2
6 22.8 4 141. 95 3.92 3.15 22.9 1 0 4 2
7 26 4 120. 91 4.43 2.14 16.7 0 1 5 2
8 21.4 4 121 109 4.11 2.78 18.6 1 1 4 2
9 30.4 4 95.1 113 3.77 1.51 16.9 1 1 5 2
10 30.4 4 75.7 52 4.93 1.62 18.5 1 1 4 2
11 33.9 4 71.1 65 4.22 1.84 19.9 1 1 4 1
12 17.8 6 168. 123 3.92 3.44 18.9 1 0 4 4
13 15 8 301 335 3.54 3.57 14.6 0 1 5 8
14 14.7 8 440 230 3.23 5.34 17.4 0 0 3 4
15 18.7 8 360 175 3.15 3.44 17.0 0 0 3 2
推荐阅读
- sql - 你能在不使用任何'with'子句的情况下编写单个查询吗
- python - Python:在二叉搜索树中寻找共同祖先的递归
- java - 如何将数组列表从内部类传递给另一个已经启动的类?
- html - 图像未在容器中缩放
- tizen - bt_adapter_le_start_scan() 在 tizen 可穿戴本机应用程序中也扫描 BLE 设备以外的设备
- ruby-on-rails - Rails 使用时间对象查询,不返回特定于日期的对象
- javascript - 如何在没有 ID 或类的情况下访问 html 元素标签?
- javascript - 刷新页面后保持下拉值被选中
- c++ - 如何通过迭代器访问向量中的嵌套对?
- python - 使用 ASP .NET MVC 在文件 .py 中调用外部 python 函数