r - 来自 R 数据集的随机行样本
问题描述
假设我有一个数据集,(90,000 x 17)
即在(n x p)
哪里n
,number of observations
并且我想从我的整个数据集中随机抽取行样本,这如何在 R 中完成?p
number of variables
20%
抽取随机样本后,我将进行相应的聚类分析。
我曾尝试使用其他问题来回答我的问题,但它们没有定论,因为它没有给我我需要的东西。
解决方案
你可以用sample_frac
from来做dplyr
,这里是一个使用数据库 iris 的例子
library(dplyr)
#data(iris)
sample20 <- iris %>% sample_frac(0.2)
推荐阅读
- ios - 快速设置暗模式属性
- python - 如何使用 celery-beat 启动任务?
- jenkins - csv 文件的 Groovy JDBC eachrow 标头
- javascript - 在反应/材料 ui 中更改 TextField 颜色
- unit-testing - 在下面的 2 个存储库的 hadoop 中进行单元测试哪个更好?
- c++ - STL算法处理前N个符合条件的元素
- reactjs - 使用 React 中的 reducer 使用动态构造的对象更新状态
- php - 如何从 jquery 获取 mysql 数据库中的多个字段条目,从 php 获取 html 字段
- android - 如何在 xml 中为此 FAB 提供相等的空格?
- c++ - % 在变量旁边的代码中是什么意思?