r - R:如何使用 rpart 中的子集选项?
问题描述
从 的文档中help(rpart)
,有一个subset
选项,它是一个“可选表达式,表示应仅在拟合中使用数据行的子集”。
我究竟该如何使用这个选项?
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
data = kyphosis,
subset = sample(1:nrow(kyphosis), 20))
在上面的代码中,我从kyphosis
数据中随机抽取了 20 个行索引。这是正确的用法吗?
解决方案
是的,这没关系。使用subset
,您还可以:
- 明确选择您的行
data.frame
:subset=1:21
- 根据变量值选择行:
subset=(Age<50)
推荐阅读
- c - 如何在 C 中实例化 VLC GUI 并从文件描述符中读取?
- apache-spark - spark docker-image-tool 找不到 docker 镜像
- mongodb - MongoDB 从 HDFS 读取
- javascript - 使用 d3.js 树图动态更新两个数据集
- android - 如何在 fusedlocationproviderclient.oncompletelistener() 中添加进度条?
- c++ - 使用 Opencv c++ 从视频文件中保存 10 秒的视频
- php - 如何使用 form_validation->set_rules() 在 Codeigniter 中创建 is_unique 验证,这将在更新时起作用?
- php - 在 PHP 中用动态内容填充数组
- android - 从外部服务器或 API 加载数据时,如何消除活动之间出现的黑屏?
- database - 如何在 Hive Flutter 中获取索引的值?