r - 我可以使用 Sample.split 函数在基于某些字段进行过滤时拆分数据吗?
问题描述
我正在使用 caTools 包中的 R 中的 sample.split 函数将我的数据拆分为训练和测试数据以进行交叉验证。但是,我需要以测试数据为目标的方式拆分我的数据。这是飞行风险模型的一部分,我需要我的测试数据针对某些等级和位置,而不仅仅是数据的随机拆分,只保留留下和离开之间的比率。
spl <- sample.split(data$Voluntary, 3/4)
训练 <- 数据[spl,]
测试 <- 数据[!spl,]
这段代码将我的数据分成 75% 的训练和 25% 的测试。但我希望测试只包括 data$grade = "G4"、"G5" 和 "G6" 以及 data$location = "Houston"。有没有办法将它构建到我的代码中?
解决方案
推荐阅读
- ibm-cloud - 日志没有进入 logDNA 控制台
- html - 使用 XSLT 将 HTML 转换为 XML 以使用 SSIS 进行处理
- ios - SwiftUI 中自定义 UIViewRepresentable UITextView 的框架高度问题
- .net-core-3.1 - FileConfigurationProvider FileNotFoundException
- excel - 如何以最有效的方式引用范围?
- linux - 一个奇怪的 ssh 文件从 .ssh 目录中出现,名称为 pbcopyfy
- python - Django-根据ModelAdmin中选择的过滤器显示列(list_display)
- c - 使用 C 中的客户端服务器 TCP/IP 套接字使用信号更新棋盘
- angular - 如何使用 ng-deep 处理动态数据
- javascript - 启用 SVG 溢出