r - 如何在 10 次交叉验证中取数据集的倒排索引?
问题描述
我在 db 中有一个包含行列表的数据集,我想用平衡数据进行十次交叉验证。所以我使用了这个功能:
cvIndex <- createFolds(factor(df$BS), folds, returnTrain = T)
它返回十个平衡折叠的索引进行训练。
for i in n seq_along(cvIndex)) {
trainIndex <- cvIndex[[i]]
testIndex <- ???
我想为 testIndex 提供除用于培训之外的缺失索引。
解决方案
我建议使用“caret”库中的 trainControl 函数来实现 k 折交叉验证。例如,使用以下命令,您可以将 10-fold corss-validation 设置为训练和测试方法。
控制 <- trainControl(method="cv", number=10)
推荐阅读
- sql - 选择数据行作为输出标题
- python - Selenium send_keys 不发送撇号
- javascript - 如何处理nodejs中的EventEmitter内存泄漏?
- python - 如何从一个 DOCX 文件中逐页编写单独的 DOCX 文件?
- linux - 使用 kinit + chromedriver 进行硒测试
- python - 如何在 Python 中将数据写入文件(文件已创建但没有数据)
- node.js - 遍历 react getinitialProps 中的字符串数组并将其传递给 React 中的 await 函数
- python - 我怎样才能让 Spacy 停止将连字符的数字和单词分成单独的标记?
- c# - C# On(任何)窗口关闭事件保存窗口标题
- sql - 查询 SQL 服务器组中的单个服务器