首页 > 解决方案 > 如何在 10 次交叉验证中取数据集的倒排索引?

问题描述

我在 db 中有一个包含行列表的数据集,我想用平衡数据进行十次交叉验证。所以我使用了这个功能:

cvIndex <- createFolds(factor(df$BS), folds, returnTrain = T)

它返回十个平衡折叠的索引进行训练。

for i in n seq_along(cvIndex)) { trainIndex <- cvIndex[[i]] testIndex <- ???

我想为 testIndex 提供除用于培训之外的缺失索引。

标签: rcross-validationfold

解决方案


我建议使用“caret”库中的 trainControl 函数来实现 k 折交叉验证。例如,使用以下命令,您可以将 10-fold corss-validation 设置为训练和测试方法。

控制 <- trainControl(method="cv", number=10)


推荐阅读