首页 > 解决方案 > RDA 和超参数随机搜索的过度拟合结果?

问题描述

我正在尝试使用正则化判别分析而不是传统的线性判别分析,因为我的数据显示异方差性和不相等的组大小。为了找到允许更高成功率的最佳 lambda 和 gamma 值,我使用了该caret软件包。然而,一位同事表示,这样做意味着由于过度拟合,成功率可能会被人为夸大。据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?

这是我的数据和代码的示例:

set.seed(1337)
        cv_5_rand <- trainControl(method = "cv", number = 5, search = "random")
        
        fit.rda <- train(groups ~ ., data = data, method = "rda",
        trControl = cv_5_rand, tuneLength = 500)                
        Hp <- as.data.table(fit.rda$results)
        Hp <- Hp %>% arrange (desc(Accuracy))

据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?

标签: rr-carethyperparametersrdalinear-discriminant

解决方案


推荐阅读